perl怎么提取基因组所有基因的启动子序列
发表于:2025-02-16 作者:千家信息网编辑
千家信息网最后更新 2025年02月16日,这篇"perl怎么提取基因组所有基因的启动子序列"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来
千家信息网最后更新 2025年02月16日perl怎么提取基因组所有基因的启动子序列
这篇"perl怎么提取基因组所有基因的启动子序列"文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇"perl怎么提取基因组所有基因的启动子序列"文章吧。
脚本运行命令:
perl gene_promoter.pl -fa Donkey_Hic_genome.20180408.fa -gff Donkey_Hic_genome.20180408.gff3 -out gene_promoter.fa -n 2000
其中 -fa 后跟基因组染色体序列;-gff 后跟基因组gff文件;-n后跟数字,表示要提取基因上游多少bp的序列。
脚本代码:
#!/usr/bin/perl -wuse strict;use warnings;use Getopt::Long;use Data::Dumper;use Config::General;use Cwd qw(abs_path getcwd);use FindBin qw($Bin $Script);use File::Basename qw(basename dirname);use Bio::SeqIO;use Bio::Seq;my $version = "1.3";## prepare parameters ######################################################################### -------------------------------------------------------------------------------------------## GetOptionsmy %opts;GetOptions(\%opts, "gff=s","fa=s", "out=s", "n=s","h");if(!defined($opts{out}) || !defined($opts{gff}) || || !defined($opts{fa}) ||defined($opts{h})){print <<"Usage End.";Description:$version:lefse analysisUsageForced parameter:-gff gff filemust be given-out outdir must be given-n num -fa genome fasta file must be givenOther parameter:-h Help documentUsage End.exit;}$opts{n} ||= 2000;my $n = $opts{n};my $in = Bio::SeqIO->new(-file => "$opts{fa}" , -format => 'Fasta');my %fasta;while ( my $seq = $in->next_seq() ) {my($id,$sequence)=($seq->id,$seq->seq);$fasta{$id}=$sequence;}open(IN,"$opts{gff}") ||die "open file $opts{gff} faild.\n";open(OUT,">$opts{out}") ||die "open file $opts{out} faild.\n";while( ){next if(/^#/);my @line = split ("\t",$_);if($line[2] eq "gene"){$line[8] =~ /ID=([^;]*);/;my $name = $1;if($line[6] eq "+"){my $gene = substr( $fasta{$line[0]},$line[3]-$n-1, $n);print OUT ">$name\n$gene\n";}elsif($line[6] eq "-"){my $gene = substr( $fasta{$line[0]},$line[4], $n);$gene = &reverse_complement_IUPAC($gene);print OUT ">$name\n$gene\n";}}}close(OUT);close(IN);sub reverse_complement_IUPAC { my $dna = shift; # reverse the DNA sequence my $revcomp = reverse($dna); # complement the reversed DNA sequence $revcomp =~ tr/ABCDGHMNRSTUVWXYabcdghmnrstuvwxy/TVGHCDKNYSAABWXRtvghcdknysaabwxr/; return $revcomp;}sub reverse_complement { my $dna = shift; # reverse the DNA sequence my $revcomp = reverse($dna); # complement the reversed DNA sequence $revcomp =~ tr/ACGTacgt/TGCAtgca/; return $revcomp;}
以上就是关于"perl怎么提取基因组所有基因的启动子序列"这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注行业资讯频道。
基因
基因组
序列
内容
后跟
文章
知识
篇文章
脚本
代码
价值
命令
大部分
就是
数字
文件
更多
染色体
步骤
知识点
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
xss战地5怎么换服务器
外国服务器都有哪些
思科网络技术期末考试a卷
网络安全平台排行榜
DNA甲基化表达差异数据库
临沂大学计算机网络技术学费
数据库的技术视频
公安机关网络安全管理部门
rust 访问数据库
公安网络安全监察大队
大话西游2哪个服务器人多
网安总队网络技术公安
做好网络安全预警工作
软件开发人员占股
数据库工程师真题解析
大逃杀服务器维护
安擎服务器管理口账号密码
数据库删除存储过程
access数据库窗体空间顺序
服务器账号密码忘了怎么找回
家庭互联网科技
jdbc长连接数据库
如何建造服务器新手村
网安总队网络技术公安
爬虫数据库入库教程
文件服务器怎么建立共享
网络技术破解
标准服务器壁挂机柜尺寸参数
access数据库窗体空间顺序
基于位置服务技术 大数据库