如何计算Kaks时批量提取多对基因的序列
发表于:2025-02-07 作者:千家信息网编辑
千家信息网最后更新 2025年02月07日,小编给大家分享一下如何计算Kaks时批量提取多对基因的序列,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!计算Kaks时批量提取多对基因的序列基因家族分析中,在计算kaks时需要将每组
千家信息网最后更新 2025年02月07日如何计算Kaks时批量提取多对基因的序列
小编给大家分享一下如何计算Kaks时批量提取多对基因的序列,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
计算Kaks时批量提取多对基因的序列
基因家族分析中,在计算kaks时需要将每组串联重复基因序列提取出,然后分别进行多序列比对。
我们给大家提供的脚本只能一对一对的提取序列,那数量少还可以,可如果串联重复基因太多就有些麻烦了。这里提供一个批量提取串联重复基因序列的脚本,可以将每组串联重复基因序列提取到单独的文件中。
首先我们需要准备3个文件:
1.串联重复基因对文件。每一行是一对串联重复基因,中间用Tab键分割。
2.所有基因cds序列。
3.一个空的目录。
脚本运行命令如下:
perl get_fa_by_id_kaks.pl WRKY.tandem ../data/Sspon.v20180123.cds.fa test/
WRKY.tandem:串联重复基因对文件;
../data/Sspon.v20180123.cds.fa:所有基因cds序列文件;
test/:空目录。
get_fa_by_id_kaks.pl就是脚本了,其代码如下:
#email: huangls@biomics.com.cndie "perl $0" unless ( @ARGV == 3 );use Math::BigFloat;use Bio::SeqIO;use Bio::Seq;$in = Bio::SeqIO->new( -file => "$ARGV[1]", -format => 'Fasta');my %gene;while ( my $seq = $in->next_seq() ) { my ( $id, $sequence, $desc ) = ( $seq->id, $seq->seq, $seq->desc ); $gene{$id} = $seq;}open IN, "$ARGV[0]" or die "$!";my $n = 1;while ( ) { chomp; next if /^#/; my @a = split /\s+/; my $out = Bio::SeqIO->new( -file => ">$ARGV[2]/dup_gene_paired$n.fa", -format => 'Fasta' ); if ( exists $gene{$a[0]} ) { my ( $id, $sequence, $desc ) = ( $gene{$a[0]}->id, $gene{$a[0]}->seq, $gene{$a[0]}->desc ); my $newSeqobj = Bio::Seq->new(-seq => $sequence, -id =>$id, ); $out->write_seq($newSeqobj); } if ( exists $gene{$a[1]} ) { my ( $id, $sequence, $desc ) = ( $gene{$a[1]}->id, $gene{$a[1]}->seq, $gene{$a[1]}->desc ); my $newSeqobj = Bio::Seq->new(-seq => $sequence, -desc => $desc, -id =>$id, ); $out->write_seq($newSeqobj); } $n++; $out->close();}close(IN);$in->close();
看完了这篇文章,相信你对"如何计算Kaks时批量提取多对基因的序列"有了一定的了解,如果想了解更多相关知识,欢迎关注行业资讯频道,感谢各位的阅读!
基因
序列
文件
脚本
篇文章
一行
代码
命令
完了
家族
就是
数量
更多
目录
知识
空目录
行业
资讯
资讯频道
频道
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
潜江定制软件开发方案
深圳交友软件开发靠谱吗
变电站综合应用服务器技术方案
中国女性网络安全
市网络安全检查的报告
学生会网络技术部门岗位职责
湖南学it软件开发
数据库设计步骤需求分析
长沙九宸众创网络技术有限公司
远程心电网络技术目的
服务器有必要买固态硬盘吗
服务器管理器如何配置网站
四级英语作文网络安全
上海同森网络技术有限公司外汇
电脑软件开发怎么选择
存储服务器网线连接应用服务器
山东项目软件开发哪家可靠
网络技术指标有哪些
轻量级云服务器安装docker
数据库超发
典型的软件开发模型的概念
面具设计软件开发
圈圈网络技术有限公司
国内外已建成的土壤数据库
欧洲网络安全和利益
天宇网络技术有限公司西安分公司
四级英语作文网络安全
直播软件开发公司哪个好
qt用户登录链接数据库
单招要考的网络技术面试