千家信息网

怎样使用Clustal进行多序列比对

发表于:2024-09-22 作者:千家信息网编辑
千家信息网最后更新 2024年09月22日,怎样使用Clustal进行多序列比对,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。多序列比对在保守区域鉴定,系统发育分析,motif识别
千家信息网最后更新 2024年09月22日怎样使用Clustal进行多序列比对

怎样使用Clustal进行多序列比对,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。


多序列比对在保守区域鉴定,系统发育分析,motif识别等多个领域发挥重要作用,是生物信息数据分析必备的基础技能之一。Clustal是一款经典的多序列比对工具,支持DNA, RNA, 蛋白质的比对。

clustal 有两个版本可用,之前的版本同时提供了GUI和命令行两种工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。

最新本的omega比对准确度更高,而且速度更快,适合几千条规模的多序列比对,该软件目前只提供了命令行版本。在官网上,提供了源代码和编译好的二进制文件

通常情况下,直接下载对应的二进制可执行文件就行了。软件的基本用法如下:

clustalo -i seq.fasta > align.fa

-i指定输入的序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件中。该软件支持多种格式的输出

  1. fasta

  2. clustal

  3. msf

  4. phylip

  5. selex

  6. stockholm

  7. vienna


默认输出格式为fasta, 可以通过--outfmt参数指定输出文件的格式。多序列比对不同于Blast的地方在于,Blast是局部比对,而多序列比对是全局比对。全局比对意味着需要将输入序列对齐到同一个水平来比对,一般是通过在输入序列中插入碱基的方式来使序列对齐,示意如下

>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globinATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGGCGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCACCACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGGCCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCCCAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAACTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTTCACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCTGACCTCCAAATACCGTTAA>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globinATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGGTGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCACCACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGGTCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCCCGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAACTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTTCACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCTGACCTCCAAGTACCGTTAA>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globinATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAGCCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCAGACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAAGCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGTGGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAACTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTTCCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCTCTCTGAGAAGTACCGCTAA

通过在序列中插入-来使得序列对齐。如果不习惯命令行的操作方式,也有在线服务可以使用。EBI提供的在线服务网址如下

https://www.ebi.ac.uk/Tools/msa/clustalo/

使用非常简单,输入序列,调整参数设置,然后提交即可。在输出结果中,还提供了颜色标记,进化树可视化等功能。

通过Mview可视化多序列比对结果,示意如下

也支持导出到Jalview软件中进行可视化。

通过Phylogenetic Tree可以查看进化树的结果,默认采用NJ法建树,示意如下

也可以通过Send to Simple Phylogeny, 创建进化树,支持NJ和UPGMA两种建树方式。

看完上述内容,你们掌握怎样使用Clustal进行多序列比对的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

序列 命令 文件 输出 版本 结果 软件 支持 输入 方式 格式 可视化 进化 二进制 全局 内容 参数 可以通过 在线服务 工具 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全构成一项新兴产业 8p链接服务器出现问题 海康服务器如何修改时间 湖南雨人网络安全有限公司 多人在线交互服务器 10项网络安全国家标准 台州麻将软件开发 获取系统时间 存数据库 西安智庭网络技术公司 黑龙江海康软件开发业绩报告 广东前端软件开发定制费用 网络安全知识竞赛考试次数 浪潮服务器服务 ssh启动数据库连接 鄂州服务器回收公司地址 网络安全人人有责的活动方案 软件开发技术经理项目经理 安徽net软件开发服务 肇庆商城软件开发公司 网络安全问题课题开题报告 计算机网络技术主要学哪些科目 服务器关电 jaba连接数据库项目 黑龙江省2021网络安全宣传周 绵阳网络技术推荐厂家 蜘蛛纸牌数据库E-R图 电热水器隐藏软件开发 全国计算机三级网络技术笔记 宽带ntp服务器连接异常怎么弄 抖音使用qq登陆显示服务器繁忙
0