千家信息网

如何正确的使用Annovar

发表于:2025-02-08 作者:千家信息网编辑
千家信息网最后更新 2025年02月08日,如何正确的使用Annovar,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。annovar的下载及安装Annovar是用p
千家信息网最后更新 2025年02月08日如何正确的使用Annovar

如何正确的使用Annovar,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。


annovar的下载及安装


Annovar是用perl语言写的,可以在任何安装了perl的系统上运行,且不需要进行安装,直接下载解压就可以使用。但它的下载需要注册,且需要使用教育机构或者科研单位后缀的邮箱。当然,如果你没有注册邮箱也没有关系,后台回复annovar即可得到软件安装包。Annovar主要有三种不同形式的注释方式:

1、Gene-based annotation:根据SNP或者CNV的位置来判断是否会引起蛋白质编码的变化,是否发生了氨基酸的改变。

2、 Region-based annotation: 来鉴定特定基因组区域的突变。

3、Filter-based annotation:用来鉴定特定数据库中的突变。


下载完annovar并且解压之后,主要包括以下文件:

  • example:存放的是示例文件

  • humandb:部分注释数据库的文件,annovar的软件中自带了一部分,根据自己的研究需要也可以自己下载

  • annotate_variation.pl:主程序,用来进行数据库的下载,以及不同形式的注释

  • coding_change.pl:用来推断蛋白质的序列是否发生变化

  • convert2annovar.pl:将其他多种形式转化为annovar可识别的形式(如将vcf文件转化为annovar可识别形式)

  • retrieve_seq_from_fasta.pl:自行建立其它物种的转录本

  • table_annovar.pl:可以一次完成三种不同形式的注释

  • variants_reduction.pl:用来定制过滤注释流程


- 输入文件 -


Annovar的输入文件是一个简单的文本格式文件,其中前五列应分别是染色体号、突变位点在染色体上的起始位置、突变位点的结束位置、该突变位点在参考序列上的碱基以及该位点的突变碱基,其他列的内容可以有也可以没有。

如果输入文件是vcf文件,可以采用annovar的convert2annovar.pl程序将vcf文件转化为annovar可识别的文件形式,具体的命令如下:

perl convert2annovar.pl -format vcf4 G-001.vcf -outfile G.avinput

输出文件的格式为:


- 数据库下载 -


Annovar的注释主要依赖于数据库,因此在进行分析之前,应将所需的数据库下载到humandb文件夹中,下载的命令如下:


perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar avsnp147 humandb/


-buildver:对应参考基因组的版本

-downdb -webfrom annovar:从annovar库中下载对应的数据库,如果不知道要下载什么数据库,可以在annovar库中查看对应的数据库以及对应的功能,网址为:(http://annovar.openbioinformatics.org/en/latest/user-guide/download/)

avsnp147:下载的数据库的名称

humandb:下载到humandb文件夹中


- 结果注释-


整理好输入文件格式以及下载好数据库后,就可以进行注释了,下面以table_annovar.pl为例介绍下annovar的注释功能,具体命令如下:


perl table_annovar.pl GCK.avinput annovar/humandb/ -buildver hg19 -out GCK -remove -protocol refGene,1000g2015aug_eas,1000g2015aug_eur,1000g2015aug_sas,1000g2015aug_amr -operation g,f,f,f ,f -nastring .


table_annovar.pl:输入文件

-buildver:参考序列版本

-out:输出文件

-remove:删掉程d序运行过程中产生的中间文件

-protocol:数据库的名称

-operation:对应顺序的数据库的类型,如千人基因组,dbsnp数据库等(g代表gene-based、r代表region-based、f代表filter-based),与前面数据库一一对应

-nastring .:缺省值用.表示


看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。

文件 数据 数据库 注释 形式 输入 位点 不同 代表 位置 命令 基因 基因组 序列 格式 参考 内容 功能 名称 文件夹 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 不履行网络安全义务应受什么处罚 关系数据库的产生和发展历程 服务器ip地址被占用 浦东新区市场软件开发问答知识 广州家政软件开发定制 页游服务器怎么开发 笔记本电脑显示服务器出现问题 在水一方视频软件开发 web服务器 研究 方舟生存进化怎么退服务器 网络安全宣传周工作综述 数据库的表指的是什么 国内 免费数据库软件 一网络安全为主的手抄报 淘宝助理出现本地数据库失败 网络安全维护工程师上海 网络安全教育警示片的观后感 支付宝服务器什么时候刷新 保定做app的软件开发费用 网络安全实习生 昌硕软件开发工程师都干什么 深圳爱与伞互联网科技有限公司 支付宝网络安全知识 阿里服务器安全组规则 华三服务器通过snmp配置告警 计算机网络技术成教 金仓数据库连接的服务名是什么 网络安全维护工程师上海 云服务器储存数据安全吗 网站查域名和服务器区别
0