tabix中怎么操作VCF文件
发表于:2024-10-16 作者:千家信息网编辑
千家信息网最后更新 2024年10月16日,tabix中怎么操作VCF文件,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。安装过程如下wget https://sourcefor
千家信息网最后更新 2024年10月16日tabix中怎么操作VCF文件
tabix中怎么操作VCF文件,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
安装过程如下
wget https://sourceforge.net/projects/samtools/files/tabix/tabix-0.2.6.tar.bz2tar xjvf tabix-0.2.6.tar.bz2cd tabix-0.2.6/make
下载源代码,解压缩之后,编译即可。编译成功之后,会有两个可执行文件tabix
和bgzip
。
由于SNP位点数量巨大,对应VCF文件也非常的大,为例节省存储空间,最常见的做法就是压缩。bgzip
可以压缩VCF文件,用法如下
bgzip view.vcf
压缩之后,原本的view.vcf
文件就变成了view.vcf.gz
文件。压缩后缀为.gz
, 如果想要解压缩,有以下两种用法
bgzip -d view.vcf.gzgunzip view.vcf.gz
bgzip的压缩算法和gzip压缩算法有着相似之处,所以对于bgzip压缩的文件,解压缩时除了可以使用bgzip软件本身,还可以使用gunzip进行解压缩。
需要注意的是,两种算法虽然有相似之处,但是还是有本质区别的,在对VCF文件压缩时,不可以使用gzip来代替bgzip。
对于大型的VCF文件而言,如何快速访问其中的记录也是个难点。tabix
可以对VCF文件构建索引,索引构建好之后,访问速度会快很多。tabix
对VCF文件建立索引的用法如下
tabix -p vcf view.vcf.gz
注意输入的VCF文件必须是使用bgzip
压缩之后的VCF文件,生成的索引文件为view.vcf.gz.tbi
, 后缀为.tbi
。
构建好索引之后,可以快速的获取指定区域的记录,示例如下
1. 获取位于11号染色体的SNP位点
tabix view.vcf.gz 11
2. 获取位于11号染色体上突变位置大于或者等于2343545的SNP位点
tabix view.vcf.gz 11:2343545
3. 获取位于11号染色体上突变位置介于2343540到2343596的SNP位点
tabix view.vcf.gz 11:2343540-2343596
关于tabix中怎么操作VCF文件问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。
文件
索引
位点
染色体
算法
问题
染色
相似
位置
后缀
更多
帮助
编译
解答
巨大
易行
成功
简单易行
两个
做法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
外交部发言提醒网络安全问题
云网络安全要求
服务器6230 xeon
qq空间相册服务器忙
部队 网络安全保密
流媒体服务器供应商
常用的软件开发环境
四川一佰分网络技术有限公司
数据库表导出是什么文件
公司违约概率数据库
java获取数据库表中数据
鹤壁华宇网络技术
服务器真连接延迟和延迟ping
gdc服务器播放列表模板
软件开发能不能无主机办公
网络安全保卫是干嘛的
数据库疑难杂症
刀片服务器 华为
2012r2服务器激活码
计算机网络技术涉及的就业
打印服务器 打印记录
tomcat 安卓服务器
同一个局域网的dns服务器
附近最近的服务器
服务器到期了续费不了怎么办
天龙八部一键端修改数据库
软件开发客户群体有哪些
郭庆福服务器安全
上海互联网科技大会
蔡甸好的软件开发团队