tabix中怎么操作VCF文件
发表于:2024-09-22 作者:千家信息网编辑
千家信息网最后更新 2024年09月22日,tabix中怎么操作VCF文件,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。安装过程如下wget https://sourcefor
千家信息网最后更新 2024年09月22日tabix中怎么操作VCF文件
tabix中怎么操作VCF文件,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
安装过程如下
wget https://sourceforge.net/projects/samtools/files/tabix/tabix-0.2.6.tar.bz2tar xjvf tabix-0.2.6.tar.bz2cd tabix-0.2.6/make
下载源代码,解压缩之后,编译即可。编译成功之后,会有两个可执行文件tabix
和bgzip
。
由于SNP位点数量巨大,对应VCF文件也非常的大,为例节省存储空间,最常见的做法就是压缩。bgzip
可以压缩VCF文件,用法如下
bgzip view.vcf
压缩之后,原本的view.vcf
文件就变成了view.vcf.gz
文件。压缩后缀为.gz
, 如果想要解压缩,有以下两种用法
bgzip -d view.vcf.gzgunzip view.vcf.gz
bgzip的压缩算法和gzip压缩算法有着相似之处,所以对于bgzip压缩的文件,解压缩时除了可以使用bgzip软件本身,还可以使用gunzip进行解压缩。
需要注意的是,两种算法虽然有相似之处,但是还是有本质区别的,在对VCF文件压缩时,不可以使用gzip来代替bgzip。
对于大型的VCF文件而言,如何快速访问其中的记录也是个难点。tabix
可以对VCF文件构建索引,索引构建好之后,访问速度会快很多。tabix
对VCF文件建立索引的用法如下
tabix -p vcf view.vcf.gz
注意输入的VCF文件必须是使用bgzip
压缩之后的VCF文件,生成的索引文件为view.vcf.gz.tbi
, 后缀为.tbi
。
构建好索引之后,可以快速的获取指定区域的记录,示例如下
1. 获取位于11号染色体的SNP位点
tabix view.vcf.gz 11
2. 获取位于11号染色体上突变位置大于或者等于2343545的SNP位点
tabix view.vcf.gz 11:2343545
3. 获取位于11号染色体上突变位置介于2343540到2343596的SNP位点
tabix view.vcf.gz 11:2343540-2343596
关于tabix中怎么操作VCF文件问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。
文件
索引
位点
染色体
算法
问题
染色
相似
位置
后缀
更多
帮助
编译
解答
巨大
易行
成功
简单易行
两个
做法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
大班网络安全画画
给数据库用户分配权限
云服务器 网盘
计算机网络技术实验体会
内蒙古网络安全宣传周
数据库用命令删除表内的重复字段
奇安信成为世界第一网络安全
数据库dwms什么意思
发现不了数据库尾号
手机之间怎样转移数据库
张湾区公司软件开发学习
速用数据库修改器
服务器上怎么接电脑上的网络
网络安全信息员培训心得
db数据库系统表
软件开发项目可以代理商投标吗
合肥网络安全俱乐部
小程序云开发服务器怎么用
c#sql创建数据库
全市人才数据库建设实施方案
惠普服务器内存为什么要按次序
数据库数据类型的查询向导怎么弄
云服务器握手
给数据库用户分配权限
方舟服务器龙会饿死吗
山西统一软件开发价格服务标准
怎么去掉服务器安全狗
优优互联网科技公司PPT
网络技术课程论文范围
应急广播网络安全