千家信息网

vcftools如何计算snp缺失率

发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,这篇文章给大家分享的是有关vcftools如何计算snp缺失率的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。vcftools计算snp缺失率vcftools中有两个参数可以
千家信息网最后更新 2025年01月19日vcftools如何计算snp缺失率

这篇文章给大家分享的是有关vcftools如何计算snp缺失率的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

vcftools计算snp缺失率

vcftools中有两个参数可以计算vcf文件中snp的缺失率。

分别是:

--missing-indv 生成一个文件,报告每个样品的缺失情况,该文件的后缀为".imiss"。

--missing-site 生成一个文件,报告每个snp位点的缺失情况,该文件的后缀为".lmiss"。

具体用法:

vcftools --vcf snp.vcf. --missing-site

运行以上命令后会在当前目录生成一个 out.lmiss 文件,其格式如下:

CHR     POS     N_DATA  N_GENOTYPE_FILTERED     N_MISS  F_MISSchr01   194921  988     0       368     0.37247chr01   384714  988     0       204     0.206478chr01   384719  988     0       202     0.204453chr01   518438  988     0       488     0.493927chr01   518473  988     0       452     0.45749chr01   518579  988     0       418     0.423077chr01   518635  988     0       428     0.433198chr01   680786  988     0       346     0.350202chr01   680834  988     0       412     0.417004

前两列为snp所在位置,第三列为等位基因总数,第5列为缺失的总数,最后一列为缺失率。

vcftools --vcf snp.vcf. --missing-indv

运行以上命令后会在当前目录生成一个 out.imiss 文件,其格式如下:

INDV    N_DATA  N_GENOTYPES_FILTERED    N_MISS  F_MISS
1 8747 0 3632 0.415228
10 8747 0 1264 0.144507
102 8747 0 2016 0.230479
105 8747 0 6322 0.722762
106 8747 0 2365 0.270378
107 8747 0 4376 0.500286
108 8747 0 5682 0.649594
109 8747 0 1877 0.214588
11 8747 0 1039 0.118784

第一列为样品名称,第二列为总的snp数,第4列为缺失的总数,最后一列为缺失率。

感谢各位的阅读!关于"vcftools如何计算snp缺失率"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

0