GATK中如何计算Inbreeding coefficient
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,GATK中如何计算Inbreeding coefficient,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。关于近交系数是什么的定义
千家信息网最后更新 2025年01月23日GATK中如何计算Inbreeding coefficient
GATK中如何计算Inbreeding coefficient,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
关于近交系数是什么的定义,除了英文资料,中文上也给出了很清晰的定义,这里引用一下:
近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近交系数,也指个体由于近交而造成异质基因减少时,同质基因或纯合子所占的百分比也叫近交系数,普遍以F或f来表示。
GATK近交系数的计算程序在github上可以找到:AS_InbreedingCoeff.java
代码不短,但计算思路非常简单,很容易看懂,我这里主要展示一下这个计算的核心部分,并在代码中做些许注释,如下:
protected double calculateIC(final VariantContext vc, final Allele altAllele) {
final int AN = vc.getCalledChrCount();
final double altAF;
final double hetCount = heterozygosityUtils.getHetCount(vc, altAllele);
//shortcut to get a value closer to the non-alleleSpecific value for bialleleics
final double F;
if (vc.isBiallelic()) {
double refAC = heterozygosityUtils.getAlleleCount(vc, vc.getReference());
double altAC = heterozygosityUtils.getAlleleCount(vc, altAllele);
double refAF = refAC/(altAC+refAC); altAF = 1 - refAF;
// inbreeding coefficient F = 1.0 - (hetCount / (2.0 * refAF * altAF * (double) heterozygosityUtils.getSampleCount()));
} else {
//compare number of hets for this allele (and any other second allele) with the expectation based on AFs //derive the altAF from the likelihoods to account for any accumulation of fractional counts from non-primary likelihoods, //e.g. for a GQ10 variant, the probability of the call will be ~0.9 and the second best call will be ~0.1 so adding up
//those 0.1s for het counts can dramatically change the AF compared with integer counts altAF = heterozygosityUtils.getAlleleCount(vc, altAllele)/ (double) AN;
// 计算inbreeding coefficient
// heterozygosityUtils.getSampleCount() 获取总样本数 F = 1.0 - (hetCount / (2.0 * (1 - altAF) * altAF * (double) heterozygosityUtils.getSampleCount())); }
return F;}
通过利用哈迪温伯格定律来进行计算的: 1.0 - (hetCount / (2.0 (1 - altAF) altAF(double)N ,其中N是人数。这个值给出的是期望的杂合变异的个数。所以参数F(近交系数)说的就是"实际的hetCount"除以"期望的hetCount"再与1.0取差。当F值越接近0,就意味着实际的hetCount与理论的hetCount越接近。
关于GATK中如何计算Inbreeding coefficient问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。
近交
系数
基因
问题
代码
实际
更多
百分
帮助
期望
解答
易行
简单易行
世代
个体
个数
人数
参数
变异
同质
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
山东电商软件开发企业
软件开发的工作没有基础
瀑布模型的软件开发模式
广州服务器托管机房
服务器关闭了怎么进游戏
手机贷服务器系统迁移改造
数据库时间 格式
数据库创建文件夹命令
世界贸易数据库
互联网科技前沿资讯
数据库中一对多对多怎么建表
坚果云无法与服务器
曲靖网络安全与信息化会议
国家永久农田数据库
软件开发金融信息化
网络安全相关培训
设备的后端服务器架构
警察局网络安全管理是干嘛的
网络安全周2020年线上
东莞用友软件开发
虚拟化管理服务器
网络服务器配置与管理考试
公务员考试报名系统数据库
数据库正规化
昆山橡胶零件加工管理软件开发
网络安全法规定网络日志保存
安徽什么是网络技术分类推广
ftp服务器登录
琉璃神社服务器在哪
攀克网络技术有限公司