千家信息网

DECoN中最高分辨率的CNV检测工具怎么用

发表于:2025-01-25 作者:千家信息网编辑
千家信息网最后更新 2025年01月25日,这期内容当中小编将会给大家带来有关DECoN中最高分辨率的CNV检测工具怎么用,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。DECoN是一款CNV检测工具,适用于e
千家信息网最后更新 2025年01月25日DECoN中最高分辨率的CNV检测工具怎么用

这期内容当中小编将会给大家带来有关DECoN中最高分辨率的CNV检测工具怎么用,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

DECoN是一款CNV检测工具,适用于exon-based的panel测序,可以识别single exon CNV

panel测序在临床上应用广泛,目前利用panel测序数据来检测SNP是比较成熟的,而CNV的检测则缺乏有效的工具。在这样的背景下,DECoN应运而生,开发者在ExomeDepth软件的的基础上进一步修改,主要有以下两点大的改动

  1. 新增了检测染色体上第一个外显子区域的变异

  2. 在隐马可夫模型中新增了exon之间的距离这一因素


通过模拟数据和真实数据对软件的性能进行评估,在模拟数据集中,DECoN效果惊人,100%的灵敏度和99%的特异性。真实数据采用了illumina TruSight Cancer Panel测序的结果,最终鉴定出来24个exon CNV,用MLPA技术进行验证,有23个可以检测到,假阳性率4%,更加详细的评估结果请查看文章中的描述。

该软件的运行速度也非常快,还提供了良好的结果可视化,示意如下

上面的折线图展示的是基因上coverage的分布,灰色代表对照样本,蓝色代表实验样本;中间展示的是基因的名称,最下方的散点图代表观测值和期望值之间的比值,灰色区域代表95%置信区间,当比值显著偏离置信区间时,认为该区域存在拷贝数变异。上图所示的红点区域代表实际观测值小于期望值,说明发生了deletion。

软件的源代码保存在github上,链接如下

https://github.com/RahmanTeam/DECoN

具体操作分为以下4步, 对应4个R脚本

1. ReadInBams.R

读取bam文件,计算coverage, 用法如下

Rscript ReadInBams.R \
--bams bamList.txt \
--bed Target_Regions.bed \
--fasta hg19.fa \
--out DECoNtest

输入文件为bam文件的列表,目的区域的bed文件,参考基因组的fasta文件,bam文件的格式如下

目的区域bed文件的格式如下

输出结果是一个后缀为RData的文件,保存了样本的coverage信息,该软件中用FPKM值来表示。

2. IdentifyFailures.R

进行质量控制,检测coverage过度的exon区域,相关性较差的样本等,用法如下

Rscript IdentifyFailures.R \
--Rdata DECoNtest.RData \
--exons customNumbering.txt \
--mincorr .98 \
--mincov 100 \
--custom TRUE \
--out DECoNtest

输入文件为第一步产生的RData文件,另外还需要自定义的exon编号的文件

customNumbering.txt

内容示意如下

如果所有的样本和exon区域都符合要求,则该命令不会输出结果,如果有不合格的样本和区域,则需要剔除之后在进行操作。

3. makeCNVcalls.R

进行CNV calling,用法如下

Rscript makeCNVcalls.R \
--Rdata DECoNtest.RData \
--exons customNumbering.txt \
--custom TRUE \
--out DECoNtestCalls \
--plot All \
--plotFolder DECoNTestPlots
4. runShiny.R

通过R包Shiny构建了一个基于浏览器的交互式结果展示页面,用法如下

Rscript runShiny.R \
--Rdata DECoNtestCalls.RData

可以查看coverage分布图,cnv calling的结果等信息,示意如下

对于panel测序的CNV检测,推荐使用DECoN进行分析。

上述就是小编为大家分享的DECoN中最高分辨率的CNV检测工具怎么用了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。

0