千家信息网

如何分析breakdancer检测结构变异

发表于:2024-09-22 作者:千家信息网编辑
千家信息网最后更新 2024年09月22日,这篇文章将为大家详细讲解有关如何分析breakdancer检测结构变异,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。breakdancer 是一款结构
千家信息网最后更新 2024年09月22日如何分析breakdancer检测结构变异

这篇文章将为大家详细讲解有关如何分析breakdancer检测结构变异,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

breakdancer 是一款结构变异检测软件, 专门针对双端测序数据进行开发,github地址如下

https://github.com/genome/breakdancer

分析原理图如下

从原理图可以看出,breakdancer 会根据双端reads的比对情况,检测以下5种类型的结构变异

  1. insertions

  2. deletions

  3. inversions

  4. inter-chromosomal translocations

  5. intra-chromosomal translocations


软件的安装过程如下

git clone --recursive https://github.com/genome/breakdancer.gitcd breakdancermkdir buildcd buildcmake .. -DCMAKE_BUILD_TYPE=release -DCMAKE_INSTALL_PREFIX=/usr/localmake

最终会生成一个可执行的二进制文件,breakdancer-max。软件的使用也比较简单,共两个步骤。

1. 生成配置文件

输入文件为比对基因组产生的bam文件, 用法如下

bam2cfg.pl tumor.bam normal.bam > config.txt

配置文件中,每个样本对应一行记录,包含以下特征值

readgroup:tumorplatform:illuminamap:tumor.bamreadlen:144.84lib:YLnum:10000lower:0.00upper:519.05mean:210.24std:65.87SWnormality:-40.54exe:samtools view
2. 鉴定结构变异

用法如下

breakdancer_max -t -q 10 -d sv.reads config.txt > sv.out

结构变异的检测计算量较大,所以需要的时间也很久。输出文件的列数很多,共有14列。

每一列的含义如下

  1. Chromosome 1

  2. Position 1

  3. Orientation 1

  4. Chromosome 2

  5. Position 2

  6. Orientation 2

  7. Type of a SV

  8. Size of a SV

  9. Confidence Score

  10. Total number of supporting read pairs

  11. Total number of supporting read pairs from each map file

  12. Estimated allele frequency

  13. Software version

  14. The run parameters


1到6列描述的是断裂点的位置信息;第7列描述结构变异的类型,DEL代表缺失,INS代表插入,INV代表倒位,ITX代表同一染色体上的易位,CTX代表不同染色体之间的易位;第8列代表结构变异的长度,对于染色体间的易位,这个数值没有含义;第9列代表该结构变异可信度的打分值,数值越大,可靠性越高。

关于如何分析breakdancer检测结构变异就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

0