千家信息网

如何使用deeptools查看reads分布特征

发表于:2024-11-21 作者:千家信息网编辑
千家信息网最后更新 2024年11月21日,这篇文章主要介绍"如何使用deeptools查看reads分布特征",在日常操作中,相信很多人在如何使用deeptools查看reads分布特征问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作
千家信息网最后更新 2024年11月21日如何使用deeptools查看reads分布特征

这篇文章主要介绍"如何使用deeptools查看reads分布特征",在日常操作中,相信很多人在如何使用deeptools查看reads分布特征问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何使用deeptools查看reads分布特征"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

在chip_seq数据分析中,通常会对peak区域在基因组上的分布进行探究,查看其分布是否存在规律,比如是否在转录起始位点,或者转录终止位点附近存在富集,此时我们可以通过deeptools这个工具来实现。

首先通过computeMatrix这个命令,可以计算基因组区域上的分布,分成以下两种模式

  1. scale-regions

  2. reference-point


第一种模式代表一个区间,包含了起始和终止位置,第二种模式代表的是某一个位点,比如转录起始位点。对于这两个模式的区别,官网给出了很好的解释,示意如下

将所有的区域划分为等长的区间称之为bin, 然后计算每个bin内所有位点的测序深度,默认用所有位点测序深度的平均值来代表这个区间。通过这个命令计算得到中间结果文件之后,可以使用以下两个命令进行可视化

  1. plotProfile

  2. plotHeatmap


下面展示一个实际的例子,从bam文件开始,得到最终的可视化结果

1. 将bam文件转换为bigwig文件

通过bamCoverage命令,可以将bam文件转换为bigwig文件,用法如下

bamCoverage -b input.bam -o input.bw
2. 运行computeMatrix

这个命令有scale-regions和reference-points两种模式,这里以第二种为例进行展示,用法如下

computeMatrix reference-points \
-S inpnut.bw \
-R hg19.bed \
--binSize 10 \
--skipZeros \
-a 3000 \
-b 3000 \
-o matrix.gz \
--outFileNameMatrix matrix.tab

在输出的tab文件中,每一行代表一个转录本,和输入的bed文件中的转录本个数一致,每一列代表bin区间内的平均测序深度,列数的多少和区间的长度以及bin_sizz有关。在上面这个例子中,选择上下游各3kb的区间,bin大小为10bp, 所以总共有3000X2/10, 即600个区间。

在可视化时,区间个数越多,画出来的折线图会相对平滑,所以可以适当调整bin的大小,使画出来的图更加美观。

3. plotProfile

用法如下

plotProfile -m matrix.gz \
-out profile.pdf

生成的结果如下

4. plotHeatmap

用法如下

plotHeatmap -m matrix.gz -o  heatmap.pdf

生成的结果分成了两部分,第一部分和plotProfile的结果相同,第二部分是一个热图,示意如下

就是将生成的tab文件中的内容绘制了一个热图,以上展示的都是基本用法,除此之外,还有很多的参数可以调整,绘制出更加美观的图片。

到此,关于"如何使用deeptools查看reads分布特征"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

0