如何使用python Genome Tracks可视化hi-c数据
这篇文章主要介绍"如何使用python Genome Tracks可视化hi-c数据",在日常操作中,相信很多人在如何使用python Genome Tracks可视化hi-c数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何使用python Genome Tracks可视化hi-c数据"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
可视化是数据分析中非常重要的一个环节,对于NGS分析数据的可视化,最常用的就是各种基因组浏览器了,既有UCSC, GBrowse等基于web的基因组浏览器,也有igvtools等本地化的图形界面软件。对于Hi-C数据,在前面的文章中也介绍过基于web的WashU Epigenome Browser基因组浏览器和本地化的juicebox软件。
熟练掌握其中一个软件的用法就可以满足大部分的需求了,但是作为一个生信分析的极客,总感觉还是需要一款命令行工具来提高效率。python和R都拥有非常强大的可视化能力,今天介绍一款基于python语言的软件pyGenomeTracks
, 一款原汁原味的命令行工具,拥有和基因组浏览器相同的展现形式,网址如下
https://github.com/deeptools/pyGenomeTracks
该软件支持可视化以下几种信息
bigwig
bed
bedgraph
links
Hi-C matrices
采用该软件可视化的效果图如下
和基因组浏览器一样的展现形式,每一层为一个track
。该软件采用配置文件的形式来配置需要展示的文件信息,每个需要展示的文件和对应的参数都写在一个标签下,具体写法如下
1. bigwig
2. bedgraph
3. hic
除此之后,还有x-axis
和spacer
等标签,分别对应x轴和两个tracks之间的空格区域。下方如下
[spacer]
[x-axis]
where = top
编辑好配置文件之后,就可以运行了,用法如下
pyGenomeTracks \
--tracks tracks.ini \
--region chr2:10,000,000-11,000,000 \
--outFileName output.pdf
tracks
参数指定配置文件的名称,region
参数指定需要可视化的基因组区域,outFileName
参数指定输出文件的名称。为了达到美观的效果,有许多的参数需要调整,更多细节请参考官方文档和示例。
一个hi-c数据可视化的效果图如下
通过该软件,可以高效的展示hi-c数据。
到此,关于"如何使用python Genome Tracks可视化hi-c数据"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!