HiC-Pro怎么用
发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,这篇文章主要为大家展示了"HiC-Pro怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"HiC-Pro怎么用"这篇文章吧。HiC-Pro软件非常灵活,
千家信息网最后更新 2025年02月04日HiC-Pro怎么用
这篇文章主要为大家展示了"HiC-Pro怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"HiC-Pro怎么用"这篇文章吧。
HiC-Pro软件非常灵活,不仅可以处理各种不同建库方式的Hi-C数据,也可以处理capture Hi-C数据。软件安装过程如下
yum install -y epel-release
# R
yum install -y R
R
install.packages(c("ggplot2", "RColorBrewer"))
# python
yum install -y gcc gcc-c++ make
yum install -y python2 python-devel python2-pip
pip install pysam
pip install "scipy<1"
pip install bx-python
# bowtie2
yum install -y wget
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip
unzip bowtie2-2.3.4.1-linux-x86_64.zip
# samtools
yum install bzip2 bzip2-devel libcurl libcurl-devel ncurses-devel openssl openssl-devel
wget https://github.com/samtools/samtools/releases/download/1.6/samtools-1.6.tar.bz2
tar xjvf samtools-1.6.tar.bz2
cd samtools-1.6/
./configure
make
make install
# HiC-Pro
wget https://github.com/nservant/HiC-Pro/archive/v2.11.1.tar.gz
tar xzvf v2.11.1.tar.gz
cd HiC-Pro-2.11.1
make configure
make install
安装好之后,需要准备以下几种参考物种的相关文件
1. 酶切图谱
通过软件自带的脚本可以产生基因组对应的酶切图谱,输入内切酶的名称或者酶切位点序列都可以,用法如下
digest_genome.py -r A^AGCTT -o mm9_hindiii.bed mm9.fasta
digest_genome.py -r hindiii -o mm9_hindiii.bed mm9.fasta
2. 参考基因组索引
软件采用bowtie2
将reads比对到参考基因组上,所以需要对基因组的fasta文件建立索引,用法如下
bowtie2-build hg19.fasta hg19
3. 染色体长度文件
从UCSC下载染色体长度文件,或者自己根据fasta序列统计长度都可以,该文件内容如下
chr1 249250621
chr2 243199373
chr3 198022430
chr4 191154276
这里我们用官网提供的测试数据展示下基本用法,首先下载测试数据
wget --no-check-certificate https://zerkalo.curie.fr/partage/HiC-Pro/HiCPro_testdata.tar.gz
tar xzcf HiCPro_testdata.tar.gz
HiC-Pro的所有参数都记录在配置文件中,安装目录提供了配置文件的模板config_test_latest.txt`, 在此基础上进行编辑就可以了。常见的需要配置的参数如下
BOWTIE2_IDX_PATH = /data/annotation/Human/hg19/base
REFERENCE_GENOME = hg19
GENOME_SIZE = chrom_hg19.sizes
GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
LIGATION_SITE = AAGCTAGCTT
对于这个测试文件,只需要编辑bowtie2索引所在目录就可以了,编辑好之后直接运行,用法如下
HiC-Pro -i test_data/ -o out_dir -c config_test_latest.txt
用法非常简单,-i
参数指定样本fastq文件文件所在目录,-o
参数指定输出结果的目录,-c
参数指定配置文件的名称。
对于fastq文件所在目录,结构如下所示
├── dixon_2M
│ ├── SRR400264_00_R1.fastq.gz
│ └── SRR400264_00_R2.fastq.gz
└── dixon_2M_2
├── SRR400264_01_R1.fastq.gz
└── SRR400264_01_R2.fastq.gz
每个样本一个子文件夹,下面是对应的双端测序的fastq文件。输出结果目录如下
|-- bowtie_results
|-- config_test_latest.txt
|-- hic_results
|-- logs
|-- rawdata -> /HiC-Pro-2.11.1/test_data/
`-- tmp
其中hic_results
目录下是最终结果,包含了不同分辨率下的hi-c图谱和质控的图表。
以上是"HiC-Pro怎么用"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
文件
目录
参数
内容
基因
基因组
数据
软件
配置
图谱
所在
篇文章
索引
结果
长度
参考
测试
不同
名称
序列
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
图书馆数据库需求分析
服务器端口映射
mac写入数据库文件夹失败
网络安全大赛1012无标题
软件开发培训在哪有
无线网络安全验收标准
亚马逊多店管理云服务器
软件开发包括app开发吗
华为手机连接到服务器出现问题
网络技术热门术语
hcie网络安全在北京
县公安局网络安全工作总结
盱眙品质软件开发服务合同
云主机软件开发注意事项
图文分析数据库
吴忠网络技术参数
网络安全审查到多久
软件开发的就业前景是什么
mysql数据库面试代码题
管理软件开发软件
计算机网络技术求职规划书
饥荒服务器证书文件
云媒体服务器经销商
鲲鹏服务器优化
软件开发套
陕西网络安全非标机箱批发
教育系统网络安全培训体会
网络安全主题教育开展情况汇报
对单位网络安全意见及建议
只有一个服务器的手游