千家信息网

narrow,broad, gapped peak三种格式之间的区别与联系

发表于:2024-12-01 作者:千家信息网编辑
千家信息网最后更新 2024年12月01日,本篇内容主要讲解"narrow,broad, gapped peak三种格式之间的区别与联系",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"narrow,b
千家信息网最后更新 2024年12月01日narrow,broad, gapped peak三种格式之间的区别与联系

本篇内容主要讲解"narrow,broad, gapped peak三种格式之间的区别与联系",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"narrow,broad, gapped peak三种格式之间的区别与联系"吧!

在进行peak calling分析时,经常会接触到以下3种peak格式

  1. narrow peaks format

  2. broad peaks fotmat

  3. gapped peaks format


peak被定义为基因组上一段reads富集的区域,核心信息是在染色体上的起始和终止位置,除此之外,还有软件对于该peak区域的打分,比如常见的pvalue, qvalue, fold_enrichment等值。

和基因组比对信息用BAM格式来存储类似,为了标准化不同peak calling软件的输出,特意制定了以上3种数据格式。这三种格式本质上都是bed文件,只不过列数不太类似。

1. Narrow Peaks Format

该格式又称之为point-source peaks format, macs2默认输出就是这种格式,是一种BED6+4的格式,列数为10列,示意如下

前四列分别代表chrom, chromStart, chromEnd, name, 用于描述peak区间和名称,注意bed格式中起始位置从0开始计数。

第五列代表score,在macs2的输出结果中为int(-10*log10qvalue),第六列代表strand, 在macs2的输出结果中为.,第七列代表signalvalue, 通常使用fold_enrichment的值,第八列代表pvalue, 在macs2的输出结果中为-log10(pvalue),第九列代表qvalue, 在macs2的输出结果中为-log10(qvalue),第十列代表peak, 在macs2的输出结果中为peak的中心,即summit距离peak起始位置的距离。

2. Broad Peaks Format

这种格式就是在narrow peaks format的基础上丢掉了最后一列的信息,为BED6+3的格式, 列数为9列。

3. Gapped Peaks Format

前两种格式都是由于描述连续的peak区间,适用于DNA水平上的富集区域信息的存储,比如chip_seq, ATAC_seq鉴定到的peak区间,而gapped peaks format用于描述非连续的peak区间,这里的非连续通常指的是在peak的区间内会包含多个exon区域,适用于RNA水平上的富集区域信息的存储,比如m6A_seq鉴定到的peak区间。

该格式在BED12的基础上进行延伸,演变为BED12+3的格式,列数为15列,每列的含义示意如下

前6列的含义和上述两种peak格式完全相同,后3列的含义和broad peak完全相同,为了专区表示peak区间内包含的exon信息,借鉴转录本的BED12格式,引入了以下6列

  1. thickStart

  2. thickEnd

  3. itemRgb

  4. blockCount

  5. blockSizes

  6. blockStarts


thickStartthickEnd有点类似转录本中CDS的起始和终止位置,在存储peak信息时,通常的做法是将这两列的值和chromStartchromEnd的值设置成相同的,itemRgb是一个RGB颜色值,比如255,0,0, 如果没有对应的颜色信息,则用0来表示。

blockCount代表该peak区间包含的exon的个数,blockSizes代表每个exon区间的长度,多个exon用逗号连接,blockStarts代表每个exon区间在基因组上的起始位置,多个exon用逗号连接。

关于这三种格式的相关介绍请参考以下链接

https://genome.ucsc.edu/FAQ/FAQformat.html#format13

到此,相信大家对"narrow,broad, gapped peak三种格式之间的区别与联系"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

格式 代表 区间 信息 输出 位置 区域 结果 起始 存储 之间 联系 相同 含义 基因 基因组 多个 富集 内容 基础 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 天大地大没有服务器 ea访问服务器数据出现错误 matica服务器故障怎么办 怎么退出数据库模式i 显示器软件开发 阜阳服务器机箱加工价格 继续加强网络安全阵地建设 网络安全事件调查报告 网易邮箱的pop3服务器 如何抓好手机网络安全 二零年是第几届国家网络安全 长沙app开发软件开发 浙江嵌入式软件开发工程师 管家婆登录需要数据库登陆吗 java开发数据库系统 滨州专业软件开发报价 信息化网络安全工程资质 网络安全自查工作总结报告 王者怎么进不去服务器无响应 全球最大的数据库软件公司 如何进行学习网络安全工作 互联网行业是科技行业吗 sql数据库笔试考试题库 网络安全法有什么意义 我的世界纯净服务器怎么提供 搬瓦工香港服务器 二零年是第几届国家网络安全 网络技术交易网 如何应对网络安全的时代 我的世界服务器悬空的字怎么修改
0