千家信息网

如何理解GO的层级关系在富集分析中的应用

发表于:2025-01-28 作者:千家信息网编辑
千家信息网最后更新 2025年01月28日,本篇文章给大家分享的是有关如何理解GO的层级关系在富集分析中的应用,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。对于Gene ontol
千家信息网最后更新 2025年01月28日如何理解GO的层级关系在富集分析中的应用

本篇文章给大家分享的是有关如何理解GO的层级关系在富集分析中的应用,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

对于Gene ontology 而言,目前共有2万多个Go trems。 做完富集分析后,我们可能会得到几百甚至几千个富集到的GO terms, 这样的一个数据量对于人工一个个检索而言,仍然是一个艰巨的任务。为了有效的利用GO富集分析的结果,我们势必需要对结果再次进行过滤。

所有GO的层次结构关系如下图所示

这样的结构我们称之为有向无环图DAG, 虽然在图这种数据结构中,节点并没有严格的层级关系,但是由于在GO这张图中,存在了祖先节点,即最上层的3个节点,其他的节点都可以看做是其子节点,从而引用了树状结构中的level的概念,定义子节点到祖先节点的路径上包含的节点数即为该节点的level,祖先节点的level为1. 示意图如下

需要注意的是,由于子节点到祖先节点的路径不止一条,所以一个子节点可能拥有用多个level, 这意味着GO terms的level不是一个值,在使用level对GO Terms进行过滤时就需要注意。

想象一下,对于一个有多个level的GO term, 我们采用哪个值来表征其level, 是取最大值,还是最小值,或者是均值,由于不同取值算法带来的不确定性,所以采用level对GO过滤会存在一定风险,特别是level很大时。比如我们只选取level > 7的GO terms, 无论是用哪个值作为level, 其过滤的结果和我们预期的都是不符合的。

GO官网对于GO level也进行了说明,参考以下链接

http://www.geneontology.org/faq/how-can-i-calculate-level-go-term

传统的费舍尔精确检验也好,GSEA也罢,这些富集分析的算法都只是为单个GO term进行分析,不会考虑该GO term在整个网状结果中的层级关系。对于这些分析的结果,采用上述的GO level 进行过滤时,只能是采用较小的level, 在一下R包中,比如goprofiler, 推荐的最小层级是level为2。

采用level对结果过滤效果有限,为了有效筛选结果,出现了Gene Ontolgy network analysis,示意图如下

根据所有富集到的GO terms, 从整个GO Graph中取出一个子图subgraph, 图中有颜色的节点为富集到的GO, 颜色的深浅有P值决定, 节点的大小由degree决定。

根据这个network, 应用图论的算法可以挖掘出其中重要的GO term,从而实现对GO富集结果的过滤。

以上就是如何理解GO的层级关系在富集分析中的应用,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。

0