千家信息网

gencode数据库有什么用

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章将为大家详细讲解有关gencode数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。对于人和小鼠而言,NCBI, Ensembl等数据库都保存了对
千家信息网最后更新 2025年01月23日gencode数据库有什么用

这篇文章将为大家详细讲解有关gencode数据库有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

对于人和小鼠而言,NCBI, Ensembl等数据库都保存了对应的基因注释信息,不同数据库中的信息来源和可信度都不一样,gencode综合HAVANA和Ensembl 数据库中的信息,通过实验手段加以验证,从而构建一个高质量的注释信息数据库。网址如下

https://www.gencodegenes.org/

官网提供了GTF和GFF3两种格式的文件以供下载,示意如下

每种类型的文件提供了3种区域

  1. CHR

  2. ALL

  3. PRI


对于基因组而言,包括了chromsomeunplaced_scaffold, alt_scaffold, patch等序列,这些序列上都存在对应的基因。CHR指的是染色体级别的信息,包括细胞核内的染色体和线粒体;ALL包括所有的序列,PRI只包含染色体和unplaced_scaffold序列上的信息。官方推荐,使用CHR级别的信息。

文件中采用level来表示注释信息的可信度,目前共包括3个level。

level1代表可靠的注释信息,有直接的实验证据支持的注释信息;level2代表的是经过人工校对的注释信息,取HAVANA和Ensembl注释信息中一致的注释信息;level3指的是软件注释的信息,通常是Ensemble中和HAVANA不一致的注释信息。

如果想要得到更高可信度的注释信息,可以根据level进行过滤,只选择1和2这两个层级的注释信息。

文件中共包含的基因和转录本的个数统计如下

1. human

2. mouse

在文件中,会给出基因或者转录本的类型信息,解释如下

  1. protein_coding
    蛋白编码基因

  2. lincRNA
    位于基因间区的长链非编码RNA

  3. non_coding
    文献中证实的非编码RNA


关于"gencode数据库有什么用"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

信息 注释 基因 数据 数据库 文件 序列 可信 可信度 染色体 篇文章 编码 染色 一致 代表 更多 类型 级别 实验 不同 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 软件开发公司的职务分布 推动网络安全防护能力建设 数据库date类型默认长度 最新的数据库设计工具 大众FID码数据库 深圳市中外游网络技术 测试人员如何了解数据库 泰州网络营销软件开发价格咨询 北京知识印象科技互联网排名 服务器装win7后怎么设置调速 湖南新一代软件开发价格参考价格 傻瓜网络技术 未央区第七届国家网络安全宣传周 福建联想服务器维修价格 软件开发硬件建设 黑客是不是网络技术好 广州男士购物商城软件开发 网络技术基础的重要性 qt从数据库读取文件 湖南益阳软件开发合同律师哪里找 天堂w服务器维护时间 数据库技术及应用考研学校 哪里的软件开发水平最高 微信云开发数据库介绍 计算机网络安全 pdf 软件开发过程概要设计 战地无服务器国旗 航天航空网络安全 蛋白质数据库id 戴尔服务器选择u盘启动按什么
0