千家信息网

怎么使用hi-C数据辅助埃及伊蚊基因组的组装

发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,今天就跟大家聊聊有关怎么使用hi-C数据辅助埃及伊蚊基因组的组装,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。早在2013年的时候, 就已经有
千家信息网最后更新 2025年02月04日怎么使用hi-C数据辅助埃及伊蚊基因组的组装

今天就跟大家聊聊有关怎么使用hi-C数据辅助埃及伊蚊基因组的组装,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

早在2013年的时候, 就已经有科学家提出了利用Hi-C数据来辅助基因组组装的思路,可以将scaffold进一步提升到染色体级别的长度,并提供了配套的分析软件LACHESIS。该软件默认输入的基因组组装结果完全正确,后续的操作都是建立在这个前提下。然而实际情况中,受到组装算法的限制,基因组草图中会存在拼接错误的情况。

分析思路: 首先会根据hi-c数据的结果,对输入的基因组组装结果中的拼接错误进行校正,然后在进行后续分析,整个pipeline如下图所示

可以分成以下4个大的步骤

  1. preliminary filtration

  2. misjoin correction

  3. ordering and orientation

  4. overlap merging


第一步首先对基因组组装的结果进行预处理,去除长度太短的scafflod。长度过短的scaffold在hi-c图谱中对应的交互信息会非常的少,没有足够的交互信息无法有效的进行后续分析;第二步利用hi-c数据校正scaffold中存在的拼接错误,对于检测到存在拼接错误的scaffold, 将其切割为存在拼接错误的inconsistent部分和未检测到拼接错误的consistent部分,inconsistent部分不会进行后续分析。

第三步确定归属同一条染色体的scaffold,并进行排序和调整方向;第四步检测同一条染色体上的scaffold间是否存在overlap, 对于存在overlap的scaffold, 进行merge。

应用该算法结合hi-c数据对埃及伊蚊的基因组结果重新组装后,效果如下所示

可以看到,由最初的草图组装到了最终的染色体级别。该算法对任意的基因组组装都是适用的,值得一提的是该文章指出,通过hi-c数据辅助基因组组装得到的最终结果中,还是会存在部分的错误结果,这个是不可避免的。

看完上述内容,你们对怎么使用hi-C数据辅助埃及伊蚊基因组的组装有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

基因 基因组 数据 结果 错误 分析 辅助 染色体 部分 染色 伊蚊 埃及 内容 算法 长度 检测 信息 思路 情况 级别 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 编程用服务器系统windows 宁波软件开发外包公司 电子商务网络技术基础作者林书开 网安网络安全意识形态评估细则 指尖铭心网络技术公司地址 软件开发测试自己烫发 学生数据库查询语句大全 我的世界服务器运行权限 mc精灵宝可梦手机版服务器下载 软件开发和开发工程师的区别 南京华博互联网科技 新开路租房软件开发 数据库只能读取不能写入 太空网络安全部队 软件开发可以到哪里学 海康威视校时服务器地址 数据库冷却降温 互联网科技宣传片背景音乐 驾考app软件开发 昆山IT服务器 北京质量网络技术服务软件 西安有线网络技术发展有限公司 网络安全零报告制度指的是什么 软件开发项目经验分享怎么写 江苏网络安全等级保护基本要求 计算机网络技术企业分析 创建数据库在主文件增加 平度平台软件开发哪家靠谱 浦东新区市场网络技术怎么样 dns解析服务器配置
0