千家信息网

中国 AIGC 数据标注全景报告发布,Coohom Cloud 成合成数据代表企业

发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,数据标注,正迎来关键洗牌时刻。近日,量子位发布《中国 AIGC 数据标注全景报告》,报告提到大模型从训练到部署应用迭代,AIGC 众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化
千家信息网最后更新 2025年02月06日中国 AIGC 数据标注全景报告发布,Coohom Cloud 成合成数据代表企业

数据标注,正迎来关键洗牌时刻。近日,量子位发布《中国 AIGC 数据标注全景报告》,报告提到大模型从训练到部署应用迭代,AIGC 众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。

作为基础服务,数据标注也从未像今天这样受到关注。尤其是作为新兴赛道地合成数据服务,潜在市场空间巨大。据量子位智库预计,国内 AI 基础数据服务市场规模将达百亿规模,约占全球市场 10% 份额。其中合成数据作为衍生出来的新赛道,存在巨大市场空间,增速超 40%, 成为增速最快的细分赛道。

所谓合成数据,即是用计算机视觉以及图形学等技术生成数据而非通过原始数据的采集而产生,能够用来训练、测试和验证大模型以及各类智能体所需的算法等应用。OpenAI CEO Sam Altman 曾放言: 未来所有数据都将变成合成数据。

作为仿真数据,合成数据服务具有几大显著优势,首要的自然是能降本增效外。根据《中国 AIGC 数据标注全景报告》显示,合成数据典型服务商代表是群核科技旗下的 Coohom Cloud (群核云) 平台。作为合成数据服务平台,Coohom Cloud (群核云) 可以将效率提升 10 倍,基于 GPU 集群并发渲染优势,每日可合成 20 万组数据,而且基于庞大的数据集优势,训练成本大大降低。

此外,合成数据可以补充更多边缘、长尾场景数据,能有效解决大模型时代下的"数据鸿沟",并自然规避掉数据隐私安全、合规等方面问题。像在数据增强、模型验证、可解释 AI 等领域,以及自动驾驶、机器人、生物医药等领域都有相关应用。量子位智库预计,合成数据将成为未来增速最快赛道,年增⻓率可达 45%。

目前,作为目前为数不多提供室内场景数据服务的代表厂商,Coohom Cloud (群核云) 能针对智能机器人、人工智能、元宇宙、智能房产、自动驾驶等不同应用场景合成 2D、3D 数据集,客户覆盖全球,服务科沃斯、追觅、美的多家海内外科技巨头公司,并与英特尔在产研等开源性项目上进行深度合作。

Coohom Cloud (群核云) 的一大优势是拥有全球最大的室内场景认知深度学习数据集,以及 Structured3D 室内环境认知数据集、RPLAN 户型结构数据集等。在底层技术创新上,群核科技的相关技术研究多次入选 SIGGRAPH、CVPR、ECCV 等国际学术顶会。在产业垂直场景中,Coohom Cloud (群核云) 已具备领先优势。

Coohom Cloud (群核云) 已有两大成熟解决方案。KoolAI 便是依托群核科技海量室内 3D 虚拟场景的 AI 训练合成数据平台,依托背靠群核科技前沿实验室,为企业提供空间场景的多样性合成数据。SE 是针对机器人尤其是室内智能机器人行业推出的云 3D 室内环境重建平台。基于云计算及云服务能力,通过真实感绘制、大规模云端计算集群及云端机器人应用程序部署及管理模块,帮助重定义云端机器人开发和仿真流程。此外,Coohom Cloud (群核云) 团队也位企业提供数据定制和专属服务,最大化满足各行业对于数据多样性的需求。

今年年初,群核科技联合英特尔实验室、西班牙计算机视觉中心、慕尼黑工业大学开发的 SPEAR 智能仿真平台正式面向开发者开放。这个真实感绘制的智能体仿真平台可帮助开发人员加快对不同智能机器人的训练和验证,并推动机器人在人机交互、数字孪生等方面的研究和应用。

随着人工智能产品应用更加多元和复杂,行业对 AI 服务的灵活性和智能化的期待也更强烈。如何为更多行业和新场景的 AI 应用提供高质量数据,这是 Coohom Cloud (群核云) 接下来深挖和探索的方向。

0