千家信息网

vivo 大模型云端方案现身 C-Eval,部分指标接近 GPT-4

发表于:2024-10-17 作者:千家信息网编辑
千家信息网最后更新 2024年10月17日,感谢CTOnews.com网友 软媒新友2064893 的线索投递!CTOnews.com 8 月 15 日消息,继华为小艺、小米小爱同学、OPPO 小布助手升级 AI 大模型能力之后,vivo 也准
千家信息网最后更新 2024年10月17日vivo 大模型云端方案现身 C-Eval,部分指标接近 GPT-4
感谢CTOnews.com网友 软媒新友2064893 的线索投递!

CTOnews.com 8 月 15 日消息,继华为小艺、小米小爱同学、OPPO 小布助手升级 AI 大模型能力之后,vivo 也准备在大模型领域发力。

目前,华为、小米、OPPO 相关大模型以及全新智能助手已经开始或即将开始测试,而现在,vivo 自研大模型云端方案也已经出现在 C-Eval 排行榜上,可能会在 OriginOS 4 中为 Jovi 助手带来不一样的东西。

CTOnews.com注:C-Eval 是一个全面的中文基础模型评估套件。它包含了 13948 个多项选择题,涵盖了人文、社科、理工以及其他专业四个大方向,包括 52 个不同的学科和四个难度级别。

从 C-Eval 给出的信息来看,vivo_Agent_LM_7B 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,从命名不难看出它有着 70 亿参数。

只看最终结果的话,vivo_Agent_LM_7B 最终得分为 64.4 分,位列 C-Eval 第五名,与第二名的 GPT-4 十分接近,甚至在人文领域更强,而且在社会科学领域也有不错的表现。

相关阅读:

《雷军:小米 4 月组建大模型团队,新版小爱同学今日起开启邀请测试》

《OPPO 小布助手将具备 AI 大模型能力,基于 AndesGPT》

《AI 大模型赋能 HarmonyOS 4 全新小艺,华为余承东:坚持 AI 辅助而不是 AI 替代》

0