千家信息网

AI 公司“零一万物”回应 Yi 开源大模型“抄袭 LLaMA”事件:承认做法不妥,将修改争议张量名

发表于:2024-09-22 作者:千家信息网编辑
千家信息网最后更新 2024年09月22日,CTOnews.com 11 月 15 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司"零一万物",该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研
千家信息网最后更新 2024年09月22日AI 公司“零一万物”回应 Yi 开源大模型“抄袭 LLaMA”事件:承认做法不妥,将修改争议张量名

CTOnews.com 11 月 15 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司"零一万物",该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。

不过在 Yi-34B 的 Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了 Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改,分别为 input_layernorm 和 post_attention_layernorm。

"零一万物" 公司昨日正式公开回应了此事,该公司开源团队总监 Richard Lin 承认了修改 Llama 张量名称的做法不妥,将会按照外界建议把"修改后的张量名称从 Yi 改回 LLaMA"

Richard Lin 声称,这一命名问题是开发人员疏忽导致,开发人员在代码中进行了几次重命名,以满足实验要求。但是开发人员"忘记将张量名称修改回 LLaMA",开发人员对此感到抱歉。

Richard Lin 同时邀请开发者 ehartford 提交包含上述改动的 PR,以对 Yi 的张量名称进行重命名以符合 Llama 架构。

不过截至CTOnews.com发稿,另一名开发者 JosephusCheung 声称,既然官方已经宣布修改 Yi 大模型的张量名称,那么开源大模型 Yi 便是 LLaMA 的衍生作品,而这显然构成了许可证冲突,因为代码的推理部分和模型定义都是"LLaMA"的一部分

JosephusCheung 声称,"零一万物"必须修订有关商业用途的条款,此外如果模型每月活跃用户超过 7 亿,必须向 Meta 申请许可规定,此外,"Yi 系列模型及其相关知识产权所有权仅由许可方持有"的条款将不再有效,因为该模型的知识产权将由 Meta、Yi 等公司共同拥有。Richard Lin 暂未对此进行回复。

相关阅读:

  • 《李开复旗下 AI 公司"零一万物"开源 Yi 大模型被指抄袭 LLaMA》

  • 《消息称阿里云领投李开复 AI 公司,"零一万物"Yi 开源大模型公布》

0