千家信息网

70 亿 / 130 亿参数,微软研究院发布 Orca 2 LLM:性能媲美 10 倍参数模型

发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,CTOnews.com 11 月 22 日消息,微软研究院(Microsoft Research)近日发布新闻稿,推出了相比较主流语言模型更小的 Orca 2 LLM,不过依然可以回答一些复杂问题。微
千家信息网最后更新 2024年11月11日70 亿 / 130 亿参数,微软研究院发布 Orca 2 LLM:性能媲美 10 倍参数模型

CTOnews.com 11 月 22 日消息,微软研究院(Microsoft Research)近日发布新闻稿,推出了相比较主流语言模型更小的 Orca 2 LLM,不过依然可以回答一些复杂问题。

微软 Orca 2 共有 70 亿和 130 亿两种尺寸,部分融合了 Llama 2 LLM 参数,通过融合定制的高质量合成数据,提供更准确、更优秀的合成数据。

微软表示 Orca 2 使用扩展的、高度定制的合成数据集进行训练。Orca 2 支持分步处理、回忆然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术,同时还能为不同的任务选择不同的解决方案策略。

Orca 2 模型相比较 Llama 2 和 WizardLM 等大型语言模型,在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解等方面更为优秀。

微软表示:"我们的初步结果表明,Orca 2 的性能明显优于类似尺寸的模型。它还达到了与至少大 10 倍的模型相似或更好的性能水平,展示了为较小模型配备更好推理能力的潜力。"

CTOnews.com附上微软 Orca 2 模型的介绍链接,感兴趣的用户可以深入阅读。

0