清华 ChatGLM-6B 和 ChatGLM2-6B 模型允许免费商用
CTOnews.com 7 月 15 日消息,智谱 AI 及清华 KEG 实验室决定,ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用,登记地址点此进入。
CTOnews.com此前报道,清华 NLP 团队于 3 月 14 日发布了中英双语对话模型 ChatGLM-6B,初具问答和对话功能。该模型基于 General Language Model(GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
ChatGLM2-6B 模型于 6 月 25 日发布,在保留了初代模型对话流畅、部署门槛较低等特性的基础之上,又增加许多新特性:
更强大的性能:ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升。
更长的上下文:上下文长度由 ChatGLM-6B 的 2K 扩展到了 32K。
更高效的推理:推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。
更开放的协议:ChatGLM2-6B 权重对学术研究完全开放。
ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度,同时也降低了生成过程中 KV Cache 的显存占用。同时,ChatGLM2-6B 采用 Causal Mask 进行对话训练,连续对话时可复用前面轮次的 KV Cache,进一步优化了显存占用。
- 上一篇
苏宁易购半年度业绩预告:归母净利亏损 15-20 亿元,同比减亏 27.03%- 45.27%
感谢CTOnews.com网友 航空先生 的线索投递!CTOnews.com 7 月 15 日消息,苏宁易购发布 2023 年半年度业绩预告,归属于母公司股东净利润亏损 15-20 亿元,同比减亏27
- 下一篇
《合金弹头》等 1300 款经典游戏,首款第三方云游戏平台 Antstream Arcade 登陆 Xbox
感谢CTOnews.com网友 华南吴彦祖 的线索投递!CTOnews.com 7 月 15 日消息,Antstream Arcade 平台将于 7 月 20 日登陆 Xbox 游戏主机,标志着首款第
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售