百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”
发表于:2024-10-03 作者:千家信息网编辑
千家信息网最后更新 2024年10月03日,CTOnews.com 9 月 6 日消息,百川智能今日召开主题为"百川汇海,开源共赢"的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13
千家信息网最后更新 2024年10月03日百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”▲ 图源"百川智能"公众号,下同 ▲ 7B 参数模型的 Benchmark 成绩 ▲ 13B 参数模型的 Benchmark 成绩
CTOnews.com 9 月 6 日消息,百川智能今日召开主题为"百川汇海,开源共赢"的大模型发布会,正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。
百川智能此次还开源了模型训练的 Check Point,并宣布将发布 Baichuan 2 技术报告,详细介绍 Baichuan 2 的训练细节,CTOnews.com附 Baichuan 2 下载地址:https://github.com/baichuan-inc/Baichuan2
据百川智能官方介绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%,逻辑推理能力提升 25%,语义理解能力提升 15%。
在 MMLU、CMMLU、GSM8K 等基准测试中,百川智能的两个模型都比 LLaMA 2 的分数要高一些,且在"中文通用"部分优势较大。
Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
模型
百川
智能
能力
商用
训练
安全
两个
代码
参数
发布会
官方
成绩
数学
语义
逻辑
逻辑推理
推理
显著
较大
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全防范什么
服务器通过跳板机访问外网
企业微信软件开发
网络安全座谈会上的发言提纲
倩女幽魂彼岸花是哪个服务器
软件开发模式分类
软件开发怎么加工
两个进程连同一个数据库
更新数据库失败原因
江西华霖网络技术有限公司
数据库原理与技术实验3
数据库 and
诊所网络安全和信息化自查报告
天下电子书读取服务器失败
快手显示服务器无法访问
什么大学游戏软件开发好
网络安全隐私事件
广州银行用的服务器是哪家的
网络安全制度约束
网络安全观后感心得
网销通网络技术有限公司怎么样
在职读研网络安全
数据库单招考试题
软件开发的票谁能开
谷粒公社互联网科技
金蝶账套连接数据库出现问题
软件开发测试是干什么的
网络安全级别达不到
龙岩网络技术有限公司
修改数据库表系统时间
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售