浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,感谢CTOnews.com网友 航空先生 的线索投递!CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026
千家信息网最后更新 2025年02月03日浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
感谢CTOnews.com网友 航空先生 的线索投递!
CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026 亿、518 亿、21 亿等三种参数规模的模型。
据介绍,源 2.0 通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比。为了获取中文数学数据,浪潮信息清洗了从 2018 年至今约 10PB 的互联网数据,但仅获取到了约 10GB 的数学数据。
为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源 2.0 采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量。
算力方面,源 2.0 采用了非均匀流水并行的方法,综合运用流水线并行 + 优化器参数并行 + 数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题。
源 2.0 在评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源 2.0 整体表现处于中上水平。
源 2.0 采用全面开源策略,全系列模型参数和代码均可免费下载使用。CTOnews.com附 GitHub 页面和论文链接:
代码开源链接:
https://github.com/IEIT-Yuan/Yuan-2.0
论文链接:
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf
数据
模型
代码
数学
参数
流水
论文
链接
信息
基础
浪潮
浪潮信息
中英
互联网
方法
方面
显存
策略
质量
问题
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
怎么查看服务器的远程软件
计算机网络技术方向就业前景
都江堰住宿软件开发
梦幻西游电脑版那个服务器人多
北京智能软件开发诚信合作
华为网络技术工程师薪水
兼职软件开发教程
服务器运行软件
网络安全法第42条解读
先尚服务器
二手ibm服务器视频
abap数据库
python读数据库中汉字
软件开发取费标准说明
计算机三级网络技术报文分析
查询数据库是否有这条数据
服务器显示精密空调故障
javaDerty数据库
ip地址和服务器有什么关联
多样化网络技术
我的世界开服服务器配置
控制网络技术作为
好歌曲数据库
网络安全运行监视及值班制度
我的世界服务器要加的模组
戴尔服务器阵列配置
网络安全宣传四进
软件开发的简历下载
cnc数据库设计规范考题
小学网络安全责任制检查考核制度
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售