浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
发表于:2024-11-26 作者:千家信息网编辑
千家信息网最后更新 2024年11月26日,感谢CTOnews.com网友 航空先生 的线索投递!CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026
千家信息网最后更新 2024年11月26日浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
感谢CTOnews.com网友 航空先生 的线索投递!
CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026 亿、518 亿、21 亿等三种参数规模的模型。
据介绍,源 2.0 通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比。为了获取中文数学数据,浪潮信息清洗了从 2018 年至今约 10PB 的互联网数据,但仅获取到了约 10GB 的数学数据。
为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源 2.0 采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量。
算力方面,源 2.0 采用了非均匀流水并行的方法,综合运用流水线并行 + 优化器参数并行 + 数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题。
源 2.0 在评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源 2.0 整体表现处于中上水平。
源 2.0 采用全面开源策略,全系列模型参数和代码均可免费下载使用。CTOnews.com附 GitHub 页面和论文链接:
代码开源链接:
https://github.com/IEIT-Yuan/Yuan-2.0
论文链接:
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf
数据
模型
代码
数学
参数
流水
论文
链接
信息
基础
浪潮
浪潮信息
中英
互联网
方法
方面
显存
策略
质量
问题
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发快速挣一元
教育系统网络安全周
荔枝app直播软件开发安装
虚拟技术云服务器
网络安全外部防护
叙述如何做好网络安全工作
服务器phpstudy
南通阿里巴巴网络技术招聘
数据库批量查询字段脚本
dayz独立版搜索服务器
杭州极7网络技术有限公司
军营网络安全小图标
网络安全模式的word没有中文
包头市app软件开发培训
怎么和数据库建立连接
深圳网络安全评估研发
pt4数据库安装
数据库外键指向自身字段
深圳市千途网络技术有限公司
服务器备案多久能查到
德兴蜂窝软件开发有限公司
服务器系统用光盘好装么
中国数据库学术会议 ndbc
服务器访问不了3306端口
我的世界手游模组生存服务器
小学五年级网络安全演讲稿
互联网科技公司跑路
计算机网络技术在校实践
国家统计局数据库
网络安全黑板报的句子
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售