《智算中心网络架构白皮书》发布 度小满保障高性能网络稳定
近年来,随着 AI 科技的迅速发展,大模型技术在领域的应用不断加深,高性能网络的建设问题越来越成为不可忽视的存在,为了保障高性能网络的安全与稳定,度小满深入研究和探索,让高性能网络的建设由复杂变为简单。
大模型的迅速发展对高性能网络的要求日益增多
9 月 5 日,在云智大会上,智能云联合度小满推出《智算中心网络架构白皮书》。白皮书由智能云和度小满负责高性能网络落地的一线专家撰写,内容覆盖了高性能网络建设的各个方面,包括不同规模集群的架构选择、云平台上的可视化运维工具建设、多租户的运营方案设计等,为同业提供全流程指导,让复杂的高性能网络建设变得简单。
大模型需要大算力,如何建设高性能网络是其中最为关键的一步。度小满今年 5 月正式开源了国内首个千亿参数大模型 --"轩辕"。在场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了 150 次回答中 63.33% 的胜率。随着大模型的迅猛发展,模型对于底层算力的需求呈指数性增长,智能算力规模的持续扩大带来的是 GPU 算力部署规模日益膨胀,对于高性能网络的要求也日益增多。
度小满构建国内首批万卡规模智算中心
随着度小满模型参数规模超过千亿,为满足不断增加的算力需求、度小满私有云模式的智算中心也在不断升级,低时延、大带宽、稳定性运行、可运维性高的大规模智算网络正是智算中心搭建的重要基石。在建设私有云模式的智算中心的过程中,度小满联合智能云,构建了一套私有云智算网络,在支撑万卡 GPU 规模的同时,相较于业内常见的 Dragonfly、Tours 网络拓扑,网络带宽更充足,节点间跳步数更稳定性,网络延时指标缩短到 3 微秒以内,具备端到端的可观测性能力与故障自愈能力,无阻塞、低时延、高可靠的网络设计有效支撑了上层智算应用的快速迭代和发展,为"轩辕"大模型的训练提供了稳定的网络保障。
目前,度小满智算网络中心已建设成为国内行业首批私有云模式下的万卡规模智算中心,为"轩辕"大模型的训练提供了稳定的网络保障。
度小满和智能云联合推出的《智算中心网络架构白皮书》,使得高性能网络建设变得更加简单,并为整个行业注入了新的活力和动力。相信随着《智算中心网络架构白皮书》的发布,高性能网络将会在未来得到更广泛的应用和推广,推动整个行业进一步发展壮大。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售