可并行运行 128 个 LLaMA 2 7B 流,开发者测试苹果 M2 Ultra 芯片模型推理表现
发表于:2024-11-25 作者:千家信息网编辑
千家信息网最后更新 2024年11月25日,CTOnews.com 10 月 13 日消息,据 Y Combinator 论坛消息,名为 Georgi Gerganov 开发者日前使用苹果 M2 Ultra 芯片,进行了一系列 LLaMA 模型
千家信息网最后更新 2024年11月25日可并行运行 128 个 LLaMA 2 7B 流,开发者测试苹果 M2 Ultra 芯片模型推理表现▲ 图源 Georgi Gerganov 在 GitHub 披露的测试表现 ▲ 图源 Georgi Gerganov 在 GitHub 披露的测试表现 ▲ 图源 Y Combinator ▲ 图源 苹果官网
CTOnews.com 10 月 13 日消息,据 Y Combinator 论坛消息,名为 Georgi Gerganov 开发者日前使用苹果 M2 Ultra 芯片,进行了一系列 LLaMA 模型推理测试,测试显示该芯片在并行运行 128 个 Llama 2 7B 流时,效果较佳。
据悉,LLaMA 模型推理测试强调内存带宽,而非计算能力,而苹果的 M2 Ultra 芯片号称"内存带宽达 800GB/s",因此推理时效果良好。
不过虽然 M2 Ultra 芯片的内存带宽具有优势,但用户最多只能获得 192 GB RAM,用户花费 5600 美元(CTOnews.com注:国行 44999 人民币)购买搭载 M2 Ultra 芯片及 192GB 运行内存的 Mac Studio,价格足够买一台"拥有 1TB RAM、搭载 RTX 4090 的 PC"。
Georgi Gerganov 据此认为,如果用户的工作负载(如推理)不需要超过 192 GB,那么选择相关机器时可以更重视"内存带宽"表现,但如果用户有其他工作需求,则可以看看相对应价格的 PC。
参考
M2 Ultra can run 128 streams of Llama 2 7B in parallel
开发者在 GitHub 上提交的测试结果
测试
芯片
内存
推理
带宽
用户
苹果
开发者
模型
开发
运行
价格
效果
消息
工作
良好
人民
人民币
优势
据此
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器急需命令方块管理员
数据库锁的底层实现
计算机网络技术用考证吗
网络安全志愿服务鸦鸿桥
网络安全概念股迎风口
沙特服务器
桂林电子大学网络安全
c#下拉框连接数据库数据
长三角示范区国家网络安全宣传
数据库安全运维报告
手机棋牌软件开发
复仇者联盟服务器补丁
网络安全和风险的区别
南京沃购网络技术
云南弘毅志远软件开发有限公司
网络安全法律一本通
修改数据库数值语句
IP网络技术课后答案
开源系统软件开发
compute数据库
玉林游戏软件开发
防诈骗网络安全观后感300
文件下载服务器管理
网络安全从什么开始学
手机应用软件开发前10名
四叶草学考网络技术
每个玩家有一张表数据库
怎样快速查找数据库的安全性
新浪收件服务器密码错误
崇明区网络技术服务电话多少
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售