10 分钟 Whisper 模型处理测试:英伟达 RTX 4090 比苹果 M3 Max 慢 86%
CTOnews.com 12 月 14 日消息,开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 MLX 框架后训练 AI 能力,并对比了英伟达的 RTX 4090 显卡。
Wehrens 使用 OpenAI 的语音识别模型 Whisper 进行测试,主要测量转录 10 分钟音频文件所需时间。
测试结果显示 M1 Pro 处理音频时间需要 216 秒,英伟达 RTX 4090 显卡处理时间需要 186 秒。
而具有 76 个 GPU 的 M2 Ultra 和具有 40 个 GPU 的 M3 Max 处理性能更为优秀,分别为 95 秒和 100 秒。
此外苹果 Apple Silicon 芯片功耗也更为优秀。英伟达 RTX 4090 在运行状态下,比闲置状态下高出 242W。
而配备 M1 Pro 芯片在运行状态下,仅比闲置状态下高出 38W。
CTOnews.com此前报道,MLX 框架特点如下:
熟悉的 API:Python 和 C++ API 具有熟悉的框架,如 NumPy 和 PyTorch,使经验丰富的研究人员易于学习。
轻松高效:MLX 使用可组合的功能转换来优化 Apple Silicon 的性能。
延迟计算:能够防止不必要的计算并提高资源效率。
动态设计:能够适应输入形状变化,简化了调试和测试过程。
软硬结合:MLX 无缝利用苹果设备的 CPU 和 GPU,确保用户能够充分利用硬件。
统一内存优势: MLX 利用苹果统一内存,能够进一步加强数据移动速度
研究人员友好:MLX 专为研究人员设计。
相关阅读:
《苹果推出 MLX 深度学习框架:专为 Apple Silicon 优化,可实现"软硬结合"》
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售