千家信息网

10 分钟 Whisper 模型处理测试:英伟达 RTX 4090 比苹果 M3 Max 慢 86%

发表于:2024-11-17 作者:千家信息网编辑
千家信息网最后更新 2024年11月17日,CTOnews.com 12 月 14 日消息,开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 M
千家信息网最后更新 2024年11月17日10 分钟 Whisper 模型处理测试:英伟达 RTX 4090 比苹果 M3 Max 慢 86%

CTOnews.com 12 月 14 日消息,开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 MLX 框架后训练 AI 能力,并对比了英伟达的 RTX 4090 显卡。

Wehrens 使用 OpenAI 的语音识别模型 Whisper 进行测试,主要测量转录 10 分钟音频文件所需时间。

测试结果显示 M1 Pro 处理音频时间需要 216 秒,英伟达 RTX 4090 显卡处理时间需要 186 秒。

而具有 76 个 GPU 的 M2 Ultra 和具有 40 个 GPU 的 M3 Max 处理性能更为优秀,分别为 95 秒和 100 秒。

此外苹果 Apple Silicon 芯片功耗也更为优秀。英伟达 RTX 4090 在运行状态下,比闲置状态下高出 242W。

而配备 M1 Pro 芯片在运行状态下,仅比闲置状态下高出 38W。

CTOnews.com此前报道,MLX 框架特点如下:

  • 熟悉的 API:Python 和 C++ API 具有熟悉的框架,如 NumPy 和 PyTorch,使经验丰富的研究人员易于学习。

  • 轻松高效:MLX 使用可组合的功能转换来优化 Apple Silicon 的性能。

  • 延迟计算:能够防止不必要的计算并提高资源效率。

  • 动态设计:能够适应输入形状变化,简化了调试和测试过程。

  • 软硬结合:MLX 无缝利用苹果设备的 CPU 和 GPU,确保用户能够充分利用硬件。

  • 统一内存优势: MLX 利用苹果统一内存,能够进一步加强数据移动速度

  • 研究人员友好:MLX 专为研究人员设计。

相关阅读:

《苹果推出 MLX 深度学习框架:专为 Apple Silicon 优化,可实现"软硬结合"》

0