IBM NorthPole 芯片测试:比常用的 12nm GPU 和 14nm CPU 能效高 25 倍
CTOnews.com 11 月 12 日消息,IBM 的 NorthPole 架构芯片已经开发了近十年,现在已经越来越完善、越来越强大。
官方现在通过《科学》杂志发表了一组 NorthPole 的基准测试结果,堪称是一个新的里程碑。
根据对 ResNet-50 模型的测试,基于 TrueNorth 架构的 12 纳米芯片比常用的 12 纳米 GPU 和 14 纳米 CPU 能效比高 25 倍。
据 IBM 称,NorthPole 在延迟和计算所需的空间方面也表现更好,超过了所有主流架构,包括基于 4 纳米工艺的 GPU。
那么,它是如何实现这一成果的呢?因为它 256 个核心本身就集成了一块内存芯片而无需单独连接,NorthPole 用于 220 亿个晶体管,其每个核心都可以执行 2048 个运算。
该公司称,其架构消除了冯・诺依曼瓶颈,该瓶颈围绕着大多数系统中 CPU 和 RAM 之间数据传输引起的延迟。因此,它可以比市场上最好的 GPU(包括 Nvidia 最强 AI 显卡)运行得更快。
IBM 研究部门的 Dharmendra Modha 表示:"从架构上看,NorthPole 模糊了计算和内存之间的界限。在单个核心层面上,NorthPole 表现为接近内存的计算;而在芯片外部的输入输出层面上,它表现为主动内存。"
CTOnews.com注意到,AMD 也探索了类似的技术,并成功将内存和计算结构集成到单个组件中。上个月,Xilinx 便展示了其 Virtex XCVU7P 卡,其中包括八个内存加速器模块。
据介绍,IBM 在其 NorthPole 芯片中为每个计算核心的添加了内存芯片,他们认为这个组件非常适合新兴的 AI 用例,包括与计算机视觉相关的用途。此外,它还经过了自然语言处理和语音识别方面的测试。NorthPole 还适用于边缘应用,这些应用可实时处理大量数据。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售