苹果推出 DeepPCR 算法:加速神经网络训练和推理能力
CTOnews.com 12 月 16 日消息,苹果公司近日发布了 DeepPCR 机器学习算法,通过并行处理常规顺序操作,可以加速神经网络的推理和训练。
神经网络已能处理文本或图片合成、分割和分类等复杂任务。不过由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。
神经网络处理过程中,目前广泛采取并行化技术,可以加速训练和推理速度。
不过神经网络中的一些操作仍然是按顺序完成的,扩散模型通过一系列的去噪阶段生成输出,并且逐层进行向前和向后传递,随着步骤数的增加,这些进程的顺序执行在计算上变得昂贵,可能会导致计算瓶颈。
苹果公司科研团队为了解决这个问题,推出了 DeepPCR 算法,进一步加速了神经网络的训练和推理。
该团队采用了平行循环还原(PCR)算法来检索该解决方案,将顺序过程的计算成本从 O(L)降低到 O(log2 L),降低了复杂性,提高了运行速度。
团队表示多层感知器中部署 DeepPCR 算法之后,并行化前向和后向通过,实现了最高 30 倍的前向传递速度和最高 200 倍的向后传递速度。
CTOnews.com附上 DeepPCR 算法主要结论如下:
DeepPCR 是一种用于在神经网络训练和推理中并行化顺序过程的创新方法。它的主要特点是能够将计算复杂度从 O(L) 降低到 O(log2 L),其中 L 是序列长度。
DeepPCR 已用于并行化多层感知器 (MLP) 中的前向和后向传递,还对该技术的性能进行了广泛的分析,以确定该方法的高性能状态,同时考虑基本设计参数。
DeepPCR 已被用于加速 MNIST 上的深度 ResNet 训练,以及在 MNIST、CIFAR-10 和 CelebA 数据集上训练的扩散模型的生成。结果表明,虽然 DeepPCR 显示出显著的加速,将 ResNet 训练的数据恢复速度提高了 7×,扩散模型创建速度提高了 11×。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售