腾讯参与制定 Vulkan 矩阵扩展标准,推动机器学习加速计算发展
随着人工智能技术的发展,机器学习应用场景越来越广泛,从智能语音助手到自动驾驶,从智能推荐到图像识别,都需要大量的计算资源来支持。而 GPU 作为一种高效的计算资源,越来越受到关注,成为机器学习加速计算的重要工具。然而,跨硬件通用加速缺乏跨平台跨硬件的通用 API,不同显卡实现高效算子十分困难和复杂。
作为头部科技企业,腾讯一直致力于推动人工智能技术的发展。因此,腾讯作为 khronos 会员积极参与新扩展标准制定,为机器学习加速计算提供更好的解决方案。在 Vulkan 1.3.255 版本中,腾讯联合 ARM、NVIDIA、AMD、Google 等诸多全世界科技企业一起带来新扩展 VK_KHR_cooperative_matrix,这是腾讯首次参与 khronos 标准贡献。
Vulkan 是通用的、跨平台的、新一代图形加速 API,支持 Windows、Linux、macOS、Android、iOS 等多个操作系统。VK_KHR_cooperative_matrix 扩展为 Vulkan 带来中尺度矩阵类型,用于加速矩阵计算,加速神经网络推理。这一新扩展使得非单一硬件绑定的通用 AI 计算加速成为可能,打破了行业垄断,带来了产业创新。Nvidia、ARM、AMD 等显卡厂商将发布新驱动支持这个扩展标准,这将进一步推动机器学习加速计算的发展。
在 VK_KHR_cooperative_matrix 扩展标准的制定中,腾讯优图实验室参与制定。在标准修订过程中,腾讯优图实验室结合 ncnn 项目中的 vulkan 加速实践经验,主张新标准中的矩阵加载函数的 stride 参数允许为 0,以便支持自动广播行为。这一参数能有效提升神经网络卷积和线性层计算中的 bias 数据处理效率。腾讯优图实验室专家,业界知名的开源神经网络推理库 ncnn 作者 nihui 表示:"khronos 在线会议中,该提议获得各参与厂商技术人员认可和赞同,并成为硬性标准之一,要求在 GPU 驱动中实现该行为。"
ncnn 使用 Vulkan API 作为其跨平台 GPU 通用加速方案。ncnn 通过使用 VK_KHR_cooperative_matrix 扩展,在 AMD 显卡上跑超分 AI,速度提升约 2.3 倍。这也是 VK_KHR_cooperative_matrix 的首次应用,已发布在 ncnn 新版本中,带来更广泛的跨硬件厂商 GPU 加速。
腾讯参与制定 VK_KHR_cooperative_matrix 扩展标准,推动人工智能技术的发展,让机器学习的计算能力更加高效、普惠和可持续,为机器学习加速计算提供了更好的解决方案,实现跨平台跨硬件的通用 API,使得机器学习加速计算更加高效、灵活。
一直以来,腾讯也在积极参与各类 AI、大模型等方面的标准建设。2020 年,腾讯被选举为全国信标委人工智能分委会委员兼副秘书长单位,这意味着国家在推进包括人工智能在内的"新基建"过程中,腾讯正作为核心成员,承担更多标准制定工作以及技术引领作用。前不久,腾讯云还联合中国信通院发起行业大模型生态计划,并牵头国内首个金融行业大模型标准制订,为金融行业智能化的高质量规范化发展提供重要支撑。
未来,腾讯将积极参与更多行业标准制定,助力更多行业提质增效,为人类社会带来更多的福祉。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售