千家信息网

英特尔陈葆立:通用计算和加速计算双管齐下,全方位加速人工智能发展

发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,今日,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立在 2023 年中国国际服务贸易交易会的中国 AIGC 创新发展论坛上,发表题为"面向中国市场的英特尔 AI 战略"的演讲。陈葆立从通用计算
千家信息网最后更新 2024年11月22日英特尔陈葆立:通用计算和加速计算双管齐下,全方位加速人工智能发展

今日,英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立在 2023 年中国国际服务贸易交易会的中国 AIGC 创新发展论坛上,发表题为"面向中国市场的英特尔 AI 战略"的演讲。陈葆立从通用计算和加速计算两个维度出发,详细阐述了英特尔如何通过全面的异构产品组合以及开放的软件栈,与广泛的中国生态伙伴持续探索和创新,以把握 AI 时代机遇,创造无限可能。

陈葆立指出,"致力于创造改变世界的技术,英特尔自 1985 年进入中国以来,始终通过不断的技术变革,为中国客户创造更高价值,推动更深层的本地创新和发展。在 AI'黄金时代'的初期,凭借在芯片制造和创新领域的深厚积累,英特尔也正利用自身的行业领先优势,通过在云、网络、边缘、客户端等领域的全方位布局,为行业的持续发展提供助力。"

AI 的数据流包括广泛而复杂的工作负载和多模态数据集。而面对 AI 的计算需求,并没有一种通用的解决方案。如今,受多重技术和经济因素影响,很大一部分 AI 工作负载是在通用处理器上运行。x86 架构的大规模普及和其内置的 AI 能力使通用处理器已经成为解决 AI 数据流的理想解决方案。

基于此,英特尔在企业级硬件方面,打造内置英特尔 ® 高级矩阵扩展(英特尔 ®AMX)加速引擎的第四代英特尔 ® 至强 ® 可扩展处理器,提供比上一代高达 10 倍的 AI 推理和训练性能提升,并实现对大多数大型 AI 模型,包括实时、中等吞吐量、低延迟稀疏推理,以及中、小型规模的训练和边缘推理的支持。此外,还通过广泛的生态系统、专用于简化流程的软件工具以及优化的编译器,让客户能够更轻松部署英特尔解决方案,以及持续对更高级别软件堆栈的投入,如 oneAPI 和 OpenVINO,让开发者更轻松地使用其所熟悉的 AI 框架。

基于集成英特尔 ®AMX 的第四代英特尔 ® 至强 ® 可扩展处理器,百度也打造自身的人工智能自然语言处理模型 ERNIE-Tiny。这款百度在飞桨文心大模型核心产品上推出的轻量化版本,在引入英特尔 ®AMX 之后,整体推理性能得到多倍提升,同时也使其在通用 CPU 平台上获得令人满意的推理效能,从而能进一步扩大普范围,帮助更多用户在既有 IT 设施中更为方便地部署文心模型。

而面临爆炸式增长的个人电脑 AI 应用,英特尔在提供强大硬件的同时,也通过可扩展的软件栈加持,让更多开源模型能够运行在个人的客户端上。一方面,第 13代英特尔 ® 酷睿 Ô 处理器通过 XPU 加速、低位量化、软件优化以及对 16GB 及以上内存容量的支持,使得高达 160 亿参数的大型语言模型能够通过 BigDL-LLM 框架在个人电脑上运行。而英特尔 ® 锐炬 ®Xe 显卡和英特尔锐炫 Ô 显卡通过硬件优化和精度控制,能够稳定地支持 FP16 精度的深度学习模型推理。这对于加速深度学习工作负载,提高计算效率具有重要意义。另一方面,英特尔亦通过可扩展的软件栈支持通用 AI 框架,使得用户可以轻松地在不同框架中进行模型推理。

尽管英特尔至强 ® 可扩展 ® 处理器可以运行诸多 AI 工作负载,但为支持更大的模型规模和满足广泛的系统需求,需要采用异构计算的方法,使用不同的计算架构。对于这些应用场景,英特尔 ® 数据中心 GPU Max 系列和 Gaudi 深度学习加速器可提供硬件支持。其中,英特尔全新 Gaudi2 处理器于今年 7 月面世中国市场。作为英特尔从云到端产品组合的重要组成,为深度学习而生的 Gaudi2 致力于以多方位性能与能效比提升,加速 AI 训练及推理。值得注意的是,其出色的性能表现亦在近期公布的 MLCommons® MLPerf® 基准测试 1 中得到充分验证,与其他同类产品相比,是大规模部署 AI 的更优解。而得益于 SynapseAI® 软件套件的优化,Gaudi2 在简化模型的开发和迁移方面也独具优势。

一直以来,英特尔始终在中国积极推动技术转型,不仅加速 PC 在中国的普及率,也通过与广大本地生态伙伴的深入合作,推动云计算和边缘计算发展,赋能行业的数字化转型。在人工智能浪潮呈席卷之势的当下,英特尔也将利用自身的深厚积淀与前沿洞察,与生态伙伴一同紧抓行业发展新机遇,为 AI 在中国的全面绽放注入源源不断的动力。

0