台北电脑展观察:AI PC,谁能接住这“泼天富贵”

  在接连甩出“大招”后,英伟达、英特尔、AMD 在台北电脑展上一系列的重磅发布,让三雄之争愈加白热化。

  除在 AI 重镇难以让英伟达“独美”的悍将 AMD、英特尔相继发布了对标竞品 MI300 系列、Gaudi 3 系列之外,围绕 AI PC 领域的擂台赛也再次开打,尤其是英伟达携深厚的生态积累染指 AI PC 的 CPU 市场,三强的全面战役也再次升级。

  GPU 对决激烈

  在 GPU 界一骑绝尘的英伟达率先发布了一年升级一代 GPU 的蓝图,黄仁勋在演讲中宣布在 3 月 GTC2024 大会重磅发布的 Blackwell 架构现已开始投产,预计将于 2024 年晚些时候正式发货,而下一代 Blackwell Ultra GPU 将于 2025 年推出。

  不止如此,再下一代 AI 平台名为“Rubin”,将于 2026 年发布,Rubin 架构将首次支持 8 层 HBM4 高带宽存储。随后在 2027 年将推出 Rubin Ultra GPU,将集成 12 颗 HBM4 版本。同时,英伟达也展示了代号“Vera”强大的新 CPU,将与 Rubin GPU 同时推出,将组成 Vera Rubin 超级芯片,取代当前的 Grace Hopper。

  紧随之后,AMD 也公布了新一代 AI 芯片。据 AMD CEO 苏姿丰介绍,其最新发布的 AI 芯片 Instinct MI325X,计算性能是英伟达上一代 H200 的 1.3 倍,计划于 2024 年四季度上市。

  英特尔 CEO 基辛格(Pat Gelsinger)在主题演讲中强调,英特尔将在 AI 扩张中发挥重要作用。Guadi 3 作为英特尔今年 4 月推出的最新一代 AI 芯片,也计划于今年第三季度大范围上市。

  在性能层面,相比英伟达 H100,Gaudi 3 的 AI 推理性能平均提高 50%,能效平均提高 40%。基准测试中,Gaudi 3 可以在 Llama2-7B、Llama2-13B 模型中将训练时间缩短到英伟达 H100 的一半,同时推理吞吐量也比后者平均高出了 50%。

  基辛格认为,高性价比是 Gaudi AI 芯片的竞争优势。一套包含 8 个上一代 Gaudi 2 加速器的套件售价为 6.5 万美元,而包含 8 个 Gaudi 3 加速器的套装售价 12.5 万美元,按一台服务器配备 8 张芯片换算,每张 Guadi3 芯片约为 1.5 万美元。根据定制服务器供应商 Thinkmate 的数据,配备 8 颗英伟达 H100 AI 芯片的类似 HGX 服务器系统的成本可能超过 30 万美元。

  Gartner 此前预测,2024 年全球 AI 芯片市场将增长 33% 达到 713 亿美元,2025 年将再继续增长 29%。有分析称,随着 AMD、英特尔的追赶,AI 芯片市场格局或将在未来两年内发生新的变化。

  但要看到的是,英伟达在生成式 AI 时代一骑绝尘,绝不只是 GPU 的威力,而是积数年之功,打造的 CUDA、NVlink、InfiniBand 和以太网全平台体系,构建了无坚不摧的“全武行”。英特尔、AMD 想要在这一市场撕开一道大口子,后续如何在生态、互联设计和能力上持续投入和优化将更是重中之重。

  一年升级一代

  尽管目前市场的厮杀声不绝于耳,但未来的竞夺则更是刀光剑影,为持续巩固战果,巨头们已着力将芯片迭代速率从“两年一迭代”升级到恐怖地一年一换血。

  黄仁勋就着重说,英伟达将以“一年一代”的节奏推出新的 AI 芯片,目前这些芯片都处于 100% 的全面开发阶段。无论采用何种工艺、封装、内存、光学技术等等,英伟达将一切推向技术极限,所有芯片都 100% 兼容,丰富的软件也将持续扩容。

  且不仅仅是 GPU,而是构建整个平台,将整个平台集成到 AI 超级工厂中,以一年一个的节奏构建数据中心规模。

  而在迭代节奏上,AMD 也不甘示弱提出要保持“一年一迭代”的速度,与对手保持同频。

  按照此规划,自从 AMD 于 2023 年 6 月首次推出 MI300AI 芯片后,每年都会推出一个新的产品系列,今年将推出采用第四代 HBM3E 的 MI325X 芯片,内存带宽提高一倍,效能提升 1.3 倍。2025 年将推出基于新的 CDNA 4 架构的 MI350 系列,2026 年再推出 MI400 系列。

  相较之下,英特尔更是以实际行动来打擂台:除四年五个节点顺利推进之外,至强处理器甚至达到了半年一升级的程度,在去年 7 月推出全新的 Gaudi2 处理器之后,今年 4 月即升级到 Gaudi3,惊人的速度背后也显现出半导体行业竞争的残酷程度只增不减。

  无疑,这对巨头们架构、工艺、封装、软件和互联的考验也将全面升级。

  AI PC 开启新角逐

  被称为 AI PC 元年的 2024 年,也让 AI PC 市场成为三强的新战场。

  据 Gartner 最新发布的预测报告显示,2023 年全球 AI 芯片销售收入为 536 亿美元,2024 年将同比增长 33% 至 710 亿美元,来自 AI PC、汽车和其他通用计算机设备的 AI 芯片收入将达 334 亿美元。AI PC 将会引领 2024 年以后的 AI 芯片收入增长,预测 2026 年 AI PC 渗透率将达 100%。

  在这一领域最有话语权的英特尔自然大张旗鼓,在台北电脑展上高调发布了 Lunar Lake 处理器,相比上一代产品 AI 性能提升 3 倍,功耗降低了 40%,将于今年第三季度正式亮相。其中一大亮点是,英特尔将两层 LPDDR5X-8500 内存直接封装集成,配置为 16GB 或 32GB。这一设计变革能够使数据传输负载降低大约 40%,从而大幅提升数据处理效率和速度。

  英特尔还提到,对于有更多内存需求的客户来说,英特尔将于今年晚些时候发布 Arrow Lake 应对,并预计明年还将升级为 Panther Lake。此外,英特尔还推出了 AI PC 开发套件,搭载 Lunar Lake 处理器、32GB LPDDR5 内存、512GB 存储等,这一套件后续也将升级支持未来的 Panther Lake。

  在 PC CPU 领域表现强劲的 AMD,此番则带来全新 AMD 锐龙 AI 300 系列处理器,再一次树立了 AI PC 的新标杆。

  此款处理器不仅升级 Zen 5 架构,还有升级版 RDNA3.5 架构的 GPU 和基于 XDNA 2 架构打造的全新 NPU 助阵,带来倍增的 AI 性能、大幅增强的传输效率和带宽以及快速的大模型响应速度,与同侪相比多项指标表现优异。此外,在 2024 年中将有 150+ 的 AI ISV 提供商会对 Ryzen AI 引擎提供支持,这也意味着搭载锐龙 AI 300 移动处理器的笔记本将使用到这些强大的 AI 应用功能,这让 AMD 在 AI PC 这条竞争激烈的新赛道中,又向前迈了一大步。

  尽管英伟达已接住“泼天的富贵”,但面临 AI PC 的巨大机遇当然不会错过这一趟新列车。英伟达以其在云端 AI 领域的统治地位,面对生成式 AI 开始从云端进入到边缘端的趋势,凭借其强大的 GPU 能力、近年来在自研 Grace Arm CPU 上积累的经验以及与产业链多年来的深度合作,也在全力挺进 AI PC 处理器领域。

  有传言称,英伟达着手将推出将下一代 Arm Cortex CPU 内核与其 Blackwell GPU 内核相结合的芯片,主要面向 Windows on Arm 的 AI PC 领域。

  在 AI PC 这一赛道中,英特尔已然处于领先位置。有数据显示,到 2024 年第一季度,英特尔交付的 AI PC 处理器已超过所有竞争对手的总和。不过,在一年升级一代的指引下,未来的变数仍将丛生。