减少依赖英伟达,字节跳动据称联手台积电自研5nm AI芯片,到2026年量产

  本文作者:李丹

  来源:硬 AI

  人工智能(AI)领域的竞争如火如荼,提供大语言模型(LLM)算力的英伟达 AI 芯片又供不应求,字节跳动可能要推出自己的芯片,减少对英伟达产品的依赖。

  据科技媒体 The Information 报道援引知情者消息称,字节跳动在同英伟达高级芯片的重要代工伙伴台积电合作,计划到 2026 年联产两款基于 5 纳米(nm)工艺的自研 AI 芯片,目前处于设计阶段,未来字节的计划还可能有变。

  报道称,5nam 工艺仅比台积电最先进的 3nm 工艺落后一代,和英伟达将要出货的旗舰 AI 芯片——Blackwell 架构芯片采用的是同一代工艺。自家芯片可能减少字节跳动在开发和运营 AI 模型方面对高价英伟达芯片的依赖。

  在国内竞争激烈且美国加强出口限制之际,对字节跳动等推出 LLM 的中国科技企业来说,降低芯片成本变得至关重要。报道提到,今年字节跳动已订购了 20 余万块英伟达 H20 芯片,价值超过 20 亿美元,还在等待全部交货。字节计划让台积电代工数十万快自研的训练和推理芯片,成本将比从英伟达购买低数十亿美元。

  至于为何字节跳动可能如此大幅降低成本,报道指出,H20 的性能只有英伟达热销先进芯片 H100 的四分之一。美国目前的出口限制针对单个芯片的性能,但未这样限制芯片集群,国内厂商需要购买更多的 H20 达到和 H100 同等算力的单个集群效果。字节跳动希望,在成本大致相同的情况下,自有芯片驱动的集群能实现四倍于单个 H100 芯片的计算性能。

  字节跳动和英伟达都未回应以上报道。此前消息显示,包括字节在内的中国互联网大厂今年都在大手笔订购英伟达的芯片,同时积极开发自研 AI 芯片。

  上月金融时报报道称,百度、字节跳动、腾讯和阿里巴巴已向英伟达共订购价值 10 亿美元的 A800 处理器,这些中国企业还购买了价值 40 亿美元的 GPU,均将今年交付。

  字节跳动的发言人此后并未详细置评上述报道,而是表示:“消费互联网公司和云供应商每年在数据中心组件上投资数十亿美元,通常提前数月下订单。”

  今年 6 月路透获悉,字节跳动在同博通合作开发 5nm 的先进 AI 芯片,它是一款 ASIC 芯片,由台积电代工,符合美国的出口限制。当时路透报道称,博通至少 2022 年就是字节的商业合作伙伴,曾公开表示字节购买其 5nm 高性能交换机芯片以及用于 AI 计算机集群的 Bailly 交换机。字节和博通的开发芯片合作将有助于降低采购产品,并保证高端芯片的稳定供应。

  本周的 The Information 报道还提到,百度在开发的新一代 AI 芯片昆仑芯 3 代目前处于设计阶段的最后阶段,即将在台积电开始生产。