CPU被「卡脖子」,中国企业纷纷换赛道:国产GPU这条路能走通吗?

  新智元报道

  编辑:David

  面对来自西方在 CPU 芯片领域的技术封锁,越来越多的国内公司转向了另一条赛道:GPU。

  根据技术市场研究机构 Jon Peddie Research 的一份新报告,中国的 GPU 初创企业数量非同寻常,因为该国试图获得人工智能的优势以及半导体主权。

  随着人工智能(AI)、高性能计算(HPC)和图形处理的需求以前所未有的速度增长,近年来全球 GPU 制造商的数量也在增长。谈到个人电脑的独立显卡,AMD 和 Nvidia 保持领先,而英特尔正在努力追赶。

  在上世纪八九十年代,全球一度有多达数十家公司在开发了显卡和独立图形处理器,但为了在 3D 游戏中获得最高性能而进行的残酷竞争,其中绝大多数公司被淘汰。

  到大约 2010 年时,只有 AMD 和 Nvidia 能够为游戏和计算提供有竞争力的独立 GPU,而其他公司则专注于集成 GPU 或 GPU IP。

  从 2015 年左右开始,中国的 PC GPU 开发商数量开始迅速增加,这得益于中国对技术自给自足的推动,以及 AI 和高性能计算作为高科技大趋势的出现。

  根据 Jon Peddie Research 的数据,目前总共有 18 家公司在开发和生产 GPU。有两家公司主要针对智能手机和笔记本电脑开发 SoC 绑定的 GPU,有 6 家开发 GPU IP,有 11 家 GPU 开发商专注于 PC 和数据中心的 GPU,包括 AMD、英特尔和英伟达。

  事实上,如果在名单中加入其他中国公司,如壁仞科技和天枢智信,那么 GPU 企业数量将更多。不过,壁仞科技和天枢智信目前只专注于 AI 和高性能计算,所以 JPR 不认为他们是传统意义上的 GPU 开发商。

  中国的技术救国之路:GPU 开发

  作为世界第二大经济体,中国不可避免地与美国和其他发达的国家在几乎所有方面进行竞争。中国竭尽所能地吸引世界各地的工程师。

  事实上,在中国,每年都有数百家新的 IC 设计公司成立。他们开发的产品种类繁多,从微小的传感器到复杂的通信芯片均由涉猎,力图实现对西方国家供应商的自给自足。

  中国 GPU 企业摩尔线程发布的 MTT S3000 GPU

  但要真正跳上人工智能和高性能计算的浪潮,需要 CPU、GPU 和特殊用途的计算加速技术。

  谈到 CPU,中国面临美国在制造设备和技术上的越来越严密的技术封锁,不可能很快赶上全球先进水平。然而在另一个赛道上,可以说,开发和生产一款像样的 GPU,比试图造出一款有竞争力的 CPU 更容易出成果。

  「对于中国公司来说,人工智能训练是自主研发 GPU 的主要驱动力,一方面是因为英伟达的 GPU 太贵了,另外也是出于对自给自足的渴望。」JPR 的负责人 Jon Peddie 说。

  GPU 本质上是并行设备,其内部有大量的计算单元可以用于冗余,这使得 GPU 更容易启动和运行,单位晶体管的成本相对较低,整体产量也不错。此外,GPU 的并行性质使其更容易以扩展的方式实现部署。

  与 CPU 相比,GPU 在设计和制造上对制程工艺的要求没有那么苛刻,即使目前中国最先进的芯片制造商中芯国际并没有像台积电那样先进的生产工艺,仍然可以利用 GPU 性能扩展的方式实现足够可观的性能。

  事实上,即使中国的 GPU 开发商失去了使用台积电先进节点(N7 及以下)的机会,至少他们中的一些人仍然可以在中芯国际生产更简单的 GPU 设计,并满足 AI、HPC 和部分游戏/娱乐市场的需求。

  而且,从国家的角度来看,具有 AI 和 HPC 能力的 GPU 可能也可以说比 CPU 更重要,因为 AI 和 HPC 可以实现全新的应用,如自动驾驶汽车和智能城市等应用。

  尽管美国政府大力限制向中国出口以超级计算机为基础的 CPU 和 GPU,但比起 CPU,GPU 在设计和制造上的相对较低的门槛,使得这种限制的效果远没有 CPU 来的明显 。

  GPU 微架构相对容易,硬件设计却很昂贵

  不过,应该注意的是,虽然目前有很多 GPU 开发商,但只有两家能真正为 PC 打造有竞争力的独立 GPU。这也许是因为,开发一个 GPU 架构相对容易,但要正确实现它并设计适当的驱动程序确实很难。

  CPU 和 GPU 微架构基本上是「科学和艺术的交汇」。这些架构是一组复杂的算法,开发这些架构的团队规模可能相当小,但可能需要长达几年的时间。

  可以这么理解,微架构是在餐巾纸和白板上完成的。至于成本,如果只是架构师自己,团队规模可以只有一个人,也许是三四个人。但是任何类型的建筑,建筑、火箭飞船、网络或处理器都是一个复杂的棋局。

  比如,试图预测五年后的制造工艺和标准,性价比的权衡,增加什么功能,放弃或忽略什么功能,这些都是非常棘手和耗时的工作。

  架构师们花了很多时间在头脑中进行假设,比如如果把缓存做大 25%,如果有 6000 个 FPU,是否应该做一个 PCIe 5.0 I/O总线?这么做能不能按时完成?诸如此类。

  由于微架构的开发可能需要数年时间,而且需要有才华的设计师,在这个上市时间至关重要的世界里,许多公司就干脆从 Arm 或 Imagination Technologies 等公司授权使用现成的微架构,或者是是经过验证的 GPU IP。

  例如,中国的芯动科技(Innosilicon)就从英国的 Imagination 公司授权 GPU 微架构 IP 用于其 Fantasy GPU。

  还有一家中国的 GPU 开发商,使用了 Imagination 的 PowerVR 架构。同时,另一家 GPU 制造商兆芯(Zhaoxin)使用的是 Via Technologies 获得的 GPU 微架构。

  开发一个微架构的成本可能有所不同,但与现代高端 GPU 的物理实现成本相比,它的开发成本相对较低。

  多年来,苹果和英特尔这两家拥有大量工程人才的公司都依赖 Img 进行 GPU 设计。联发科和其他小型 SoC 供应商依靠 Arm。高通公司在很长一段时间内使用 ATI/AMD,而三星在尝试设计自己的图形引擎数年后,也转向了 AMD。

  最近,两家新的中国 GPU 公司聘请了前 AMD 和英伟达的架构师,另外两家使用 Img。进入市场的时间和学习作为一个架构师的技能,要担心什么,以及如何找到解决方法,是一个非常耗时的过程。

  「如果你能去找一家已经有了设计方案,并且已经设计了很长时间的公司,可以节省大量的时间和金钱,而在市场上,时间就是一切。」

  「这个过程中会有太多的问题。并非每一个由 AMD 或英伟达设计的 GPU 都能成为赢家。不过,一套好的架构设计可以经历几代的调整,慢慢进步。」研究机构 Jon Peddie Research 的负责人表示。

  对于新的生产制程来说,硬件实现和软件开发的成本太高了。据《国际商业时报》估计,使用 5nm 级技术制造的设备,其设计成本超过 5.4 亿美元。如果制程为 3nm,设计成本还将增加 3 倍。

  「如果将布局和平面图、模拟、验证和驱动程序全部考虑在内,GPU 开发的成本和时间就会激增。」Peddie 解释说。

  「硬件设计和布局是非常直接的:如果弄错一条线,可能要花几个月的时间来查错。」

  目前,世界上只有少数几家公司能够开发出具有 AMD 和英伟达级别的现代游戏或计算用 GPU(460 亿-800 亿个晶体管规模)芯片。

  不过,前不久中国的壁仞科技发布的 BR104 和 BR100 也达到了几乎类似的水平。(据猜测,BR104 包含大约 385 亿个晶体管)。

  目前,全球 11 个 PC/数据中心 GPU 设计供应商中的 8 个来自中国,这本身就说明了问题。

  也许在不久的将来,除了美国公司,我们不会看到有竞争力的独立游戏 GPU。中国是否能推出有竞争力的竞争对手,目前还有待观察。

  参考资料: