黄仁勋就是AIGC时代的摩尔

  “摩尔定律”的创造者戈登·摩尔,正式告别人世。

  北京时间 3 月 24 日,英特尔公司和戈登与贝蒂·摩尔基金会对外宣布,英特尔联合创始人戈登·摩尔在美国夏威夷家中平静去世,享年 94 岁。

  正是借助摩尔在 1965 年提出的“当价格不变时,集成电路上可容纳的晶体管数目约每隔 18-24 个月便会增加一倍,性能也将提升一倍”摩尔定律,半导体产业在其指引下开启了长达半个多世纪的创新进程,带动了英特尔、AMD、英伟达等一大批芯片相关公司的崛起。

  随着芯片制程工艺逐渐逼近极限,围绕摩尔定律是否已死的讨论日益增多。其中最具代表性的人物当属英伟达创始人黄仁勋。“摩尔定律已经结束了”,在黄仁勋看来,随着加速计算和人工智能时代的到来,摩尔定律的基本发展动能已经走到尽头,以类似成本实现两倍业绩预期对于芯片行业来说已成为过去式。

  但重返英特尔出任 CEO 的帕特·基辛格显然并不认同黄仁勋观点。在悼念摩尔文章中,基辛格再次重申:“英特尔仍然受到摩尔定律的启发,并打算追求它,直到元素周期表用尽。”

  不过,一个不争的事实是,借助比摩尔定律性能更新频率快上 3 倍的“黄氏定律”,眼下的半导体行业正在从曾经的摩尔时代,迈入属于黄仁勋的新时代。

  随着 ChatGPT 产品爆火,英伟达 AI 芯片变得供不应求。台湾电子时报近期报道称,微软等客户对英伟达 A100/H100 芯片需求强劲,后者订单已经排期至 2024 年,目前正在向代工厂台积电紧急追单。

  为了给新版必应与结合 ChatGPT 能力的新款 Office365 留下足够资源,微软内部已陷入 AI 服务器短缺状态,开始对来自英伟达的 GPU 采取配额供给机制。

  美银证券半导体分析师维韦克 · 阿里亚对此点评道:“使用英伟达的产品并增加计算能力非常容易。目前,计算能力基本上就等同于硅谷的硬通货。”

  面对外界庞大的 AI 芯片需求,黄仁勋将英伟达自比为全球 AI 发动机,并称“正在努力为所有客户提供服务”。

  为了进一步解决越来越多创业公司在大模型方面的算力需求,黄仁勋将英伟达类比为台积电,希望通过最近发布的“NVIDIA AI Foundations(英伟达 AI 基础大模型)”,面向需要构建、改进和操作大型语言模型和生成 AI 的客户,帮助他们构建自定义大模型。

  黄仁勋

  这些客户甚至不用自己配置超级计算机服务,直接借助英伟达 DGX Cloud 的 AI 超级计算云服务,通过一个 Web 浏览器就能训练、访问大模型产品。

  黄仁勋希望将英伟达塑造为人工智能时代基础设施的雄心,被进一步加强。过去近 30 年,黄仁勋带领英伟达从一家以设计和销售 GPU(图形处理器)的半导体公司,逐渐成长为 AI 加速算力软硬件一体方案的芯片巨头。

  如同上一代霸主英特尔一样,掌控高端 GPU 近九成份额后,黄仁勋和他所领导的英伟达,也开始招致外界的抵抗。

  时下最新的代表人物来自英特尔前首席架构师拉加·柯杜力,其计划创办一家新的生成式人工智能软件公司,柯杜力希望通过软件和工具渠道,来打破英伟达 GPU 的主导地位。

  目前,市面上类似的生成式 AI 软件,大多只能在英伟达的 GPU 上使用。黄仁勋在 GTC2023 上也对外明确,当前云上唯一处理 ChatGPT 的 GPU 就是英伟达的 HGX A100。

  华尔街开始流传一种观点,英伟达有点类似光刻机巨头 ASML:部分垄断,在高端市场没有竞争。

  柯杜力则希望未来的生成式 AI 工具可以兼容配合英特尔、苹果、AMD 公司的处理器一起使用。

  现年 60 岁的黄仁勋在最近谈及退休计划时表示,自己希望能够再领导英伟达 30 到 40 年,直到 90 岁左右,届时会以机器人的形式继续工作。

  只是,在实现上述宏远目标之前,黄仁勋需要先确保的一点是:外界对英伟达的恨意,不会超过喜爱。

  A

  2012 年由斯坦福大学李飞飞教授主办的 ImageNet 竞赛中,Alex koshevsky、Elias suskaver 和 Jeff Hinton 三人小组,借助 2 块英伟达 GTX580 GPU 训练出来的 AlexNet 计算机视觉模型,以压倒性优势击败谷歌、微软等一众科技巨头,拿下挑战赛冠军,由此开启了深度学习的大爆发时代。

  通过这次全球性赛事,相比 CPU,GPU 在并行计算上的碾压优势真正引发外界重视。黄仁勋更是将 2012 年视为英伟达的重要转折点,称这一年是“人工智能发展标志性的一年”,并表示:“利用 GPU 的大规模处理能力来学习人工智能算法是一种全新的计算模式。”

  在之前的云计算环境下,计算主力是英特尔的 CPU,转到 AI 计算场景,计算主力替换成了 GPU 和其他专用加速器,后者的并行计算能力与深度学习算法的逻辑一拍即合。

  黄仁勋在 2016 年的投资人会议上强调,深度学习是英伟达十分重要的增长动力,也是公司一直持续大力投资的领域,“过去 5 年来,我们一直默默投资深度学习,因为我们相信深度学习未来对整个软件产业、整个计算机产业都有着深远的影响,我们把一切都赌在了深度学习上。”

  事实证明黄仁勋赌对了。英伟达在深度学习发展最快的两个相关领域均取得了成功:数据中心取代游戏成为公司新的营收支柱。2023 财年,英伟达数据中心总收入同比增长 41%,达到创纪录的 150.1 亿美元。与之相比,游戏业务总营收同比下降 27%,降至 90.7 亿美元。

  自动驾驶领域,凭借把在显卡领域练就的“砌算力”大法发挥到极致,黄仁勋用一套“CPU+GPU”模式更好地匹配了车企的开发需求。眼下,配备英伟达芯片与否,已经成为衡量一家车企自动驾驶能力的重要因素之一。

  “加速计算并非易事。2012 年,计算机视觉模型 AlexNet 动用了英伟达 GeForce GTX 580,每秒可处理 262 PetaFLOPS。该模型引发了 AI 技术的爆炸,”黄仁勋说道,“十年之后,Transformer 出现了,GPT-3 动用了 323 ZettaFLOPS 算力,是 AlexNet 的 100 万倍,创造了 ChatGPT 这个震惊全世界的 AI。”

  ChatGPT 得以诞生的背后,同样离不开黄仁勋的算力支持,“英伟达的 AI 超级计算机 DGX 是语言大模型背后的引擎,我曾亲手将全球首款 DGX 交给 OpenAI,自此之后全球百强企业中有一半安装了这款计算产品。”

  从游戏显卡发家的英伟达,在黄仁勋带领下,成为近年来罕有的“穿越周期”的芯片厂商:先是乘上 AI 的东风,然后又搭上了比特币为代表的加密货币热潮,智能新能源汽车的崛起,和 ChatGPT 的意外爆发,共同推动英伟达市值一路高涨,先后超越英特尔、台积电,成为全球半导体领域市值第一企业,黄仁勋身家也随之水涨船高。

  截至 3 月 24 日,英伟达股价今年上涨超过 70%,市值飙涨至 6700 亿美元,已经是曾经芯片霸主英特尔的 5 倍多,黄仁勋身家也逼近 250 亿美元大关。

  B

  当黄仁勋将 2012 年视为英伟达重要转折点的时候,英特尔则在一边忙着跟高通争夺移动芯片市场,一边抽空与 AMD 打官司。日趋壮大的英伟达,并未能引发英特尔的特殊关注。

  毕竟,直到 2017 年前后,英特尔市值还超过英伟达、AMD 和台积电三者总和。在费城半导体指数中,数十年来,英特尔稳居市值第一,其领先地位看似牢不可破。

  1993 年,30 岁的黄仁勋创立英伟达时,市场上林立着众多强大竞争对手,如英特尔、IBM、惠普、思科等等,行业主要遵循的都是摩尔定律,黄仁勋想到的破局点之一是,“解决那些摩尔定律无法解决的,或者说在摩尔定律时代是不可能被解决的问题。”这便是借助 GPU 所带来的加速计算。

  自此,黄仁勋开始瞄向图形处理器领域创业。

  “What Andy gives, Bill takes aways”。Andy 指英特尔 CEO 安迪·格鲁夫,Bill 指的是微软创始人比尔·盖茨。这句流传甚广的谚语大意是说,硬件性能的大幅度提升所带来的广阔空间,很快就会被软件的发展消耗殆尽。

  相比起硬件,如芯片的进步,软件,如游戏的进步则要容易得多,也快得多。因此,在黄仁勋看来,GPU 的发展速度应该比一般的芯片更快。

  1999 年,黄仁勋提出了与摩尔定律并称的显卡芯片领域“黄氏定律”,即显示芯片每 6 个月性能提升一倍,相比摩尔定律的每 18 个月性能提升一倍,快了 3 倍。

  也正是基于更为高频的更新速度,黄仁勋用更强性能的 GPU 更好满足了游戏玩家的操作体验,为 AI 芯片时代的来临提前打好了基础。

  当被问及英伟达在生成式 AI 崛起过程中获得丰厚回报是运气还是先见之明时,黄仁勋表示:“我们只是坚信,总有一天会有新的事情发生,剩下的就是需要一些偶然的发现。”

  这种赌徒式的冒险心态支撑着英伟达一路走到今天。“每家公司都会犯错,我也犯了很多错误。有些错误甚至将公司置于危险之中,特别是在一开始,因为我们规模很小,而需要面对的却都是庞然大物,我们只能努力开发全新的技术。”黄仁勋说道。

  2006 年,黄仁勋再次豪赌未来,发布了 CUDA 软件工具包。此后十年内,黄仁勋都在接受来自华尔街的责问,如“你们为什么要进行这项投资?”“没有人在使用它。在我们的市值中,它的估值为零”。

  “直到 2016 年左右,也就是 CUDA 问世 10 年后,人们才突然意识到这是一种截然不同的计算机程序编写方式。它具有变革性的加速功能,然后在 AI 领域取得突破性成果。”英伟达应用深度学习研究副总裁布莱恩 · 卡坦扎罗表示。

  到 2020 年 7 月,英伟达市值逼近 2500 亿美元,首度超越了英特尔的 2480 亿美元,成为美国本土市值最大的芯片制造商。

  C

  取代英特尔成为芯片领域老大后,留给黄仁勋的不只是荣耀,还有扑面而来的抗争敌意。英特尔前首席架构师拉加·柯杜力只是其中代表之一。

  这样的敌意黄仁勋在两年多前就曾亲身体验过。2020 年 9 月,黄仁勋开出 400 亿美元天价拟从软银手中收购 Arm,交易一经宣布便遭到来自华为、高通、微软、谷歌等公司的反对,认为将会对半导体行业产生不利影响。

  面对外界诸多质疑,黄仁勋曾辩解称,Arm 做 CPU,英伟达做 GPU 和 DPU,从本质上来看两者是相辅相成,并将两者的关系比作西红柿酱和芥末,认为双方结合将带来创新。

  但随着 Arm 架构对自研芯片企业越来越重要,英伟达想要顺利完成收购的阻力有增无减。2022 年 2 月 8 日,英伟达和软银集团双双宣布,英伟达对 Arm 的收购交易终止。至此,这场为时一年多的芯片行业最大规模收购案以失败告终。

  更大的风险在于,黄仁勋极力看好的自动驾驶领域,正面临流失更多大客户的危机。

  智能新能源汽车时代,为了实现更好的性能优化,从芯片、算法到操作系统,一体化自研已经成为越来越多车企攻克的方向。

  特斯拉在弃用英特尔 Mobileye、转投英伟达合作三年之后,就于 2019 年自研了 FSD 芯片,在“CPU+GPU”基础架构上再增添专门的 AISC(专用集成电路),来解决潜在的算力瓶颈。

  国内造车新新力代表蔚小理,同样在加紧自研芯片进程。

  这样的风险不只存在于汽车业务,在黄仁勋赖以为重的数据中心方面,美银证券半导体分析师阿里亚认为:“对英伟达来说,最大的问题是如何保持领先地位?他们的客户也可能成为他们的竞争对手。微软可以尝试在内部设计这些东西,而亚马逊和谷歌已经在内部设计芯片了。”

  随着特斯拉、谷歌、微软以及亚马逊等科技巨头越来越多设计自己的定制芯片,竞争也在加剧,并有望像 GPU 打败 CPU 一样,改写黄仁勋在 AI 芯片领域的绝对主导地位。

  在近期回答 36 氪有关大模型算力紧张问题中,百度创始人李彦宏就预测称,将来制约整个大语言模型发展的很可能不是算力。“今天我们看到算力很紧张,将来你可能发现算法突然变了,不是这个算法了,(制约发展的)可能就是另外一套东西。”

  在不断高呼“人工智能的 iPhone 时刻已经开始”之余,黄仁勋或许也要被迫接受变革所带来的种种不确定性。

  参考资料:

  《关于 ChatGPT,黄仁勋和 OpenAI 的科学家进行了一场“炉边谈话”》腾讯科技

  《英伟达黄仁勋:将通过中国云服务商提供 AI 超算能力中国初创公司也能开发大模型》第一财经

  《对话李彦宏:不要重复造轮子,AI 的十倍机会在别处》36 氪

  《英特尔首席架构师离职创业:欲打破英伟达芯片对“AI 作画”垄断》新浪科技

  《缺芯潮 2.0 来了?GPU 短缺下游急寻替代品价格战首枪已打响》财联社

  《英伟达想再赢一次》甲子光年