年底上线!马斯克:训练Grok 3用了10万块英伟达H100,会很特别

  7 月 2 日消息,亿万富翁埃隆·马斯克(Elon Musk)正在为其即将推出的 AI 聊天机器人 Grok 的新版本造势。马斯克周一在社交媒体X上回应了一则帖子,表示经过 10 万块 H100 芯片训练后的 Grok 3 聊天机器人将会“非常特别”。

  这里所说的 H100 是英伟达开发的图形处理单元,也称为 Hopper,是专门用于处理大语言模型(LLMs)数据的 AI 芯片。随着科技公司竞相开发更智能的 AI 产品,这些芯片成了硅谷的热门商品。

  每块英伟达 H100 人工智能芯片的价格估计在 3 万美元左右,也有人估计价格高达 4 万美元,如果批量购买的话可能会有折扣。

  通过简单计算,单单训练 Grok 3 就用了价值 30 亿至 40 亿美元的人工智能芯片,目前不确定这些芯片是否是马斯克公司直接购买的,此前报道称,马斯克旗下的 xAI 公司正在与甲骨文谈判,计划在未来几年内花费 100 亿美元租用云服务器。近年来,马斯克的公司已直接购买了大量的 H100 芯片。据报道,马斯克曾将原本供特斯拉使用的价值 5 亿美元的 H100 芯片转给了X公司。

  相较于 Grok 2,使用 10 万块 H100 训练 Grok 3 无疑是一个巨大的提升。今年 4 月,马斯克在接受挪威主权基金负责人尼科莱·坦根(Nicolai Tangen)的采访时表示,训练 Grok 2 需要大约 2 万块 H100。

  目前,xAI 已发布了 Grok-1 和 Grok-1.5 版本,最新版本仅对X平台上的早期测试者和现有用户开放。马斯克在周一的帖子中透露,Grok 2 计划于今年 8 月推出,并暗示 Grok 3 将于年底发布。

  xAI 没有回应置评请求。

  10 万块 H100 芯片听起来很多,但其他科技巨头,如 Meta,也在大量购买 GPU 芯片。Meta 首席执行官马克·扎克伯格(Mark Zuckerberg)今年 1 月曾表示,到 2024 年底,Meta 将购买约 35 万块英伟达 H100 芯片,并表示包括其他类型的 GPU 在内,Meta 将拥有约 60 万块芯片。

  如果是这样的话,Meta 将为构建自家人工智能能力花掉大约 180 亿美元。

  这些芯片的积累也导致了过去一年中顶尖 AI 人才的招聘竞争变得异常激烈。AI 初创公司 Perplexity 的创始人兼首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)谈到了他试图从 Meta 挖角一位资深研究人员的经历,但对方因扎克伯格拥有大量 AI 芯片而拒绝了他的邀请。

  “我试图聘请一位非常资深的 Meta 研究员,他们的回答是:‘等你有了 1 万块 H100 GPU 再来找我。’”斯里尼瓦斯说。(辰辰)