马斯克提的五大罪状,OpenAI不认

  真实的商战,往往朴实无华。

  在这个阳春三月,全球大语言模型领域领头羊 OpenAI,接连遭遇了来自自己曾经盟友的背刺和宣战:

  首先是在 3 月 1 日,OpenAI 被其创始人之一、特斯拉老板马斯克告上法庭。虽然马斯克早在 2018 年就离开了 OpenAI,但本次他诉称 OpenAI 违背了自己曾参与制定的“造福人类”“技术开源”等创业初衷。

  随后在 3 月 4 日,由 OpenAI 离职员工创办的大模型创企 Anthropic 则发出突然袭击,直接对标 GPT-4 发布了官方性能更为优异的开源通用大模型产品。

  无论是从研究理念、还是产品本身,OpenAI 都正与自己曾经的一些伙伴走到对立面。

  而他们的分歧重点,也映射着整个产学界对于 AI 研究范式的待解之问。

  01、出走,互撕,对簿公堂

  3 月 1 日,美国旧金山法院官网上更新了一份 46 页的起诉文件,显示马斯克将 OpenAI 及其现任 CEO Sam Altman 等人,告上了法庭。原因则是马斯克认为如今的 OpenAI 违反了创业时的约定,并列出了 OpenAI 的多条“罪状”。

  在 3 月 6 日,沉寂了 5 天的 OpenAI 选择反击,在自家官网上发布了名为《OpenAI 与埃隆· 马斯克》的长文,不仅一一驳斥了马斯克的指责,还从自己的角度梳理了双方的过往恩怨。

  不仅如此,OpenAI 行文不乏错愕与“伤感”,其中写道:“我们对此感到非常遗憾,因为做出这种事的人是我们深深敬仰的……当我们在没有他的情况下,开始在 OpenAI 的使命上取得实质性进展时,他却对我们提起了诉讼。”

  至此,OpenAI 与自己曾经的创始人之一公开走向了对立面。尽管在最初,他们曾有过一个看似梦幻而美好的开端。

  在 2023 年出版、得到马斯克本人认可的《埃隆· 马斯克传》中,这样描述了 OpenAI 的创办背景。

  从 2012 年开始,马斯克逐渐意识到了 AI 发展的潜在危险,为此想要做些什么,但在寻求合作的过程中数次碰壁。

  直到他向时任著名孵化器 YC 总裁的 Sam Altman 谈起了自己的想法,两人最终达成了共识。

  书中写道:2015 年 7 月,在帕洛阿尔托的一场小型晚宴上,他们两人决定创办一个非营利性的 AI 研究实验室。2015 年,OpenAI 正式创立,马斯克与 Sam 均担任联席董事长职位。

  而分歧,就是在这之后产生的。

  在成立之初,马斯克显然对 OpenAI 寄予厚望。他说道:我们的目标是提升 AI 安全发展的概率,人类将从中受益。

  当时,两人还约定为 OpenAI 筹资 10 亿美元,如果外部投资者未能提供足额资金,则剩下的部分由马斯克承担。此后,马斯克陆续向 OpenAI 注资了接近 4500 万美元。

  但没过多久,共识就遭到打破。原因是在创办 OpenAI 同期,马斯克还启动了 Neuralink、特斯拉自动驾驶等 AI 项目。到 2017 年底,马斯克产生了将 OpenAI 与特斯拉整合的想法。为此,他开始谋求自己对 OpenAI 的控制权。

  而这遭到了 Altman 等其他 OpenAI 管理层的反对,最终未能成功。这导致的直接结果是,在 2018 年 2 月的一次员工会议上,马斯克宣布辞去其在 OpenAI 的职务,对外公开声称的原因则是特斯拉与 OpenAI 之间存在利益冲突。

  分道扬镳之后,马斯克仍未放下心结,常在社交媒体上对 Altman 隔空互怼。在 2023 年 7 月,马斯克宣布成立 AI 公司X.AI,并在同年 11 月发布了类 ChatGPT 产品 Grok,成为了 OpenAI 的对手。

  不满逐渐堆积的马斯克,最终在起诉文件中列出了 OpenAI 在合同违约、承诺违约、违反信托责任、不公平商业行为、会计审计方面的共计五大“罪状”,可以总结为以下几点:

  ▲(马斯克对 OpenAI 起诉文件。图源/网络)

  而 OpenAI 最新更新的反驳文章,则针对马斯克的投资额、营利实体设置、开源闭源之争等几点一一进行了说明:

  ▲(马斯克与 OpenAI 往来邮件。图源/OpenAI)

  02、员工出逃,另起炉灶,内部分歧不休

  来自马斯克的诉讼,并非 OpenAI 面前唯一的难题。在过往那些年里,“伙伴”的出走和反目,早已是 OpenAI 并不陌生的命题。

  在刚刚过去的 3 月 4 日,另一家与 OpenAI 渊源颇深的大模型创企 Anthropic,正式发布了自己的最新产品 Claude 3,要正面硬刚 OpenAI。

  这家公司 Anthropic 不仅创始人曾是 OpenAI 的高管,其创业班底更是全部由 OpenAI 的前雇员构成。

  根据 Anthropic 官方信息,Claude 3 多项指标明显优于 GPT-4,因此有人将 Claude 3 誉为新的“全球最强大模型”。

  具体而言,Claude 3 提供 3 个版本,分别为 Opus、Sonnet、Haiku,其中 Opus 在本科水平知识的多语言理解均值、研究生水平的专业知识和推理等指标上普遍超出 GPT-4 水平。

  ▲(Claude 3 多项指标明显优于 GPT-4。图源/Anthropic)

  和马斯克声称的一样,Anthropic 的创业团队也在 AI 安全理念上,与 OpenAI 现任管理团队产生了分歧。

  2020 年,OpenAI 的一对兄妹雇员宣布了离职的消息,他们分别是时任 OpenAI 研究副总裁的 Dario Amodei、时任 OpenAI 安全与政策副总裁的 Daniela Amodei。

  至于离职原因,Dario 曾经在接受采访时如此讲道:在开发了 GPT-2 和 GPT-3 后,OpenAI 内部出现了两种不同的想法,其中一种认为“为模型投入更多的计算资源,让它们变得越来越好”,而另一种想法则是“在模型规模之外,我们还需要一些东西,即‘对齐’或安全”。而 Amodei 兄妹,显然是后一种想法的拥趸。

  在两人离职之后, 多位与他们拥有相同想法的员工也追随了他们的脚步,选择离开 OpenAI,比如曾领导 GPT-3 模型研发的工程师 Tom Brown、曾在 OpenAI 担任策略指导员(policy director)的 Jack Clark 等等。

  2021 年 5 月,合计 7 位由 OpenAI“出逃”的员工宣布创办 Anthropic。而据 Dario 表述,他们的理念是:“从一开始就试图在设计 Claude 时考虑到安全性和可控性。”

  成立至今,Anthropic 已经发布了两代大模型,分别为 2023 年 7 月亮相的 Claude 2,以及最新的 Claude 3,发展速度不可谓不快。

  而就在 Claude 3 亮相不久之前,OpenAI 又失去了一员大将。

  2 月 13 日,OpenAI 联合创始人之一、公司 AI 技术研究员 Andrej Karpathy 官宣已离开公司。随后这一消息也得到了 OpenAI 发言人的证实。

  虽然 Andrej Karpathy 称其离职,“不是任何特定事件、问题或戏剧性事件的结果”,但他素来对 AI 开源表露出强烈的兴趣。而考虑到如今 OpenAI 选择的是闭源路线,Andrej 的选择也难免给外界留下了遐想空间。

  03、频频后院起火,价值观面临挑战

  马斯克的起诉,Anthropic 的突袭,能否威胁到 OpenAI 的市场地位?答案仍未知晓。

  一位 AI 行业人士对「市界」判断道:“我和身边的朋友交流,一致认为马斯克的起诉论据并不充分,更多应该是市场行为。因为这个时间点也很特殊,正好是 Grok V1.5(聊天机器人)马上要发布了的时间点。”

  ▲(马斯克官宣 Grok V1.5 将于 3 月份发布。图源/网络)

  他还补充道,现阶段看来 Claude 代表的开源模型性能和市占率,还与 OpenAI 有着巨大的距离,“但我始终认为大模型是一个乾坤未定的巨大市场”。

  但是,可以肯定的是,无论是在 OpenAI 管理高层还是在普通员工之间,价值观的动荡与分歧都始终存在。

  毕竟就在 2023 年 11 月,OpenAI 内部还曾爆发一起人事“地震”:

  OpenAI 联合创始人之一、首席科学家 Ilya Sutskever 突然向 Sam Altman 发难,联合其他董事会成员将 Altman 开除出公司,即日生效。

  这个消息一度如同一颗重磅炸弹,震惊了整个 AI 产学界。而追溯这起人事地震的原因,同样与 AI 安全与商业化原则强烈相关。

  在高层换血后的内部沟通会上,Ilya 曾正面提及,其与 Altman 的主要分歧在于安全议题。具体来说,Ilya 认为 OpenAI 应该放慢商业化步伐,更专注于 AI 产品的可解释性、安全性;与之相对,Sam 则倾向于积极推动 AI 模型跑通商业化路径和进行新一轮融资。

  尽管在内部员工、股东微软等多方力量的干预下,上述闹剧最终平稳解决,以 Altman 回归任职,Ilya 退出 OpenAI 董事会但仍在公司留任的“圆满”结局告终。

  马斯克的 46 页诉讼文件中也提及了,OpenAI 现任董事会成员系由 Altman 亲自挑选。这或许可以被理解为,未来在 OpenAI 发生类似“夺权事件”的概率将被大大降低。

  尽管如此,有关 AI 发展范式的诘问从未消失。

  商业化还是安全性,研发底层大模型还是专注应用创新,选择开源还是闭源路线……ChatGPT 的诞生和大模型开始大规模应用,让整个 AI 产学界在一夕之间,站在了许多个“向左还是向右”的分岔路口。

  而对于正在底层大模型赛道奋起追赶、应用层创业如火如荼的国内市场来说,OpenAI 历经的种种风波也提供着新的警示与借鉴思路。

  整体来看,目前国内大模型市场的参与者普遍正狂奔在商业落地之路上,竭力试图在需求侧寻找增量。

  入局底层大模型自研的巨头大厂、科技新贵,大多都强调要做原生应用。百度是其中的典型代表,创始人、董事长兼 CEO 李彦宏更是在不同场合多番呼喊:“AI 原生时代,我们需要 100 万量级的 AI 原生应用,但是不需要 100 个大模型。”

  而相比底层模型赛道,数量更为众多、体量相较更小的国内第三方大模型创业者,则大多选择“借道”OpenAI、Anthropic 代表的底层大模型,在此之上构建自己的产品生态。

  然而,在技术良性发展与市场逐步成熟的双螺旋之中,或许只有兼顾,才能走向更远。

  作者董温淑

  编辑董雨晴

  运营刘珊