蔡崇信预言成真?微软AI扩张版图背后的故事

  文适道

  要是你们能够洞察时间所播的种子,知道哪一颗会长成,哪一颗不会长成,请对我说吧。

  ——《麦克白》

  在 AI 实验田,同样有无数颗种子被播撒。

  如何确保押中“好种子”?微软的策略是:花钱买,广撒网。这也意味着,OpenAI 只有一个“皇阿玛”微软,但微软却可以有许多个“好阿哥”。

  最近,“皇太子”OpenAI 遇到了小麻烦。

  一边是闪亮产品“姗姗来迟”。

  市场曾预测 GPT-5 可能在 2023 年底或 2024 年夏季发布。但 OpenAI 确认,今年 10 月的开发者大会将专注开发者社区互动和 API 更新,期间不会发布 GPT-5。首席技术官 Mira Murati 透露,GPT-5 发布时间将推迟至 2025 年底或 2026 年初。

  即将“替补”上场的是“草莓”(原Q*)新模型。这两天传出消息,该模型最早于今秋发布。OpenAI 称,“草莓”可以解决以前从未见过的数学问题,并帮助改进 OpenAI 即将推出的“猎户座”(Orion)大语言模型。

  一边是宫斗余波“众叛亲离”。继前首席科学家 Ilya Sutskever 离开,“ChatGPT 架构师”John Schulman 转投 Anthropic,OpenAI 总裁兼联创 Greg Brockman 宣布“长期休假”。最初 11 位联创如今仅存两席,高层已成空壳。

  这两天,BI 爆料 OpenAI 玩起了“抓内鬼”游戏:公司雇佣技术内部风险调查员联手人事部门,旨在扫清内部“可疑活动”。

  此举难道与加州 AI 安全法案 SB-1047 有关?该法案规定“如果员工向加州总检察长披露有关不安全 AI 模型的信息,法案会对举报人进行保护。”

  好吧。无论是“内部团结”还是“安全风险”,Sam Altman 似乎都没有自信的理由。

  好消息是:如果法案一路顺风,也要等 2026 年生效。留给 Altman“捉内鬼”的时间足够了。

  关于 OpenAI 接连不断的“小麻烦”,微软爸爸早已洞察了真相。

  FT 近期一篇文章指出:如果没有“11 月政变”,微软的“海王策略”也不会出现。这给微软及其投资者敲了一次警钟。随后,微软悄然启动了一项“OpenAI 戒断策略”:通过多元投资、广泛合作布局 AI 版图;推出自家“小而美”Phi 系列模型;招兵买马,推动C端 AI 研发。

  来看时间线:

  2 月,微软“送温暖”法国初创公司 Mistral,这是微软投资的第二家大模型公司;

  3 月,微软“活剥”Inflection,开创巨头“垄断新思路”;

  微软“嫡长子”轻量级模型 Phi-3 出世,性能堪比 GPT-3.5 Turbo;

  4 月,微软宣布向 G42 投资 15 亿美元,后者会通过 Azure 运行其 AI 应用和服务。

  8 月,微软发布 Phi-3.5 系列——Phi-3.5-mini-instruct(38.2 亿参数)、Phi-3.5-MoE-instruct(419 亿参数)、Phi-3.5-vision-instruct(41.5 亿参数)

  在很多第三方基准测试中,“三兄弟”表现相当不错,部分情况击败了其他领先大模型,包括谷歌的 Gemini 1.5 Flash、Meta 的 Llama 3.1,甚至在一些竞技场上击败了 OpenAI 的 GPT-4o。

  回想 2 个月前,在摩根大通第 20 届全球中国峰会上,蔡崇信曾预言:微软和 OpenAI 是两家独立的公司,现在建立了紧密的合作,但独立也意味着他们未来可能会分道扬镳。“所以微软实际上并没有自己的 AI 开发,他们基本上把它外包给了 OpenAI。”

  如果你翻看微软成长史,就会发现“多元下注”是被反复验证过的真谛,而 OpenAI 的“小麻烦”只是微软“花钱”的催化剂。

  01 初尝甜头:PC 时代的法宝

  1981 年,首台使用微软 MS-DOS 操作系统的 IBM 个人计算机问世。

  1989 年,MS-DOS 的市场份额已经接近 90%。

  在巨大成功下,比尔·盖茨敏锐地判断:随着 PC 的普及,操作系统市场将会剧变。(P.S.这也是巴菲特选可口可乐,不选微软的原因?)

  为了应对市场的不确定性,微软在 80 年代-90 年代初“齐头并进”:

  1、继续开发 MS-DOS;

  2、合作其他从事 Unix 的公司,尤其是继续开发 Xenix 版本的 Unix(1980~1989 年);

  3、大规模投资 Windows(1983 年开始,1985 年发布 Windows1.0,1991 年发布 Windows3.0);

  4、与 IBM 合作开发 OS/2(1985 年);

  5、购买圣克鲁兹操作系统公司(SCO)20% 股份,该公司是当时 PC 上最大的 Unix 系统销售商(1989 年);

  6、开发微软 Office,整一套可以跨操作系统运行的应用程序套件(1990 年)。

  上述过程中,微软主要将希望押在了 Windows,虽然这意味其他押注的失败。

  互联网时代,尝到甜头的微软依旧遵循“广撒网”策略。

  1995 年,比尔·盖茨在“互联网潮汐备忘录”中指出:互联网业务不仅是微软的新前线,它还会让竞争对手更强大,甚至完全取代微软的操作系统。(P.S. 移动时代应该重读)

  根据盖茨的指导思想,微软在互联网领域进行大量“多元下注”——从 IE 浏览器(1995 年)到 MSN 门户、搜索引擎(1995 年),再到 4 亿美元收购 Hotmail(1997 年),以及 Messenger (1999 年)........

  同时,微软在操作系统领域也没闲着:1997 年,微软花 1.5 亿美元购买苹果5% 股份;该交易涉及苹果将 IE 设为 Mac 的默认浏览器。

  02 折戟于专情:移动时代挨打

  2007 年 6 月 29 日,iPhone 正式上架销售。

  当时的微软 CEO 史蒂夫·鲍尔默大笑:“我的天!不如花 99 美金去买一支摩托罗拉Q!要人们花 500 美金去买一部手机?这简直是开玩笑吧!苹果这是要在市场上卖最贵的手机。iPhone 的定位和定价,没有机会获得任何重要的市场份额。”

  没有按键,还不能换电池;不支持彩信,连存储卡也不能插。iPhone 刚刚诞生时,没人觉得它会开启一个时代,包括微软。

  再来看鲍尔默眼中的“好”智能手机:

  1、售价 100-200 美元,而不是 500 美元以上;

  2、专注于企业用户,而不是消费者;

  3、应该有物理键盘;

  4、数据使用应该最小化,以保护有限的网络带宽;

  5、待机以天为单位,而不是小时;

  6、摔不坏!

  如此预判,难怪微软错过了一整个时代。

  而且,微软还延续了 PC 时代的商业模式——想靠卖手机操作系统致富,授权费约为 10~25 美元。

  一方面,Window 系统在手机上不那么完美适配。

  另一方面,买 iPhone 包送 IOS 系统;以及,更适合手机的 Android 系统免费!

  即便在 2010 年,微软推出免费版 Windows Phone,并在一年后与诺基亚达成了独家合作伙伴关系,但还是为时已晚。

  03 买下所有种子:AI 时代赢家

  客观来讲,微软折戟于移动时代,不能全怪鲍尔默的误判。

  错就错在“过于自信”。PC 时代的微软赢在“谨慎”,分散收益和风险;移动时代的微软败在“偏执”,单独“押宝”固有模式,不仅没有“多元下注”,甚至连其他可能性都没有尝试。

  终于,等来了全新的 AI 时代。

  吃一堑长一智的微软怎么可能只认 OpenAI 一个儿子?

  更何况,在过去半个世纪,微软已经给 AI 领域投入数百亿美元,并斥资数十亿美元收购自然语言处理领域的领先公司,包括 2021 年 4 月耗资 197 亿美元收购 Nuance。

  微软的 AI 策略正是梦回 PC 时代,其照料的“种子”同样存在竞争关系。

  2019 年,微软向 OpenAI 投资 30 亿美元,并提供免费使用 Bing 搜索数据库的权限。不久后,微软花 100 亿美元收购 OpenAI 的 49% 股权,这让微软产品将 ChatGPT 系列无缝整合,并分配 OpenAI 收益。

  同时,微软也大力发展内部 AI 开发团队 Microsoft Research。

  只是 OpenAI 过于优秀,一度导致“微软已经沦落为 OpenAI 的一个 IT 部门”!

  有趣的是,今年 6 月,苹果宣布将在其操作系统中集成 ChatGPT,而微软自家的 Windows 还没有给 ChatGPT 这个机会。

  到底是不让“自家人”上桌,还是桌子已经太挤了?

  当然,OpenAI 也想“悄咪咪”绕过微软搞钱。Sam Altman 打着时间差,拿着“最新预览版本 ChatGPT”抢微软的客户。例如,去年 OpenAI 早于微软数周,向客户提供了 GPT-4 的访问权限。根据 The Information 最近报道,OpenAI 模型收入超过微软,而且越来越多企业客户选择直接从 OpenAI 购买,而不是通过微软。

  按“阴谋论”,GPT-5 迟迟不公开可能有这个原因?

  除了开头列举的一系列“下注”行为,此前微软还将整合 ChatGPT 的 Bing 宣传为“这是 OpenAI 研发的 ChatGPT 竞争对手”,并将 Bing 搜索数据库提供给其他 AI 初创公司使用。

  而当 Meta 开源 Llama 模型时,微软很快就以“首选合作伙伴”的头衔与 Meta 达成合作。

  为何微软不在 OpenAI 早期将其完全收购?

  很简单,当时微软无法预测到底是 OpenAI、Cohere、Anthropic 或 Hugging Face 谁先跑出来。更何况,Transformer 最终也可能被替代。谁都不知道。

  One More Thing

  众所周知,谷歌向来喜欢“自力更生”——构建完整的 AI 堆栈。

  那么,亚马逊呢?

  2011 年,苹果发布 Siri;8 个月后谷歌部署 Google Now,随后亚马逊也押注智能助手。

  但亚马逊没有智能手机,于是它将重心放在构建一套轻巧设备——Alexa。

  虽然到 2020 年,Alexa 销量达数亿台,但如果你把它当作智能硬件,就是在玩抽象。

  根据 The Information 报道,亚马逊原计划在 2022 年 11 月推出自家 Transformer LLM(Bedrock),但在看到 ChatGPT 后,就直接放弃了。

  可叹的是,2018 年以来,亚马逊已经放弃了 OpenAI、Anthropic 和 Cohere 等公司提出的各种产品合作和股权提议。

  还好万幸,2023 年开始,亚马逊终于决定要花钱了!

  一是,重新拿回“Bedrock”名称,用于第三方 AI 解决方案,目的是让客户在 AWS 上运行这些产品。

  二是,2023 年 9 月,亚马逊首次向 Anthropic 投资 12.5 亿美元;2024 年 3 月,亚马逊又向 Anthropic 追投 27.5 亿美元。至此,Anthropic 被亚马逊和谷歌瓜分。(没错,谷歌也下注了)

  三是,亚马逊也大力开发自家模型,例如 Titan、Amazon Q。除此之外,近期 BI 爆料,亚马逊正在秘密研发一款聊天机器人,代号为 Metis,有望挑战 ChatGPT 霸主地位。Metis 不仅是信息助手,还能胜任 AI 代理。这意味着它可以根据现有数据自动执行复杂任务,比如定制假期行程、控制智能家居设备,甚至能预订航班。

  总的来说,了解巨头“多元下注”背后的故事,你也能预测未来将会发生的事情。但即便巨头买下所有“种子选手”,也会有一棵杂草在“盲区”顽强地冒出头来。

  谁是这棵杂草呢?只有时间女巫知道。