百度做 AI 的第十年,李彦宏的反思与希望

“有些技术离市场很远,很多时候是自嗨。”

  2023 年 1 月 10 日,百度 Create 大会暨百度 AI 开发者大会举办,百度展示了能自己创作画作、编写剧本的生成式 AI 大模型文心,能从全网学习内容呈现给用户的 “知一” 搜索大模型等十项成果。

  以 2013 年建立美国研究院为起点,百度已经做 AI 十年了,AI 开发者大会也办了 5 届。多年投入后,百度仍在努力把 AI 技术储备转化成足以撑起第二、第三增长曲线的新业务。

  去年 12 月底的一次全员内部演讲中,李彦宏正视了百度这几年的不顺。这次演讲是百度不定期沟通会 “简单之约” 的一次分享,百度高管会通过这一分享机制阐述公司最新导向、战略方向,回答团队关心的问题。

  李彦宏说:“百度这几年过得比较苦,财报、业务增长性都不是那么光鲜。” 他同时提到:“有些技术同学做的事离市场很远,纯属自嗨,做了一两年发现东西没人用。”

  李彦宏直接批评了百度部分员工的报喜不报忧:“有些人的周报永远都是好消息,但是他负责的那些事儿真的永远都符合预期吗?不可能吧?”

  内部讲话的希望部分仍落在 AI 和技术上。李彦宏说:“百度的机会是把技术变成人人需要的产品,这一步最难,但也最能产生影响力。”

  他认为百度的优势是,它是 “少有的全栈布局自研的人工智能公司,包括芯片、框架、模型、和应用四层”,百度 “在技术准备度上是最好的”;紧跟着是一句提醒:“我们在市场准备度上是不是最好的?这存疑。”

  除开爱奇艺、小度等体外子公司,百度现在的 3 块核心业务是移动生态(搜索、手机百度、短视频等)、智能云和智能驾驶,其中后二者都以 AI 为基础或与之紧密相关;百度也正在把 AI 技术,如大模型和生成式 AI 等与搜索产品结合。

  李彦宏表明了百度继续投入 AI 的决心,他在内部演讲提到,百度的研发投入占比高于腾讯:“虽然也觉得现在亏钱亏得很厉害,但相信未来它会有相应的回报。”

  百度 2022 年前三季度总研发支出 178 亿元人民币,研发费用占百度核心收入比例连续 8 季度超 20%。去年前三季度,阿里、腾讯、美团的研发投入占比分别约为 15% 、10% 和 8%。

  只看盈利和增长,百度仍是一家活得不错的公司,2022 年前 3 季度营收超 900 亿元,净利 133.9 亿元,同比增长 6.6%。同期阿里、腾讯的净利分别下滑 19% 和 12%。

  不过百度和李彦宏的目标不会只是活着和活得还不错。这是一家曾站在中国互联网顶端的公司,也是众多互联网公司中,以技术实力和工程师文化著称的公司。百度想成为更伟大公司,AI 是关键机会。

  十年做 AI,少有的全栈公司

  2009 年百度 World 大会上,李彦宏畅想了搜索的未来:用户在搜索栏中输入问题,系统就能明确识别需求,直接呈现相应的结果而不是给出需要点击的链接,比如搜某地的天气,直接在页面中呈现晴雨、温度,搜一家公司的股价,直接返回走势图。这项技术被百度称作 “框计算”,这是百度第一次公开谈论把人工智能应用到主营业务中。

  随后十多年,百度对 AI 的投入大体可分为两个阶段。

  2015 年之前,百度主要在招兵买马和确定技术方向。2013 年,百度在硅谷成立百度美国研究院,它的前身是 2011 年开设的百度硅谷办公室;同年,百度在中国建立深度学习研究院,李彦宏亲自任院长。中美两个研究院吸引了斯坦福大学计算机科学系教授吴恩达,慕尼黑大学博士、NEC 美国研究院前媒体研究室主任余凯等人。

  2015 年-2016 年之后,百度进入一个探索 AI 技术产品化和商业化的阶段,AI 团队陆续拿出两大成果:2015 年 9 月,百度推出人工智能语音助手度秘(DuerOS),用户可以和度秘对话、聊天,当时机器的聊天还不像现在这么顺畅、自如;年底,百度成立自动驾驶事业部,时任百度高级副总裁的王劲任总经理,次年 4 月,Apollo 计划发布,瞄准全无人驾驶。

  这也是一个创业期,2016 年前后,余凯、倪凯、彭军、楼天城、吴恩达等人相继离开百度,他们创立了地平线、禾多科技、小马智行和 Drive.ai(2019 年被苹果收购)等自动驾驶公司。

  这些技术骨干的离开是当时 AI 创业热的一个缩影。Google 旗下 AlphaGo 在 2016 年战胜世界围棋冠军李世乭,引燃了投资者和潜在客户对 AI 产业化的期待。人们相信,AI 除了下围棋,还能帮更多行业提升效率,比如更快处理财务数据,更准确识别身份,解放人类司机、使汽车成为移动空间……

  变化也发生在百度内部。2017 年初,在李彦宏力邀之下,微软前全球执行副总裁陆奇加入百度。同年,百度把 AI 提升为公司战略,提出 All in AI,百度深度学习研究院、自然语言处理、知识图谱、语音识别、大数据部门等核心技术部门被整合成了 AI 技术平台体系(AIG),由时任百度副总裁王海峰负责,向陆奇汇报;自动驾驶事业部被升级为智能驾驶事业群(IDG)。陆奇于 2018 年离职后,百度保持了对 AI 的重投入。

  李彦宏在 Create 大会开幕演讲中提到,百度是如今少有的同时具备人工智能四层能力的公司,这包括芯片层的昆仑 AI 芯片、框架层的飞桨深度学习框架、模型层的文心大模型和应用层的搜索、自动驾驶、智能家居等产品。

  四层布局对应 AI 的三驾马车,数据、算力和算法。数据是 “燃料”,算力是 “发动机”,它们共同训练出算法,基于算法训练的模型则像一套机械传动装置,能最终完成具体动作。算力由 AI 芯片提供,深度学习框架则是训练、优化模型的工具。

  百度是中国第一批自研 AI 芯片的互联网公司。百度的昆仑 AI 芯片发布于 2018 年,研发始于 2011 年。对外发布时,昆仑已支持百度业务多年,到 2020 年秋天之前,已有超 2 万片昆仑芯片每天为百度搜索引擎、广告推荐和智能语音助手小度提供 AI 计算能力。

  2016 年百度推出的飞桨在 2021 年成为中国开发者使用最多的深度学习框架,在全球排名第三。飞桨能帮开发者快速创建、部署模型,它现在已拥有 535 万开发者,服务了 20 万家企事业单位,创建了 67 万个模型。

  基于上述技术基础设施,百度在 2019 年发布文心大模型,它可以根据用户的描述生成文章、画作、图表、视频等多种内容,这即是去年至今大热的 “生成式 AI”。

  在文心的支撑下,百度搜索引擎可以用更聪明的方式呈现搜索结果,比如在百度手机 App 上搜索 “北京和上海的 GDP 谁高”,百度搜索引擎不会只返回谁高谁低的结果,而是生成两座城市历年 GDP 走势折线图,当用户手指沿时间轴滑动时,能显示不同年份的 GDP 差值。

  2022 年,百度又发布了 “知一跨模态大模型”。跨模态指它可以理解文本、图片、视频等形态各异的数据。有了知一后,当用户提问 “窗框缝隙漏水怎么办”,百度搜索引擎会提供一段优质视频回答提问,该视频还能自动定位到处理步骤的部分,方便快速查看。

  全球范围内,美国科技公司亚马逊、Google 也有类似的多层布局,而中国只有百度、阿里和腾讯。在应用层,阿里和腾讯暂未涉足前景巨大、挑战也巨大的乘用车全无人驾驶。

  在语言大模型中,百度甚至要做得比全球巨头更多,因为中文更难被 AI 处理。百度搜索产品总监张燕蓟在 Create 大会前的沟通会中称,中文语义的理解难度远大于非中文,因此百度必须研发一个更难、更复杂的大模型。

  “离市场很远的技术,很多时候是自嗨”

  自己建立 AI 各层能力的好处是,可以自己掌握芯片层、框架层、模型层和应用层间的效果反馈,能更高效地优化每一层能力。

  这是李彦宏在 Create 大会中提出的技术观,“反馈驱动创新” 的一部分。李彦宏说:“技术的发展,没有导航地图,只有指南针。在方向大致正确时,基于反馈、一步步迭代,才能跑出有价值的创新。”

  他举了一个魔方的例子:让一位盲人还原被打乱的魔方,在没有人提示时,假设盲人每秒转动魔方一次,他需要 137 亿年才能将魔方复原;而如果每转动一次都有人告诉他离还原是更近还是更远了,这个过程会缩短到两分半。“这就是反馈的神奇力量。” 李彦宏说。

  技术和商业上,反馈驱动创新,首先意味着复杂技术系统各部分间的反馈。李彦宏在 Create 大会中举了一个例子:在搜索引擎中,昆仑 AI 芯片负责数据的处理与计算,飞桨框架、大模型 “知一” 负责中文语义理解。百度现在每天要完成 1 万亿次语义推理,各环节配合,使整体检索成本下降了 50%。

  更大的反馈,是需求和技术间的反馈。在去年底内部讲话中,李彦宏反思了百度的有些技术 “离市场很远,很多时候是自嗨”:“发了顶会的论文,申请了专利,打了哪个榜,但是过一两年之后发现这东西没有人用。” 技术团队有时连公司内部客户的需求也没摸清楚,“当你去问负责的同学你愿意为这个技术付多少钱,他会说白用可以,让我出预算,我不愿意出。”

  李彦宏说,这种脱节持续久了,会使创新业务不再思考商业盈利时间表:“时间长了以后,大家觉得亏钱是理所应当的,不会去想这个业务再过三年能赚钱,还是再过五年能赚钱,还是再过一百年也不会赚钱。”

  李彦宏对技术产业化的另一重思考是看 “业务健康度”。李彦宏从去年就在强调这一概念,它指业务不只要有规模,还要毛利润率合理、标准化程度高、有长期盈利能力。

  一些百度的技术相关业务被李彦宏指出自研占比太低,他在年底内部讲话中说:“我们一个明星业务、高增长业务,仔细一看,自研产品只占收入的 20% 多,70% 多的东西都是转售。那你跟贸易公司有什么区别?有多少人意识到了其实这个收入质量不高?”

  “周报总是好消息,这不可能吧”

  百度的技术布局相对全面,近年市场对百度的一些疑虑与组织与管理有关。

  年底的讲话中,李彦宏对百度的组织风气有比较严肃的反思。在百度工作多年的一位人士称,过往的年底全员分享上,李彦宏大多关注员工成长话题,很少严肃谈论公司经营和工作方式。

  李彦宏重点批评了百度周报的 “报喜不报忧”:“有些人的周报永远都是好消息,但是他负责的那些事儿真的永远都符合预期吗?不可能吧?如果你不说哪些东西不符合预期,在哪儿遇到了困难,你的上级怎么帮你?反而你的上级都被你蒙住了,他以为你做得特别好,不需要任何帮助。”

  百度集团资深副总裁、HR 体系负责人崔珊珊 2021 年接受《晚点 LastPost》采访时说:“要提升创新能力,百度需要解放思想、实事求是,实事求是就是要一切从实际情况出发来研究和解决问题。认清现状,诚实面对,不可自欺。”

  在年底的内部讲话中,李彦宏还提到了一些沟通技术问题,重点讲了 “对齐难”。一家大公司从 CEO 到一线基层员工中间隔了 5、6 层,信息流通不畅、对齐难几乎是所有成规模公司的通病。

  李彦宏提到,百度的考核工具是 OKR,目标向下传递时会层层递减,传到最基层真正干活的一线员工时,他根本不理解 “我为什么要干这个事”。李彦宏希望每一级的员工站在一个更高的角度去思考这个问题。

  对齐难也发生在管理层,李彦宏说自己对同一批管理层讲过无数次不看收入只看利润,但下次开会时,大家汇报的依然是明年有多少收入:“花这么多力气在这对齐,讲一遍可能还不够,但总比不讲要强。”

  对于公司内的贪腐,李彦宏没有回避。

  内部会上有员工问到李彦宏怎么看马化腾在腾讯的内部讲话,马化腾谈及了业务部门的改革浮于表面、内部贪腐 “触目惊心” 等问题。李彦宏说:“马化腾说的那些问题,百度也都有,我们也在试图积极解决。” 一同参加全员会的崔珊珊补充:“反腐的例子百度也经常看到,也是 ‘吓死人’。”

  “希望 2023 年能有一个 1”

  李彦宏内部演讲中回顾这一年时感叹,自己活了 50 多岁,也觉得 2022 年是一个特殊的年份:“这些都是人生经历。发生了没想到的事情,再想办法应对,进一步找到其中可以做得更好的地方,对人的成长也有好处。”

  全员会的展望 2023 部分,崔珊珊用几张图展现了百度管理层的一些观察,包括去年底召开的中央经济工作会议。“一句话概括会议内容,就是 ‘明年是全力抓经济的一年’” 崔珊珊接着问李彦宏:怎么判断新一年的宏观形势和新机会?

  李彦宏说他对经济的长期发展感到乐观:“中央经常说我们的经济韧性十足,其中一个关键因素就是,中国民族文化就是 ‘我想干事儿、想赚钱、想生活得更好,哪怕吃点苦’,一旦有机会,很多人真的会冲上去。”

  值得百度 “冲上去” 的新机会是正在快速进化的 AI 技术。百度布局的技术中有两个最值得关注的方向:生成式 AI 和无人驾驶。

  百度在 2021 年发布了支持生成式 AI 的文心大模型,其前身可追溯到 2019 年发布的预训练模型 ERNIE 1.0。华为、阿里也在 2021 年发布了盘古和通义大模型。

  去年至今,市场上出现了能生成画作的 DALL-E 和 Stable Diffusion 等应用。微软曾投资 10 亿美元的 OpenAI 在去年底发布 ChatGPT,它能像人一样回答问题、写商业企划书、甚至改代码,马斯克形容其效果 “好到令人害怕”,生成式 AI 热潮被推向新高峰。

  据报道,ChatGPT 发布后,Google 管理层宣布 “红色警戒”(Red Code),评估它对搜索引擎的挑战,这是 Google 内最高级别的业务预警。使用 ChatGPT 时,发问者可以直接得到一段有逻辑的回答,使用搜索引擎得到的是一排网页链接。

  无人驾驶则是百度投入已久的方向,一旦实现,它能改变已延续百年的出行方式。百度无人驾驶业务布局全面,各方向都有进展:萝卜快跑是全无人驾驶商业化落地的探索;2021 年春天与吉利合资成立集度汽车后,百度也有了部署高级别辅助驾驶的载体。

  在甚少有硬件业务的中国大互联网公司中,百度是罕有的自己下场造车的公司,合理性在于:自己同时掌握汽车硬件层和智能驾驶系统层,能更好掌握反馈效果,获得更高的迭代效率。

  类似的安排是,去年 5 月,原本属于人工智能体系(AIG)的百度地图被调整至智能驾驶事业群。百度称此次调整是为了更好地让地图数据与路测数据结合,这一变化也符合李彦宏总结的反馈驱动创新。

  在内部讲话的最后,李彦宏说:“三个或四个新业务,只要有一个跑出来,我就觉得做得不错,新业务到 2022 年底还是 0,希望 2023 年出来一个 1。”

  如果单纯以商业价值衡量,百度利用过去十年的更高效方法是把 AI 用到一些如今大行其道的移动互联网应用上,如信息流推荐和短视频等。从这个角度,百度错过了 AI 过去几年最大的落地机会:推荐算法。

  百度十年前开始投入的一些方向是 “后天” 才会发生的事,它们来得更晚,带来的变化也更大,如完全替代人类司机、改变整个汽车行业的无人驾驶,以及能和人自由对话的智能系统。

  百度的强项是技术,相比之下以往的弱项是把技术变成产品的能力。过去有个时期,百度因为搜索的成功获得了巨量资源和太多的选择,投入又关停的方向包括外卖、团购、各种 O2O 生活服务等。但即使经历波折,百度依然保留了相对全面、多层次的 AI 技术火种。AI 并非每个阶段百度最大的重点,但它是百度坚持最久的事之一,也契合百度成立之初形成的技术基因。

  百度仍是中国互联网公司中,最有可能等到 “后天的回报” 的一个。前提是,更好地解决实事求是的问题,拉近技术和市场的距离。

  题图来源:由百度 AI 艺术和创意辅助平台 “文心一格” 生成。