AI新时代,是时候重估百度了

  摘要

  基于人工智能大语言模型,百度业务迎来新一轮升级。

  发力 AI 近十年,百度正在迎来最好的机遇。

  2 月 22 日晚间,百度发布 2022 年 Q4 及全年未经审计的财务报告。2022 年全年,百度实现营收 1236.75 亿元,归属百度的净利润(非 GAAP)206.8 亿元,同比增长 10%。

  第四季度,百度实现营收 330.77 亿元,归属百度的净利润(非 GAAP)53.71 亿元,同比增长 32%。2022 财年,百度核心业务连续四个季度业绩超市场预期。

  除了公布财务业绩,对于近期备受关注的类 ChatGPT 产品「文心一言」,李彦宏在电话会上表示,文心一言将率先集成进搜索产品,通过新功能吸引到更多的用户,并给广告业务带来更多机会。

  2022 年以来,百度围绕文心大模型展开了一系列动作。5 月,百度提出了「构建更适配应用场景的模型体系」;11 月,文心大模型全面升级,发布了包括 5 个行业大模型在内的 11 个大模型,同时发布了 AIGC 绘画产品「文心一格」。

  关于即将发布的「文心一言」,截至目前已有爱奇艺、集度、小度、智联招聘、太平洋汽车网等多个合作伙伴宣布加入百度文心一言生态圈。

  基于长期建立的大模型体系,百度已有的业务体系也有望迎来新一轮升级。不论是百度自身的 C 端搜索产品,还是旗下的小度音箱等产品,都能够直接接入语言大模型的能力,获得性能和体验提升。

  而以 AI 能力为优势的智能云业务,接入大模型能力后,也将能够向企业客户输出语音交互、内容生成的能力,赋能软件企业。

  百度创始人、董事长兼首席执行官李彦宏表示,「凭借在 AI 领域的长期投入,百度将抓住即将到来的 AI 拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。」

  01 核心业务持平,多项主流业务与「文心一言」整合

  2022 年对中国乃至全球互联网公司来说都是极其不易的一年。但整体来看,百度在 2022 财年的业绩表现依然相当稳健。

  总体来看,百度的核心业务持平,营收增长由非在线营销收入贡献。李彦宏在财报会上表示,随着疫情缓解,在线营销开始出现复苏迹象。

  2022 财年,百度核心业务营收为 954 亿元人民币,与去年基本持平。其中,网络营销业务营收为 695 亿元人民币,同比下降 6%。

  非在线营销收入方面,2022 年的整体营收为 259 亿元人民币,同比增长 22%,主要由云计算和其它基于 AI 驱动的业务推动。

  业务表现上,过去一年,百度搜索规模年同比增长 17%;移动端搜索查询次数和信息流分发量,均实现了两位数的同比增长。百度 App 月活用户数于 2022 年 12 月达到 6.48 亿,同比增长 4%。此外,2022 年前九个月,小度位居中国智能屏和智能音箱出货量第一。

  在智能云业务上,百度 ACE 智能交通系统从 2021 年的 35 个城市扩展到 69 个城市,合同金额超过 1000 万元人民币。根据 IDC 2022 年上半年发布的中国公共云市场报告,百度第四年被评为第一大人工智能云供应商。李彦宏在内部信中表示,「百度智能云利用 AI 技术,为行业提供标准化的解决方案,提高了利润率。」

  智能驾驶方面,截至 2023 年 1 月底,萝卜快跑累计订单量超过 200 万单。

  升级后的文心大模型体系|来源:百度

  相比已经存在的基本盘,今天更受关注的还是百度在语言大模型方向的探索。作为百度乃至国内发布的首个类 ChatGPT 产品,文心一言的进展,背后的文心大模型,以及与现有业务结合的规划,都是外界关注的重点。

  未来,百度主流业务将与文心一言整合。除了升级相关产品外,李彦宏强调了其对云服务的意义,「之前选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这会根本性地改变云计算市场的游戏规则。」

  02 始于四年前的文心大模型

  ChatGPT 出圈,让普通人也感受到语言大模型的能力与优势。而在产业界,对于大模型的探索已存在多年。谷歌等公司 5 年之前开始语言大模型的布局。对 AI 技术持续投入的百度,也在 4 年前开始了大模型的技术积累。

  谷歌 2017 年发布神经网络架构 Transformer 后,语言大模型开启了新时代。Transformer 能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了语言的理解能力。如果将语言大模型比喻成复杂的建筑,Transformer 便是搭建时最好用的砖头。

  在此之后,所有的大模型,都基于这一架构进行设计。2018 年,谷歌发布发布了基于 Transformer 的预训练大模型 BERT;Open AI 则发布了 GPT,这是 ChatGPT 的第一代模型。

  紧随其后,百度于 2019 年发布了初代文心大模型:ERNIE 1.0。这也是文心系列模型的起点,初代文心模型基于谷歌 BERT 模型结构,增加了优化设计。

  预训练模型大模型可以看作一种新的研究思路。在过去,自然语言理解有各种不同的任务,如翻译、知识问答、多轮对话等。解决每一个问题,需要专门训练出模型,但能力的提升却容易遇到瓶颈。预训练模型则换了另外一种思路,先用大量数据训练出一个具备基础语言理解能力的模型,再通过少量数据的微调,让其具备处理某种任务的能力。

  文心大模型优化的一个关键点在于加入了知识图谱。作为一种信息加工方式,知识图谱将现实世界中存在的概念、以及相互关系用符号表示出来,最终形成一个可视化的「图谱」。将这种方式加入预训练,就增加了大模型在知识相关任务上的能力。

  在训练数据上,文心大模型也有明显特点。基于百度自身的数据优势,训练模型的语料来自百度百科、百度新闻、百度贴吧、以及中文的维基百科。这其中包含了大量的知识性的语料。

  2019 年 7 月,百度再次升级模型,发布了 ERNIE 2.0,并在 2020 年全球全球规模最大的语义评测比赛 SemEval 上,获得了 5 项世界冠军。发展至今,百度语言大模型文心一言突出的能力是「知识增强」,能够生成对话、进行文本创作。

  大模型是未来 AI 产业体系的重要组成,但要把大模型用起来,还需要底层算力、上层应用的共同搭建。百度也在这一方向上进行了诸多实践。

  「文心一格」平台页面 |来源:百度

  直接支撑文心大模型的平台,是飞桨产业级深度学习框架。这是目前被广泛使用的深度学习框架。截至 2022 年 11 月底,飞桨平台上已凝聚 535 万开发者、创建 67 万个 AI 模型,服务 20 万家企事业单位,位列中国深度学习平台市场综合份额第一。在百度 AI 能力的整体架构中,深度学习框架位于第二层,整体的四层能力包括「底层芯片+深度学习框架+大模型+应用层」。

  去年底,百度发布了最新的生成式 AI 产品「文心一言」,这是应用层的最新产品,目前已经被不少新媒体用来生产配图素材。这是一个 AI 作画平台,由飞桨学习框架和文心大模型提供技术支持。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,百度将文心大模型已经形成「模型层 + 工具与平台层 + 产品与社区层」的整体布局。

  「文心一格」产品的发布,意味着百度已经开始积累大模型的工程化落地能力,而接下来「文心一言」产品的发布,将沿着这一方向进行更多探索。

  03「文心一言」融入更多业务

  深度学习三巨头之一的 LeCun 表示,新的 AI 热潮,将带来企业内部深度学习研发的复兴。对于百度来说正是如此。与学术性质的研发不同,在企业中的技术研发,不仅仅涉及概念验证,还因探索与业务场景结合、规模化而需要更大成本。

  如微软总裁纳拉德所说,AI 将从根本上改变每一个软件类别。如今,正来到了探索大模型与更多业务场景结合、赋能产品的加速时期。百度也已经公布了相关规划。

  三月份即将发布的「文心一言」(ERNIE Bot)是基于文心大模型所发布的新的语意理解平台。从英文名 Bot 可以看出,底层的技术将是一个类似聊天机器人(Chatbot)的对话模型。「文心一言」将会利用跨模态、语言理解和生成能力等,为人们提供自然流畅的聊天体验。

  对于百度来说,拥有了这样的新技术平台,首先能够提升的便是搜索产品。目前,搜索产品的收入大约占到百度整体收入的 60%,依旧是最重要的产品之一。

  多年来,搜索产品的形态和用户体验没有太大的变化。当对话体验与原有的搜索引擎形成互补,用户在搜索相关链接的同时,也能够直接阅读定向生成的内容,将是十多年来搜索产品最显著的一次产品变革。这也将成为互联网的新流量入口。

  这种对话能力,还能够接入智能座舱的场景中,以语音交互的形式体现。前不久的三里屯体验中心启动会上,集度 CEO 夏一平表示,「集度将融合百度文心一言的全面能力,支持汽车机器人实现自然交流的再进阶。」当新的模型能力接入汽车终端,人们在座舱内不仅能够通过语音对设备进行更全面的控制,还能够获得类似于和一个「人」交流对话的体验。

  除了 C 端产品之外,模型能力也将接入百度的智能云中,为 B 端服务能力带来提升。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,「文心一言」将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。

  将大模型的能力引入云服务,将是必然的趋势。微软此前已经表示,计划将 OpenAI 的多项技术引入 Azure 云服务中,包括 ChatGPT 以及绘画模型 DALL-E。将来,通过云服务的方式,AI 改写软件的进程才会真正发生。

  百度智能云宣布,将在 5 月推出针对「文心一言」模型的 API 接口。这将使百度智能云在语音合成、机器翻译、自然语言处理方面的服务能力提升,客户可以直接调用相关能力应用到具体的场景里。

  去年百度智能云年增长为 12%,在 AI 云市场位列第一。具体而言,在数字人、智慧城市等领域,百度智能云为市场份额第一。百度搜索业务之外的其它业务,主要受智能云及其他 AI 驱动业务的推动。大模型能力的接入,将带来更强的增长势能,也将拓展 AI 云的服务范围。