李彦宏大模型“创业”400天

  “过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋、又害怕错过。”

  面对在生成式 AI 浪潮中正被彻底改变的开发者群体,4 月 16 日对外演讲中,李彦宏率先谈起了他们所遭遇的选择迷茫问题。

  部分大模型头部创企开始走上 “双轮驱动”路线——既做模型又做应用,既想避开模型能力不断进化后,很多应用场景可能被完全覆盖的风险,又不想错失借助应用收集更多数据的机会。

  但并不是所有创业者都能玩转“双轮驱动”策略。在近期一次公司内部分享中,李彦宏就明确表示,“双轮驱动”不是一个好的模式。“创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情,哪个成功率更高是不言自明的。”

  对于更多资源有限的普通创业者、开发者来说,在大厂现有模型基础上开发相关应用,或许是一种更具现实性的抉择。

  即便如金山办公这类已上市公司,也因高昂的前期投入成本,以及自研大模型商业化上的不确定性,决定引入外部模型;即使强大如微软,也直接引进了 OpenAI 的大模型,而非从头原创。更重要的是,各行各业创业者所积累的行业 Know-How,不仅是驱动大模型不断进化的关键数据要素,还是创业者有针对性开发行业大模型和 AI 应用的机会所在。

  “大模型本身并不直接创造价值,基于大模型开发出来的 AI 应用才能满足真实的市场需求。”李彦宏在演讲中再次呼吁道。

  从去年 3 月 16 日文心一言正式亮相至今,过去近 400 天时间内,李彦宏带领百度成为推动 AI 应用落地的最强有力声音。

  截至目前,文心一言用户数、API 日均调用量双双突破 2 亿,服务客户数达到 8.5 万,利用千帆平台开发的 AI 原生应用数超过 19 万。

  爆款 AI 应用的缺失,直接导致业界情绪的低迷。从去年下半年开始,无论是用户还是投资人,对大模型的态度都变得更为冷静。

  直到今天,“无论是中国,还是美国,最好的 AI 原生应用还没有出现。”在李彦宏看来,就像移动时代诞生了像微信、抖音这样的“mobile-native”的应用一样,AI 原生时代一定会有新的超级应用将基于大模型开发出来。

  但上述超级应用的诞生不会在短时间内骤然出现。这既需要基础大模型技术能力不断迭代,也需要越来越多开发者参与其中。

  A

  搜索“什么时候去新加坡人最少”,以前百度 APP 只能给你呈现一系列网址链接,现在它可以明确告诉你答案,“1-3 月人最少”。

  体验改善的背后,得益于百度在 Creat2024 百度 AI 开发者大会上最新提供的零门槛智能体开发工具 AgentBuilder。这是百度降低 AI 应用开发门槛,吸引更多普通开发者投入其中的又一神器。

  打开文心智能体平台,新手小白直接选择“零代码模式”,用自然语言,便能复现上述操作:先给智能体起名叫“新加坡旅游局”,然后在设定里写明需要打造旅游方案、解答问题,提供酒店门票预订服务,在高级配置中将新加坡百科词条和官网链接添加到知识库里,确保实时更新。一个可供查询、预订门票等服务的新加坡旅游局智能体便做好了。

  据字母榜(ID:wujicaijing)了解,目前文心智能体平台已有超过 1 万个百度的客户拥有了商家智能体,涵盖了教育培训、房产家居、机械设备、商务服务等超过 30 个行业。

  值得一提的是,相比其他平台提供的智能体开发工具,文心智能体平台还配套提供了流量变现通路。除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体的相关能力,尽可能解决开发者商业变现的后顾之忧。

  对于不满足于 AgentBuilder 的开发者,百度还提供了另一 AI 原生应用开发工具 AppBuilder,开发者最快只需三步,就可以用自然语言开发出一个 AI 原生应用,甚至已经有人借此拿到了 10 万元比赛奖金。

  今年年初的一期 AI 原生应用开发挑战赛上,百度给出的赛题是利用 AppBuilder 打造一款“游乐场排队规划助手”,以环球影城为例,帮助游客更好地了解游乐场排队情况,设计个性化的游玩路线,在有限时间内获得最好的游玩体验。

  最终获胜的冠军选手,先是在 AppBuilder 开发界面给应用起名“游乐场排队助手”,然后在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等,最后一步是到工具组件中,把代码解释器添加进来,帮助运算。

  实际测试环节,当在右侧输入问题“我有 3 个半小时时间,怎么玩最刺激?”后,代码解释器得出将《哈利波特禁忌之旅》《侏罗纪大冒险》《霸天虎过山车》《大黄蜂回旋机》,这四个项目组合游玩,效果最佳。

  对于有更高需求的专业开发者,百度还准备了一款有各种尺寸的模型定制工具 ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调。

  达成上述效果的过程中,离不开 ModelBuilder 里面预置的丰富大模型储备资源,包括了百度自有的通用大模型 ERNIE3.5 和 ERNIE4.0,三个轻量级大模型 ERNIE Speed、Lite、Tiny,以及两个垂直场景的模型 ERNIE Character 和 ERNIE Functions,同时还覆盖国内外 77 个第三方主流模型。

  B

  智能体开发工具 AgentBuilder,AI 原生应用开发工具 AppBuilder,以及各种尺寸的模型定制工具 ModelBuilder 的推出,只是过去近 400 天的大模型“创业”中,李彦宏为降低开发者门槛,加速 AI 应用落地,推出的一系列举措之一。

  为了抢占国内大模型产品上市先机,2023 年春节过后,百度组建“项目组”,由李彦宏亲自过问、CTO 王海峰挂帅,两人保持着每晚和所有相关技术、产品人员开会的节奏。

  2023 年 3 月 16 日,百度终于赶在所有国内厂商前面,率先发布文心一言,李彦宏在会上首度明确,“大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。”

  为了让更多开发者加入 AI 应用中来,李彦宏不仅手把手教用户写 Prompt、做 AI 原生应用,还在去年 5 月启动了“文心杯”创业大赛,成为国内第一个聚焦应用层的创业大赛。

  除了为参赛团队提供文心大模型 API 接口,以及百度智能云算力资源外,百度还设置了价值 1000 万元的投资奖励。

  时隔近一年后,4 月 16 日演讲现场,李彦宏再次宣布,第二届“文心杯”创业大赛正式启动。除了项目筛选范围扩大、设置分赛场外,百度还首次设立了“特别大奖”,最终获胜的 AI 原生应用项目将有机会获得最高 5000 万元的现金和资源支持。

  借助创业大赛推动 AI 应用生态繁荣之外,百度还在使用效果和成本环节,尽可能让更多开发者可以高效、低价地用大模型来做 AI 应用。

  依托百度在芯片、框架、模型、应用四层架构上的全栈布局优势,相比一年前,文心大模型算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的1%。这意味着,客户原来一天调用 1 万次,同样成本现在可以调用 100 万次。

  C

  在吸引外部开发者聚焦应用层面之外,百度自身成为李彦宏重构 AI 原生应用的第一步。

  去年的中关村论坛上,李彦宏首度对外明确:“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”李彦宏眼中的 AI 原生应用,不是简单重复移动互联网时代的 APP,或者 PC 时代的软件,而是去解决过去解决不了或解决不好的问题。

  在上述理念指导下,过去一年内,百度相继完成了十余款应用的重构,输入法、搜索、网盘、地图、文库等一系列用户量过亿的产品均在其中。

  尤为值得一提的是文库。完成从“内容工具”向“生产力工具”进化的百度文库 AI 新功能,在去年上线 2 个月时间内,便累计下超过 1300 万使用用户、累计功能使用次数更是破亿。

  被 AI 重构后的新百度文库,更是被李彦宏称赞为百度内部“重构最彻底的一款产品”。去年二季度财报电话会上,李彦宏表示,百度文库的“AI 文档助手”功能发布后,用户的使用时长翻了一番多,7 日留存率提升了将近 10%。“我们可以转化更多的用户,也可以将更多的用户转化为付费账户,并在未来对新的人工智能功能收取额外费用。”

  在提升百度货币化率之外,被 AI 重构后的各个产品,也开始建构起新的协调机制。微软 CEO 纳德拉就曾在一次讨论会中表示:“最终希望用 AI 打破应用之间的界限。”如今,通过使用 AI 控制和检索信息,李彦宏也正在带领百度打破每款应用原有的工作流程,帮助公司业务走向更加紧密的一体化。

  对百度自有应用的 AI 化重构,也承载着李彦宏对外打造百度 AI 技术效果和实力试验田的愿望。

  有“科技预言家”之称的凯文·凯利曾分享过一个观点,认为“每一次技术革命都是一次权力的重构。”微软借助 Windows 创造了应用创业新机会,网景借助浏览器开创了网站创业新机会,谷歌、苹果分别借助 Android、iOS,开创了移动应用新机会。现在,生成式 AI 借助大语言模型,正在带来新的改写应用的新机会。

  在新的权力重构过程中,模型和应用的关系都在发生变化:一方面,随着模型体量变大,很多应用生存空间被碾压;另一方面,随着应用开发者变多,其对模型先进性的追求愈来愈高。

  面向未来,在文字、图片、语音、视频等多模态大模型的长期竞争中,留给李彦宏的新挑战之一便是,如何带领百度继续保持模型性能的领先优势。