大语言模型席卷大厂,为什么百度能先人一步?

  ChatGPT 的破圈爆火,把大语言模型推到风口浪尖,让百度、微软、阿里等互联网大厂纷纷瞄准这一赛道。

  然而趋于冷静后我们能够发现,大语言模型却是一个非常“烧钱”的项目。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。由此也就不难理解,大语言模型 并不是一朝一夕就能完成的。算力作为训练的基础条件,如果不具备这一核心因素,做出大语言模型就成为了空谈。

  那么在国内,谁将成为第一个做出大语言模型的科技大厂呢?近日,百度宣布将在 3 月 16 日围绕其生成式 AI 产品、大语言模型“文心一言”召开新闻发布会,成为全球第一个明确大语言模型产品落地时间的科技公司。

  实际上,百度能在这波 ChatGPT 的热潮下抢占头筹也并不意外。百度深耕人工智能领域十余年,拥有芯片、框架、模型和应用四层技术栈。基于长期技术投入,百度基础能力完全具备、具有综合优势,不仅能够实现整体持平 ChatGPT,甚至还有机会做到局部超越,超越部分包括知识增强、检索增强和对话增强。

  知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础;检索增强则是指,在大模型底层上,搜索架构和生成式 AI 架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

  此外,在对话一致性、长期记忆和多轮对话丰富度上,文心一言也可能有更好的表现。百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖;“百度大脑核心技术与开放平台”获中国电子学会科技进步奖一等奖;百度超级智能助手也曾获中国专利金奖。

  接下来,百度计划将多项主流业务与文心一言整合。李彦宏在财报电话会上提到:“我们相信文心一言将改变云计算的游戏规则,人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”据了解,文心一言将通过百度智能云提供服务,吸引企业和机构客户使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。目前,已有超 500 家企业宣布加入“文心一言”生态圈。

  3 月 16 日 14 点,百度计划在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。文心一言的率先推出,到底能给行业带来哪些颠覆?让我们拭目以待!