百度亮出多模态AI创作大招,背靠文库9000万月活,瞄准AI杀手级应用

  智东西

  作者徐豫

  编辑云鹏

  智东西 1 月 22 日报道,在今年首场百度 AI Day 上,百度文库联手百度网盘正式推出 AI 创作平台“自由画布”公测版,打响开年第一炮。

  自由画布基于不同参数量大小的百度文心系列大模型,提供可复用程度较高的、多线程同步处理的多模态 AI 创作功能,比如 AI 生成视频摘要、AI 转录音频逐字稿、AI 长文撰写等。其旨在简化创作过程中,不同 AI 工具的繁杂操作,从而更高效地激发和变现人们的创作灵感。

  百度副总裁、百度文库事业部兼百度网盘事业部负责人王颖称,目前 PPT、长文、动漫、海报等形态对应的生成式 AI 功能,付费率转化需求仍保持高位。过去一年,百度文库 AI 功能的月活用户数已突破 9000 万,日活用户数同比增长超 230%,总付费率同比增长超 60%。

  此外,百度文库侧重于图文能力,百度网盘侧重于视频能力,两者打通后有助于直接从端到端帮助用户完成 AI 创作。趁着 AI Day 活动,百度文库还上线了深度 AI 编辑应用“橙篇”,而百度网盘则首发“简单”系列 AI 资源管理产品。

  一、文库 AI 月活超 9000 万,多模态 AI 新工具打通公私域资源

  今天的百度 AI Day 开场,王颖开门见山说出了她在使用各种各样的 AI 工具时,感受到的不便,并且“思想碰撞的效率不高”。她举例道,在这个信息过载的时代,有时候时长 2 小时的视频,有用的核心内容只有 2 分钟。

  她认为,过去人们借助 AI 工具表达个人想法的门槛很高。AI 工具虽多,种类也越来越丰富,但对于大多数人而言,要高效、熟练掌握不同 AI 工具的用法,反复在各个 AI 工具之间切换使用,并没有真正实现 AI 提效。

  当前内容生产消费有 3 大痛点,分别是高门槛、限模态、大成本。在王颖看来,减少各类 AI 工具间的边界感,让“创想”直达“创作”,是下一个消费级 AI 应用的风口。

  因此,百度文库和百度网盘此次联手搭建了“自由画布”,一个全新的内容操作平台,主打“忘掉模态、文件格式的限制,随心 AI 创作”。具体来看,其支持文档链接、音视频等“全格式输入”,AI 研报、AI 画本、AI 识图等“全场景处理”,以及思维导图、漫画、演示文档等“全模态输出”。

  作为内容生产消费的两端,百度文库负责内容生产起点的资源供应,百度网盘负责内容消费终点的资源存储,可以说是自由画布商业化的双引擎。百度网盘的个人私域数据和百度文库的全网公域数据,共同构成了自由画布的数据底座。

  据王颖分享,目前百度文库积累了 14 亿文档资源和 4 亿学术资料,文档类型覆盖期刊文献、资格考试、行业资料等。而百度网盘的用户使用空间综合已达到 1000 亿 GB,每年存储数据增加 60%,涉猎生活、文娱、办公等场景。

  这两款国民产品打通后,用户在自由画布上 AI 创作的内容,后续不仅可以分享到私域,还可以转发到公域。

  目前,百度文库 AI 功能月活用户数已突破 9000 万,付费用户数以 4000 多万全球排名第二、中国排名第一。从 2023 年四季度到 2024 年四季度,百度文库 AI DAU 同比增长超 230%,总付费率同比增长超 60%;同期百度网盘 AI DAU 同比增长超 90%,AI 收入同比增长超 120%。

  二、一个 UI 界面,就能讲故事、写文章、设计海报

  现场,百度文库 AI 产品负责人钟昊提出从传统模型到大模型,AI 专用能力逐渐通用化。因此,新一代 AI 工具主要解决端到端交付、纯自然交互、全模态支持 3 大内容生产创作瓶颈。

  在钟昊看来,市面上大部分 AI 工具需要打开一大排网页、反复切换应用面板里的大量按钮后,才能完成一次 AI 内容的创作和发布。因此,自由画布采用的是“拖动”、“圈选”等更接近自然人机交互的方式。

  用户把素材拖入自由画布后,可以通过框选自由排列、多线程操作自由画布上的元素。例如,框选部分素材后,用户可指定 AI 参考其中某个段落的文风、参考某一部分的逻辑框架、总结某个视频的内容等,从而让 AI 以尽可能类人的交流方式,理解用户的真实需求。

  据钟昊分享,自由画布已落地智能画本生成、智能小说续写、研究报告撰写等应用场景。

  其中,智能画本支持用户上传个人形象,定制化生成画本内容,还可以帮用户省去撰写故事梗概、配图上色等环节,一键获得“睡前故事”。

  而在海报制作方面,用户生成一版智能画报后,可以在原设计上二次编辑、调整。百度文库方面称这是行业内首创。

  另外,AI 全网搜、文章大纲、PPT 等生成结果自带排版,比如标题加粗、统一行间距、套用 PPT 模版,并自动配上表格、思维导图等,方便用户直接复用。

  以热门综艺《再见爱人》中,麦琳、李行亮这对夫妻的心理学分析报告为例,自由画布可以同步参考该综艺切片、相关分析文章、相关评论音频等素材,整合生成一份心理学分析报告,并且可以进一步修改内容和格式细节。

  从钟昊现场分享的实测案例来看,自由画布也能解析影印版,即并非原版文档格式的车企研究报告。其除了完成基础的检索、摘取、生成长文,当前 1.0 版本还可以自动识别报告中的财务数据图表,并直接拷贝出来,然后插入到 AI 长文对应内容处。

  在自由画布之外,百度文库还推出了一个名为橙篇的产品,其一站式整合了专业知识检索和问答、长图文理解和生成、深度编辑和整理 3 大功能。在橙篇编辑器内,用户可以进一步借助 AI 自动优化文章内容、表格、语言风格等细节方面。

  三、“简单”AI 工具,盘活“积灰”网盘资源

  百度网盘产品及运营部负责人吴天昊紧接着分享了百度网盘的 AI 新动态,他提到百度网盘正在从一个临时堆砌资源的“仓库”,转变为有生活、工作、娱乐分区的“家”。

  AI 时代下,百度网盘将转型为一站式内容存储、管理和消费平台。相应地,其也上新了“简单”系列产品,包括简单扫描、简单听记等。

  在简单扫描中,手绘草图可以利用 AI 技术直接生成完整画作;在简单听记中,智能会议助理可以作为“AI 分身”代替你参会。

  结语:多模态多任务同步 AI 处理,找准差异化路线

  百度文库自由画布公测版上线,意味着该一站式 AI 创作平台的准确性、稳定性、安全性来到了新的阶段,率先打通多模态、多格式 AI 交互、公域私域资源壁垒,抢跑国内多模态 AI 创作竞赛。

  与国内其他主流多模态 AI 生成产品相比,自由画布的主要创新点在于多模态素材平铺的 UI 界面和多线程任务处理,而各家底层的模型能力相差不大。据百度文库方面透露,自由画布预计几个月后升级至 2.0 版本,进一步丰富自由画布与百度网盘之间的资源互通场景。