
作者:产品老A
本文核心观点:
- 当前所有 AI Native 产品本质都是基于 LLM + workflow 构建而成。
- 真正的 AI Agent 应当是 LLM 内部具备推理、规划、记忆和调用工具的能力,而非通过外部 workflow 实现。
- LLM 能力越强,越能取代 LLM + workflow 的应用,DeepSeek 的崛起已经对很多 AI 产品形成了能力覆盖,即不需要构建复杂的工作流就能完成特定场景的任务。
- 以 OpenAI 为代表的闭源大模型公司都转变为 Agent 公司,不再以出售 API 而是 Agent 服务盈利。
2024 年 2 月,瑞典金融公司 Klarna 的客服中心发生了一件怪事:原本需要 700 名员工处理的客户聊天,突然被一个「看不见的员工」接管了三分之二。这个名为「AI Agent」的数字员工,用 30 天时间完成了人类需要半年的适应期——它不仅能精准识别用户情绪,还会根据实时政策调整话术,甚至在发现系统漏洞时主动触发工单。更关键的是,它从未调用过外部工作流引擎。
这场静悄悄的革命,撕开了 AI 应用的「皇帝新衣」:那些被称作「AI 原生」的产品,本质上仍是 LLM 套着 RPA 的壳在跳舞。而真正的 AI Agent,正在学会像人类一样思考——用大脑(LLM)而非拐杖(外部流程)完成任务。
LLM + workflow
一、被误解的「AI 原生」:当 LLM 沦为流程打工仔
今天打开任意一个 AI 助手,背后都藏着一套复杂的「提线木偶」系统:用户输入→意图分类→调用 API→执行动作→返回结果。这套诞生于 2023 年的「LLM+workflow」架构,本质上是让大模型扮演「人肉 API 调用器」。就像咖啡厅的新手学徒,虽然记住了所有配方,但每做一杯咖啡都要翻笔记本确认步骤。
基于 LLM 的 AI Agent 系统架构
某知名智能客服的代码库里,光是意图分类的规则就有 1.2 万条,每个对话节点都牵着数十个 API 接口。讽刺的是,当用户问「如何给老人预约疫苗」时,系统需要先调用地理位置 API,再跳转医疗系统接口,最后生成话术——而这一切,本可以通过 LLM 的「常识推理+多轮记忆」能力直接完成。
腾讯研究院的调研显示,83% 的企业 AI 项目存在「流程冗余」:明明大模型能理解「帮用户查询逾期账单并生成还款计划」,却非要拆分成 12 个独立 API 调用。这不是技术限制,而是思维惯性——就像自动挡汽车普及后,仍有人坚持左脚踩离合。
二、DeepSeek:当 LLM 开始「内生智能」
今年 1 月 20 日发布的 DeepSeek-R1 模型,给出了另一种可能。在测试中,它无需外部工具链,直接完成了「策划一场跨城求婚」的复杂任务:首先根据用户提供的聊天记录推断女友的喜好(记忆),接着分析天气和场地可用性(推理),然后规划出「公园野餐→无人机灯光秀→密室惊喜」的路线(规划),最后甚至自动生成了应急方案(备用室内场地)。整个过程,模型只用了 3 次自洽的思考链。
这种能力的本质,是 LLM 正在发育出「认知操作系统」。就像人类大脑的前额叶皮层,新一代模型开始内置:
- 记忆宫殿:在对话中自动建立上下文索引,比如记住用户 3 天前提到的「母亲对花粉过敏」
- 决策树生成器:面对「帮用户投诉快递破损」时,自动枚举「联系客服→拍照取证→申请赔偿」的优先级
- 工具直觉:需要调用地图时不再依赖固定 API,而是通过自然语言描述「查一下深圳湾公园的开放时间」
百度「橙篇」的技术负责人透露,他们的长文生成模型已实现「零工作流」创作:输入「新能源汽车电池回收的困境」,模型会自动完成文献检索(内置学术知识库)、数据对比(历史报告记忆)、逻辑框架搭建(因果推理),最终输出 8000 字深度分析——这在传统架构下需要至少 5 个工具协同。
三、OpenAI 的「转变」:从卖 API 到卖「数字员工」
根据今年 3 月 13 日的报道,OpenAI 推出全新的 Responses API,明确定位为“Agent 的构建模块”,支持搜索、文件查阅、本地任务执行等多步操作。与传统 Chat Completion 按“输入/输出 token”计费不同,Responses API 首次提出“按工具调用和任务结果计费”。这背后,是 Klarna 案例的大规模复制——当 Agent 能直接交付业务结果(如处理 70% 的客服咨询),企业愿意为「价值」而非「算力」买单。
投资机构 a16z 的观察更犀利:下一代销售系统的核心,不再是 CRM 里的静态数据,而是能「理解客户情绪、预判需求、自动生成跟进策略」的 Agent。某头部车企的试驾预约系统已证明:内置 LLM 推理的 Agent,比传统流程式客服的转化率提升 42%,因为它会在用户犹豫时,自动调用历史对话中的「家庭用户更在意安全」的记忆点。
这种转变正在重构 AI 产业生态。曾经靠卖 RPA 工具发财的厂商,突然发现客户开始问:「你们的流程能不能用 DeepSeek 的模型替代?」就像智能手机淘汰 MP3 时,没有人是无辜的。
四、Agent 的终极形态:当 AI 学会「自己写剧本」
想象一个无需预设流程的法务 Agent:当收到合同违约通知时,它会先分析条款(内置法律知识库),接着调取客户历史履约记录(记忆),然后判断协商/仲裁的胜率(推理),最后自动生成律师函并同步证据链。整个过程没有人工干预,没有固定 API,只有模型内部的「思考-决策-行动」闭环。
这种「内生智能」的进化,正在改写 AI 应用的三个底层逻辑:
- 从「流程驱动」到「目标驱动」:Agent 只关心「如何帮用户解决问题」,而非「下一步该调用哪个接口」
- 从「被动执行」到「主动规划」:就像优秀的助理会预判会议需要的资料,Agent 会在用户提问前准备好备选方案
- 从「工具集合」到「认知主体」:当模型能自主调用插件(如用自然语言「查天气」替代固定 API),外部工作流将失去存在意义
微软研究院的最新实验显示,具备内生规划能力的 Agent,在复杂任务处理上的效率是传统架构的 3.2 倍,错误率下降 67%。这不是简单的技术迭代,而是 AI 从「自动化工具」到「智能主体」的质变。
五、AI Agent 的寒武纪大爆发
回到 Klarna 的案例,那个「看不见的员工」正在揭示未来:当 LLM 真正学会思考,所有需要「按步骤操作」的工作流都将消失。就像人类不需要「先迈左脚再迈右脚」的走路指南,强大的 AI Agent 会自己走出最优路径。
LLM 即 Agent
现在,DeepSeek 的模型已经能在金融、法律、教育等领域实现「零工作流」落地,OpenAI 的 Agent 服务正在重构企业付费逻辑,百度的「橙篇」则证明长链创作无需外部流程。这场革命没有硝烟,但每个从业者都能闻到变革的味道——当 AI 开始自己写剧本,那些还在画流程图的人,注定会被时代的洪流裹挟着向前。
或许正如某位工程师的调侃:「以前我们教 AI『怎么做』,现在要开始问它『怎么想』了。」而这,正是智能时代最激动人心的转折点。