618剁完手后悔,AI能治?

  梦晨发自凹非寺

  量子位公众号 QbitAI

  要问现在最新潮的 AI 玩法?那一定是 Agent 智能体了。

  自 OpenAI 的 GPTs 带头之后,各大 AI 应用纷纷推出一键@不同智能体协作,以及配套的创建智能体功能。

  这段时间试了一下智谱清言的智能体平台,在“工具助手”里发现一批特别的存在:

  除了官方提供的计算器、天气查询等基础工具,还有第三方服务 API 接入了。

  比如这个什么值得买,感觉就很眼熟啊,Kimi 之前发布的第一批智能体 Kimi+ 中似乎也见过它。

  没错,就是那个外号“张大妈”的电商消费指南 APP。

  在上面可以比价、领优惠券,还能看到网友分享的好物推荐和购物经验。总之,这是一个能帮你进行消费决策,又能帮你省钱的宝藏 APP 了。

  大模型+什么值得买?难道,这是一种 AI 商业化新玩法?

  好奇心驱使下,我们找行业内朋友八卦了一下,发现还不止这两家。

  接下来还有讯飞星火、百川的百小应、MiniMax 的海螺 AI 等等,一批大模型 APP 都准备和什么值得买联合推出消费智能体……

  张大妈到底是什么魅力,率先成为各大大模型公司的选择?

  AI 导购智能体,有何特别之处?

  要搞明白这些问题,不如先上手试玩一下。

  首先来看看与通用 AI 聊天机器人相比,专门的 AI 导购智能体还能玩出什么花样。

  先试试 Kimi+ 上的,用同样一个问题对比“什么值得买智能体”和默认的“Kimi 智能助手”

  可以看出,Kimi 智能助手通过联网搜索也能获取 2024 年新款型号的知识,不过看起来就像是在把每个产品搜到的信息粘贴过来,各说各的,呈现格式上也有点乱。

  再看 AI 导购智能体的表现,几款产品都按相同的格式来介绍,看起来就舒服多了。

  除了配置信息之外,还能展示出 618 期间的到手价格,甚至具体到不同配置、不同颜色的价格差异。

  顺着 AI 给的参考链接点进去就能发现,部分产品型号和配置信息与通用 AI 助手一样是从全网搜来的。

  而实时的优惠信息来源,更多就来自什么值得买上的“好价”频道了。

  用过什么值得买的人,基本都会对它的价格周期曲线、全网渠道比价、隐藏优惠寻找等等等等功能……直呼真香。

  而这部分能力,也开始和 AI 相结合了。

  顺藤摸瓜,我们发现什么值得买自家 App 中,还藏着一个惊喜:官方智能体”小值”

  一番测试之后,我们发现“小值”在 AI 文字输出部分的体验与 Kimi+、智谱清言上的倒是大体一致,但与 APP 的整合更深入。

  如果让 AI 推荐一些商品,后面会附上商品列表,挑选后就可以一键跳转到对应的电商平台加入购物车了,一步到位。

  根据底部提示,除了商品推荐之外,还有“商品口碑”、“优惠查询”、“商品对比”等不同种玩法。

  对一款商品的评价往往众说纷纭,去评论区挨个翻也费时费力,AI 总结一下都有哪些主流的声音,就方便多了。

  如果遇到在两款商品之间犹豫不决的情况,也可以喊 AI 购物助手出来做一下详细对比。

  所以一番测试下来,我们对什么值得买智能体的好奇心没有完全满足,问题还变得更多了。

  比如 Kimi+ 上的什么值得买智能体来自官方,智谱清言上为什么又成了开放 API,由用户来开发智能体?

  部署在什么值得买 APP 上的“小值”,背后又是基于哪家大模型开发?

  攒了好些问题,不如索性联系什么值得买官方问问情况,经过一番沟通之后,我们见到了值得买科技 CTO 王云峰。

  多智能体架构,自研消费大模型

  对于为什么要做 AI 智能体,王云峰表示,如何让消费者在剁手之后不后悔,至今还是电商行业的不解之谜。什么值得买创办十几年来,也一直想要解决这个问题。

  他的思路是:尽可能给到消费者足够有效的信息去做决定。

  因为人们在购物时,不仅希望找到高品质、低价格的商品,更希望获得既客观,又全面,还符合自身需求的建议和推荐。

  所以,AIGC 的一些能力,比如张口就来的幻觉,显然是不适配的。

  但传统的搜索引擎和推荐算法很难做到对用户需求的精准理解和匹配,却正是 AI 技术擅长的领域。

  那么,合作伙伴这么多,“小值”是基于哪家大模型做的呢?

  答案非常出人意料。

  “小值”其实已经发展成多智能体架构,其中值得买科技自研消费大模型做主力,也有调用其他大模型来辅助。

  这种架构不同于传统的单一大模型,而是将不同的子任务拆解给专门的智能体,再通过任务协同实现整体功能。

  所以说,这其中最关键的环节就是识别用户意图,然后才能拆解出子任务。

  而购物场景中用户的心态又是比较休闲的,有很多口语化的需求,又很难像工作场景一样掏出几百字提示词来指导 AI 如何完成任务。

  这样一来,把消费领域的知识在训练阶段内化到大模型里就很关键了。

  在什么值得买早期测试中,发现通用大模型的垂类知识密度还是有限,无法很好满足需要。

  刚好什么值得买多年来积累了大量的商品数据、用户评价、购买指南等优质语料库,正是将自身优势与前沿 AI 技术结合的好机会。

  另一边,对于正在积极扩张用户规模的众多C端 AI 助手 APP 来说,什么值得买在垂直场景上丰富的积累也是补全通用大模型短板,提供更好用户体验的优质合作对象了。

  关于什么值得买与各家大模型公司的合作,具体合作形式也各有不同

  比如与智谱的合作是什么值得买提供 API 作为开发者的工具,让开发者参与智能体创作。

  Kimi+ 上的智能体是由什么值得买和月之暗面合作推出的,王云峰透露,值得买 AI 团队与 Kimi 团队在产品设计上进行了协同。

  接下来将陆续推出的讯飞星火、百小应,具体细节上也都会根据各家 AI 产品特点适应性地调整。

  在什么值得买看来,用户在购物的过程中的主要需求大致可以总结成三类。

  最简单的是比价。也就是用户已经看中一样商品,要寻找最划算的购买渠道。

  其实在 AI 出现之前,传统比价工具就已经能满足一部分此类需求了。

  AI 加入主要是能进一步提高效率,以及提供一种新的交互方式,在对话中直接把结果呈现出来。

  向后退一步,更复杂的需求是选品。也就是用户刚刚明确要买某个品类,正在纠结到底要买哪一款。

  AI 购物助手智能体,在这里就能起到代替人“做功课”的效果,节省大量时间了。

  王云峰举了一个用户选购车载香薰的例子。对很多人来说,车载香薰是一个真实的场景需求,但一方面产品系列极其丰富,另一方面每个人对香味的喜好都可能是个性化。尤其是,大多数人未必有时间去做足相关功课。

  在“小值”的帮助下,可以先了解一些品类的基础知识,带着这些知识再到商品列表里选购,就不会一头雾水了。

  再退一步,更深层的是用户只有一个模糊的需求,也不知道到底该买些什么。

  这就是 AI 导购智能体未来的努力方向了。

  王云峰透露,目前什么值得买正在和 Kimi 等大模型公司探索更深层的合作,不仅仅停留在 API 接口调用,而是双方在数据、模型、任务流程上的深度融合。

  具体来说,当用户与 AI 购物助手交互时,垂直大模型会先对用户输入的内容进行总结提炼,识别其中用户意图,判断需要的商品的品牌、型号、关键属性等。

  接下来,提炼好的数据会被传给更专业的任务专用模型,返回根据需求挑选好的商品列表。

  表面上看,这个改进好像很简单,但背后代表着整套流程中不仅存在人与智能体的交流对话,也存在 Agent 之间的对话,其实是非常前沿的方向了。

  从这一点也可以看出,AI 发展不仅靠算法技术上拓展能力边界,在应用场景上的探索也能催生出新的方向。

  在大模型生态里,垂直行业如何找准自己的位置

  不得不说,什么值得买与大模型公司的合作是一种双赢。

  一方面,什么值得买提供的优质垂直数据和工具链,能很好地满足大模型平台用户的购物相关需求,可以看作是一种变相的能力输出。

  另一方面,借着大模型的东风,什么值得买也获得了更多流量入口、信息反馈和创新活力,未来在 AI 电商上的想象空间被大大拓展。

  甚至王云峰都说了,考虑到现实国内大模型发展情况,他们的 AI 战略里,都加入了 For AI 的产品应用,因为,他们发现在目前的环境下这是真实的需求。

  王云峰进一步解释:当下的大模型的生态并不仅仅是单个大模型本身,各大模型都需要尽可能寻找适配的工具,持续优化及提升自己的能力。那么,为大模型提供服务,不论是提供 API 接口或者联合开发应用,都是生态中不可或缺的职能。目前各大模型厂商的积极合作意愿,也印证了这个判断。

  但整场交流,最触动的点,是他特别提到:值得买消费大模型要有自己的独特性,不需要一个面面俱到的通用模型,他们选择性地增强模型的专业技能,同时放弃了一些不相关的能力(比如做数学题)。

  这种不盲目求大求新求全,但对自己的差异化能力有明确判断的选择,或许能给更多具有场景或者垂直行业优势的互联网公司一些启示。

  比如可以思考,如何将自身多年积累的行业知识和数据,通过标准化的方式输出给各大智能体平台,让自己的专业能力为更多用户所用。

  再比如,如何学习大模型的建模思路,对原有的业务流程进行 AI 化改造,探索更智能、更个性化的服务方式。

  对于大模型公司来说,各细分行业经过多年发展,已沉淀了大量行业知识和专属数据,可能也是进一步提升 AI 专业性和准确性的下一步关键所在。

  不知道大家怎么看?欢迎在评论区聊聊你的观点~