财联社 2 月 26 日讯(编辑史正丞)美国初创公司 OpenAI 周二宣布,开始向所有付费用户开放被称为“AI 分析师”的 Deep research 智能体。
该功能最初在 2 月初发布,旨在让 ChatGPT 自行“上网查询网页”、搜集信息,并基于推理进行数据分析和整理,最终生成一份完整的研究报告。与人类相比,AI 智能体的最大优势,是能够在几分钟里“阅读”数百个网页并理解、提取和分析信息。
在 OpenAI 的定义中,这个工具会是“知识工作者”的专业助手,例如金融分析师、科研人员和工程师都会需要这款产品。
这个功能基于“满血版”o3 推理大模型。在被称为“人类最后的考试”的数据集测试中,Deep research 依靠“上网查资料”将得分提高至 26.6%。作为对比,o1 模型和 DeepSeek R1 模型的得分都在9% 左右。
在周二之前,这项功能仅向每月支付 200 美元费用的 ChatGPT Pro 用户开放,而现在 ChatGPT Plus、Team,以及教育和企业用户都能用上这个功能,不过会受到一些限制——目前这批用户每月只能进行 10 次 Deep research 查询,同时 Pro 用户的每月查询次数从 100 次上调至 120 次。
OpenAI 表示,在初期发布后,现在对 Deep research 也进行了两处升级。这个工具现在能更好地理解和引用用户上传的文件,同时输出报告时也会添加带有引用的嵌入图像。
与过往 OpenAI 发布产品时,舆论一片“AI 又进步了”的欢腾不同,在 OpenAI 这条公告的底下,几乎全都是用户的质疑声——隔壁马斯克那边可以免费用的东西,OpenAI 不仅收费,还限制使用次数。
更重要的是,OpenAI 提供的软件,似乎也没了能够领先竞品一个身位的底气。
就在上周,马斯克发布所谓“地球上最聪明的 AI”Grok 3,其中就有基于互联网信息的 DeepSearch 功能。相较于 OpenAI 的产品只能搜索网页,Grok 3 还有得天独厚的优势——可以查询社交媒体X上的实时数据。
目前 Grok 3 仍然可以免费试用,xAI 表示将会持续到“系统无法负荷”为止。所以在 OpenAI 的评论区中,不少用户表示等 Grok 的功能上齐了就取消 OpenAI 的订阅,转到“马斯克门下”。
不巧的是,Grok 3 并不是 OpenAI 唯一的对手。黄仁勋最爱用的 AI 搜索工具 Perplexity 也在 2 月 14 日发布了 Deep Research 功能,在“人类最后的考试”中也能拿到 21.1% 的准确率——与 o3 差距并不大。
在定价方面,Perplexity 的免费用户一天限制提出 5 个问题,而每月付费 20 美元的用户,每月可以进行 500 次“深度研究”。