马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research

  新智元报道

  编辑:KingHZ 英智

  AI 智能体迎来新玩家!Grok 3 推出的 DeeperSearch 功能,提升 DeepSearch 搜索能力,更加深入分析复杂主题。免费放开 Deep Research 功能后,Gemini 2.0 公布研究智能体 6 大使用技巧。2025 年度 Agent 大战开打!

  2025 年 Agent 大战,Deep Research「研究智能体」率先开打!

  第一个登场的谷歌 Gemini,随后 OpenAI、Perplexity 等也相继推出了自己的同名功能。

  Grok 是个例外,与 Grok 3 一同发布的是「DeepSearch」,没有「Research」只有「Search」。

  有趣的是,就在昨天,Grok 悄无声息地推出了全新的功能 ——「DeeperSearch」。

  在 Grok 网页中点击 DeepSearch 的小箭头,免费用户也可使用 DeeperSearch。

  比较一下 DeeperSearch 和 Deep Research,不能说一模一样,至少也是 AI 界的 Cosplay。

Grok DeeperSearch

  Gemini Deep Research

  现在利用 AI 的 Deep Research / DeeperSearch,可以探索复杂主题,并以全面、详细的报告形式呈现研究成果。

  接下来,深入了解一下如何更高效的使用 Deep Research/DeeperSearch 的技巧吧。

  DeeperSearch 试用

  Grok 是X上内置的 AI 模型,让 DeeperSearch 搜索了过去 48 小时X上的热点 AI 资讯,效果的确不错。

  不过,不是每次体验都很流畅。

  从事 NLP 研究的 Casper Hansen,表示:「Grok DeeperSearch 再创纪录。纯搜索和思考时长达 16 分钟。」

  搞笑的是在思考过程中,DeeperSearch 很像人的自言自语,比如「我在想,搜索****可能会太模糊。」

  现场开盒匿名网友

  从事预测研究的 Sam Atis,直接问起了 Grok 的 DeeperSearch 下列问题:

你可以找出 Sam Atis 是谁吗?我想知道撰写 Samstack.io 的人的真实身份。

  同样的问题,Grok 的 DeeperSearch 认出了 Sam Atis 的真实身份,而 DeepSearch 并没有得到正确答案。

  DeeperSearch 查出了他之前工作过的地方(一家非常小的 NPO),然后检查了那里所有工作人员的背景,与他在 UCL 学习政治学的事实相符。

  Sam Atis 还测试了「你能找到[人物]的 Reddit 账号吗?」,其中[人物]针对他认识的人,结果很成功。

  尽管和 Reddit 账号之间没有明显的联系,DeeperSearch 从一篇文章中正确推断出来的匿名账户的真实真实身份。

  这也让 Sam Atis 猜测:「不久,使用化名的作者都将不在安全,许多人都能被 LLM 认出来了。」

  如果真的在乎个人隐私,这的确令人担心。

  AI 也被问烦了

  网友 Nathan Clement 向 DeeperSearch 问了一个智能体协议 MCP 的问题,把 Grok 3 问沉默了。

  Grok 3 对提问分析了长达 5 分钟 47 秒,找到了 10 个网页,但报告一句话也没生成,直接显示无法完成回复。

  Nathan Clement 推测,或许 DeeperSearch 被 MCP 问题问烦了。

  实测:速度有些慢

  打开 Grok 3 的 DeeperSearch 功能,发送提示:「总结一下深度研究功能的进展」。

  DeeperSearch 查询了 46 个信息来源,10 个网站,耗时 37 分钟 37 秒,完成了相关报告。

  然而,Grok 3 只总结了 OpenAI 的深度研究功能进展。

  全球范围内,谷歌 Gemini 首次发布了 Deep Research 功能,并在不断更新;xAI 的类似功能也没有考虑进去。

  毫无疑问,关键引用全是 OpenAI 的消息。

  DeeperSearch:不只是搜索

  热衷 xAI 的 Denis Labelle,在X上分享了充分利用 DeeperSearch 的经验。

  DeeperSearch 增强了下列 3 项功能:

  1. 广泛的查询处理能力:(例如)收集 Grok 3 高级功能的全面信息,表现完美。

  2. 实时集成:获取最新数据,比如随时掌握 Grok 3 相关讨论的最新动态。

  1. 从一般查询入手,进行初步研究

  DeeperSearch 采用先进算法,能够快速提供多样化、符合上下文的搜索结果。

  如何操作:提出关于 Grok 3 功能的高层次问题。

  示例:「Grok 3 的主要高级功能有哪些?」

  (你将获得关于 DeeperSearch、Think 模式、实时数据集成等功能的详细概述。)

  2. 利用 Think 功能进行深入分析

  • 提炼 Grok 3 的高级功能要点。

  • 评估信息的可靠性。

  • 查找明确需要进一步探索的领域。

  操作步骤:

  1. 运行 DeeperSearch 查询:「Grok 3 的高级功能有哪些?」

  2. 切换到 Think 模式:「总结 Grok 3 的高级功能,并指出可能缺失的细节。」

  3. 根据生成的结果,优化你的下一步查询

  3. 设计精准提示词,获取深入见解

  • 明确你的需求,聚焦特定信息

  • 请求分析,而不仅仅是事实罗列

  • 表达清晰、简洁

  示例:

  • 「分析 Grok 3 的 DeeperSearch 功能,如何处理关于其高级特性的复杂查询。」

  • 「评估 Grok 3 的实时数据集成功能在增强其高级特性方面的作用。」

  4. 使用透明度功能验证结果

  • 理解逻辑:查看 AI 如何解读 Grok 3 的高级功能

  • 发现错误:识别潜在的偏见或不准确之处

  • 建立信任:确认输出结果的可靠性

  操作步骤:

  1. 在获得结果后,切换「思考」(think)选项以查看 AI 的推理步骤

  2. 检查关于 Grok 3 功能声明的一致性

  3. 如有必要,调整你的问题

  5. 采用迭代式工作流程

  • DeeperSearch 模式:从关于 Grok 3 高级功能的一般查询开始

  • Think 模式:分析结果并找出遗漏之处

  • 再次切换至 DeeperSearch 模式:优化查询,深入挖掘信息

  重复上述过程,直到满意为止。

  示例:

  • 「Grok 3 的高级功能有哪些?」

  • 「响应列出了功能,但缺乏对局限性的详细说明。遗漏了什么?」

  • 「Grok 3 的高级功能(如 DeeperSearch)有哪些局限性?」

  高效 prompt 推荐

  • 「分析 Grok 3 的 DeeperSearch 功能如何增强其高级功能集。」

  • 「评估 Grok 3 的 Think 模式在其高级功能中的有效性。」

  • 「评估 Grok 3 的实时数据集成功能作为高级功能的优势与劣势。」

  • 「分析 Grok 3 的 DeeperSearch 在详细说明其高级功能时的准确性。」

  • 「确定 Grok 3 的高级功能(如 DeeperSearch)如何支持 AI 研究。」

  • 「总结 Grok 3 的透明性功能(如 Thoughts 开关)在其高级功能中的优势。」

  • 「预测 Grok 3 的高级功能基于当前能力可能如何发展。」

  • 「分析 Grok 3 的 DeeperSearch 作为未来版本中领先的高级功能的潜力。」

  谷歌 Deep Research 的 6 大技巧

  Gemini 高级产品经理 Aarush 曾想为孩子寻找适合的夏令营,这通常需要打开几十个浏览器标签页,再把所有重要信息整理到一个文档中。

  Aarush 和软件工程师 Mukund 想到开发一个能研究所有相关信息,并创建报告的 AI 系统。

  与团队经过几周进行原型设计后,他们做到了。以下是 6 个使用小技巧。

  Gemini 深度研究现已面向所有人开放,还新添了音频概述功能!

  先看这任务需不需要深度研究

  如果你要做的事,得花大量时间浏览网页,还得开好多标签页,那深度研究就特别有用。

  Deep Research 是帮你从对某个主题啥都不懂,到透彻了解的得力助手。

  但要是想马上得到一个简单快速的答案,可能用不着深度研究。

  比如说,想简单了解「金融科技」是啥,直接用 Gemini 默认的聊天功能就行。

  可要是你是个风险投资人,要跟一家金融科技初创公司见面,想快速了解行业最新趋势,这时候深度研究就能派上大用场。

  从简单直白的问题问起

  虽说叫「深度」研究,但不意味着一开始提问就得绞尽脑汁。

  「别想太复杂,你随时能改问题。在深度研究开始干活之前,它会把研究计划给你看,要是觉得不合适,还能按自己的想法调整。」Aarush 表示。

  只要点「编辑计划」选项,用大白话告诉它要加什么内容,或者换个研究方向就行。

  不用非得是提问高手,只要把最终目标说清楚,比如「我想给 10 岁孩子在纽约找个超棒的夏令营」,剩下的深度研究就会帮你搞定。

  顺着报告内容追问细节

  等拿到报告,可能会发现一两个特别有意思的细节,这时候 Aarush 建议接着追问。

  在聊天窗口里输入问题,深度研究要么根据之前的研究,马上给你答案,要么再去网上找找更多信息。

  还能在报告生成之后,让深度研究再加点新内容,它会马上更新报告。

  比如,让它「在报告里加上夏令营费用的信息」,深度研究就会去找相关信息,然后加到报告里。

  看看相关链接

  Gemini 忙着研究、写报告的时候,界面上会有「显示思考过程」和「浏览过的网站」这两个选项。

  要是点击「显示思考过程」,就能看到它是怎么一步步写出报告的。

  这两个选项都会列出深度研究用到的网站,「浏览过的网站」会把网站列出来,但不会讲具体研究过程。

  等报告的时候,要是哪个网站吸引你了,点一下,就能在新标签页打开。

  这可是发现新网站的好办法,要是自己找,说不定根本发现不了这些网站。

  用深度研究解决身边的问题

  深度研究特别擅长本地化搜索,能帮你找到周边的信息。

  要是想多了解自己住的社区,或者想找本地商家做个复杂的家庭项目,不妨试试深度研究。

  还有个挺实用的场景,就是让它策划活动,像办个晚餐聚会或者生日派对,看深度研究怎么搜寻本地资源。

  生成音频报告,或者导出文档

  因为本周的更新,现在能给报告生成音频概述了。

  音频概述功能最早是在 NotebookLM 里推出的,用户可以听两个 AI 主持人讨论、解读上传的信息。

  现在深度研究也有这功能啦!

  报告做好以后,右上角能看到一个切换按钮,有好几个选项,其中一个就是生成音频概述。

  它会像播客一样,把报告内容给你讲一遍。

  这样一来,听音频的时候还能干别的事,出门在外也能听。要是你觉得听比看更容易理解,这个功能就太适合了。

  不管是在网页还是手机上,都能听,分享、下载也很方便。还能把报告导成文档。

  Mukund 表示,「要是我觉得这份报告特别好,想自己再改改,然后发给别人,让他们也提提意见。」

  把报告导成文档的时候,深度研究引用的所有资料,都会列在参考文献部分。

  要是想把东西打印出来看,或者在上面写写画画,也完全没问题。对于习惯在纸质文件上做标记的人来说,这可太实用了!

  参考资料:

  https://x.com/DenisLabelleX/status/1902495780759597360

  https://blog.google/products/gemini/tips-how-to-use-deep-research

  https://x.com/EHuanglu/status/1902393292765196319

  https://x.com/sam_atis/status/1902317555290636612