智东西
编译徐豫
编辑心缘
智东西 10 月 12 日消息,全球顶尖科学学术期刊《Nature》于 10 月 10 日发表了一篇科学家利用人工智能(AI)工具做科学研究的行业观察,发现 AI 工具正在改变传统的科研工作方式。目前,许多 AI 工具可以帮研究人员在大量文献中筛选出所需资料,从而使科学研究更加高效。
这些用于科学研究检索的 AI 工具基于大语言模型(LLM),其不仅可以搜集、筛选现有研究文献,还可以总结、列举文中的关键发现。背后的 AI 公司不断提升这些模型的性能,并定期推出新的 AI 工具。
《Nature》杂志采访了多位 AI 科学检索工具的开发者和使用者后,汇集了他们的实际上手体验,以及使用这些 AI 工具的潜在风险。
文章地址:https://doi.org/10.1038/d41586-024-02942-0
一、科学家用 AI 工具了解科研方向、收集科研资料、撰写文献综述
据《Nature》统计,市面上最受欢迎的 AI 科学检索工具包括 Elicit、Consensus 和 You,它们为研究人员提供了多种高效完成文献综述的方式。
1、美国 AI 论文生成公司 Elicit:自动化完成文献综述
当研究人员在 Elicit 中输入一个研究问题后,该 AI 工具会列出相关论文,并总结这些论文的主要发现。
在此基础上,研究人员还可以针对某一篇论文继续提问,以及指定留下某一本期刊或某一种研究类型的内容。
2、美国 AI 学术搜索引擎公司 Consensus:可视化科研行业共识
公司同名 AI 工具 Consensus 可以帮研究人员搜集、整理科学界对某个科学课题有哪些说法和争议。
举个例子,当研究人员输入“氯胺酮可以治疗抑郁症吗”这个问题后,该 AI 工具会生成一个“Consensus meter(共识度量器)”,其会总结支持、反对或不确定该假设的论点和论据,以显示科学界对上述问题的共识程度。
▲Consensus meter(共识度量器)可以更直观地展示科研行业共识(图源:《Nature》)
Consensus 的首席执行官 Eric Olson(埃里克·奥尔森)称,其 AI 工具虽然不能替代研究人员去深入分析论文内容,但可以有效帮助他们速览研究动态并归纳主流研究方向。
3、美国 AI 学术搜索引擎公司 You:个性化科研研究
You 方面自称其同名 AI 工具“You”,是第一个结合了文献最新引用数据的 AI 检索工具。该 AI 工具为研究人员提供了探索研究问题的多种模式,例如其“genius mode(天才模式)”会以图表的形式反馈检索结果。
上个月,You 还推出了一款允许多人协作的 AI 工具。研发人员可以合作定制、共享个性化的 AI 聊天框,令其自动执行诸如事实核查之类的特定任务。
二、AI 科研检索工具支持多语种,有望打破学术交流语言壁垒
除了热门的 Elicit、Consensus 和 You 外,其他 AI 检索工具也在探索利用 AI 技术提升科研效率的更多应用场景。
美国 AI 生物学知识问答平台 BioloGPT 能够针对生物学问题,生成总结性的、更有深度的回答,是大量垂直于单一学科的 AI 工具之一。
今年 9 月,英国一站式科研服务公司 Clarivate 推出了一个 AI 检索工具,研究人员可以用其快速调用 Web of Science 数据库中的内容。Clarivate 方面称,基于该 AI 检索工具,研究人员输入一个研究问题后,可以以图谱的形式查看相关的论文摘要、科研主题和引用文献,并且能看到每一篇参考文献的标注,从而更高效地找出关键论文及其论点。
此外,即便 Web of Science 中收录的是英文论文,Clarivate 的 AI 检索工具也可以用英语外的其他语言总结论文中的关键信息。在 Clarivate 产品副总裁 Francesca Buckland(弗朗西斯卡·巴克兰德)看来,将多语言的翻译能力融入 AI 检索工具背后的大模型中,是一件“非常具有潜力”的事情,它可以减少全球科研资源不平等的情况。
▲研究人员可以用 Clarivate 的 AI 工具,梳理 Web of Science 数据库中的内容(图源:《Nature》)
三、建议利用 AI 检索工具各自的优势查资料,但要记得核查
当被《Nature》问及“最好用的 AI 检索工具是什么”时,加拿大流行病学家 Razia Aliani(拉齐娅·阿利亚尼)说:“我认为这通常取决于实际研究目的。”目前她在澳大利亚一家非营利性的文献综述公司工作,公司名为 Covidence。
如果需要了解某个科研主题的不同观点和共识,Aliani 会倾向于使用 Consensus。但要审核大型数据库时,她会选择用其他 AI 检索工具,比如 Elicit。
在 Elicit 上抛出初始研究方向后,Aliani 会根据该 AI 工具的检索结果,排除与研究方向无关的论文,然后深入剩余的关联性更强的文献,以微调初始研究方向。
她认为,AI 科研检索工具不仅节省了时间,还能提高科研工作质量、激发创造力并减轻科研压力。
Anna Mills(安娜·米尔斯)在美国加利福尼亚州的马林学院教授基础写作课程,平常也会涉及有关如何开展研究过程的课程。她虽然很想向学生推荐这些 AI 检索工具,但同时也担心这些工具会妨碍学生深入理解一些学术研究。
相较于用 AI 检索工具获取科研信息,她更希望教会学生如何辨别 AI 检索结果中的错误,从而培养他们辩证使用 AI 工具的能力。
美国 AI 生物学知识问答平台 BioloGPT 的创始人 Conner Lambden(康纳·兰登)也认为:“学会对一切事物保持怀疑态度,包括你自己在用的研究方法,是成为一名优秀的科学家的必经之路。”
四、AI 错误引用文献,有科学家因此停用,开发者正补救
AI 大模型在检索过程中时不时出现“幻觉”,已是一个老生常谈的问题。在 AI 界,“”幻觉(Hallucination)”是指 AI 模型编造、引用、输出一些具有误导性的、虚假的、无中生有的信息。
而对于 ChatGPT 等主流 AI 聊天机器人回答准确性的担忧,也蔓延到了 AI 科学检索工具上。多位研究人员提醒应谨慎使用这些 AI 科学检索工具。
用 AI 检索工具做科研时,常见的错误有编造统计数据、误解引用的论文、AI 大模型的偏见。
体育科学家 Alec Thomas(亚历克·托马斯)目前在瑞士的洛桑大学做研究,他曾一度“非常欣赏 AI 检索工具”。
然而,在亲自试用一些 AI 检索工具后,他的态度却发生了 180 度大转弯。Thomas 决定放弃使用这些 AI 检索工具,原因是他发现 AI 生成的答案中有“非常严重的基础性错误”。
例如,他用 AI 检索工具研究“参与体育活动对患有饮食失调的人的影响”时,AI 引用了一篇与研究问题毫无关系的论文来生成研究结论。
Thomas 直言:“我们不会相信一个公认可能随时会出现幻觉的人类,那又凭什么去相信有类似症状的 AI 呢?”
据多位接受《Nature》采访的 AI 检索工具开发者透露,他们已经采取了安全措施,以提高 AI 检索的准确性。
美国 AI 论文生成公司 Elicit 的项目开发负责人 James Brady(詹姆斯·布拉迪)称,该公司十分重视 AI 检索工具的准确性问题,正在使用多个安全系统检查 AI 回答中的错误。
英国一站式科研服务公司 Clarivate 产品副总裁 Buckland 则称,Web of Science 的 AI 工具有“可靠的保护机制”,以规避 AI 生成带有欺骗性的、不准确的内容。在测试期间,她的研发团队曾与大约 1.5 万名研究人员共同整合反馈,以调试 AI 检索的准确性。
尽管经过开发者的不断纠偏,AI 检索工具的使用体验有所改善,美国 AI 学术搜索引擎公司 Consensus 的 CEO Olson 却认为,这非但不能根治 AI 的“幻觉”,还可能会加重“病情”。
Olson 解释道,通过人为反馈调试的 AI 检索工具,倾向于得出对人类有益的答案,并且会因此自主填补一些不存在的事实。
结语:未来的 AI 工具需要比拼专业度
从《Nature》的调查中,我们可以看到 AI 检索的应用场景,已经逐渐向细分领域渗透。
这也意味着,类似于 AI 科研检索领域,未来 AI 大模型及其产品对专业性、准确性有着更严格的要求。
目前来看,面向专业领域微调后的 AI 模型,出现“幻觉”的概率和频率会有所降低,而其存在的偏见问题则不能光靠技术更新来解决。
李飞飞于 2015 年联合创建了 AI4All 项目,旨在吸纳更多诸如女性、有色人种、工薪阶层的 AI 人才,以减轻开发 AI 大模型过程中存在的偏见。
Andrew Hoblitzell(安德鲁·霍布里策尔)是印度的一名生成式 AI 研究人员,他已在多所大学开设了围绕 AI4All 项目的讲座。
在他看来,AI 检索工具可以在一定程度上为科研过程提供支持,但前提是科学家要亲自验证过 AI 生成的信息。
Hoblitzell 称:“现阶段,这些 AI 检索工具应该是科研的辅助工具,而不是最终的成果来源。”
来源:《Nature》