国思软件 - OpenAI将用新方法来训练模型以对抗人工智能“幻觉”

　　财联社 6 月 1 日讯（编辑牛占林）美东时间周三，OpenAI 发布的最新研究论文显示，该公司正在用一种新的方法来训练人工智能(AI)模型，以对抗人工智能“幻觉”。

　　人工智能幻觉指的是人工智能模型生成内容的能力，这些内容不是基于任何现实世界的数据，而是模型自己想象的产物。人们担心这种幻觉可能带来的潜在问题，包括道德、社会和实际问题。

　　当 OpenAI 的聊天机器人 ChatGPT 或谷歌公司竞品 Bard 纯粹在捏造虚假信息时，就会发生人工智能幻觉，表现得就像是在滔滔不绝地谈论事实一样。某些独立的专家对 OpenAI 这样做的效果表示怀疑。

　　举个例子，在谷歌 2 月份为 Bard 拍摄的宣传视频中，这个聊天机器人对詹姆斯·韦伯太空望远镜做出了不真实的表述。最近，ChatGPT 在纽约联邦法院的一份文件中引用了“伪造”的案件，导致涉案的纽约律师可能面临处罚。

　　OpenAI 的研究人员在报告中写道：“即使是最先进的人工智能模型也很容易产生谎言，它们在不确定的时刻往往表现出捏造事实的倾向。而这些幻觉在需要多步骤推理的领域尤其严重，因为一个逻辑错误就足以破坏一个更大的解决方案。”

　　该公司提出的新策略是：训练人工智能模型时，奖励每个正确的推理步骤，而不仅仅是简单地奖励正确的最终结论。根据研究人员的说法，这种方法被称为“过程监督”，而不是“结果监督”，它可能会提高人工智能的性能与准确性，因为这种策略鼓励模型更多地遵循类似人类的“思维链”。

　　OpenAI 的数学研究员 Karl Cobbe 指出：“检测并减轻模型的逻辑错误或幻觉，是构建通用人工智能(AGI)的关键一步。”他指出，这项研究背后的动机是解决人工智能幻觉，以便使模型更有能力解决具有挑战性的推理问题。

　　Cobbe 补充道，OpenAI 已经发布了一个附带的数据集，其中包含 80 万个人类标签，用于训练研究论文中提到的模型。

　　此前一天，科技界高管和人工智能科学家正在对 AI 敲响警钟，他们表示，这项技术带来的灭绝风险堪比疫情和核战。

　　超过 350 人签署了人工智能安全中心(Center for AI Safety)发布的一份声明，该组织表示，与疫情和核战争等其他社会规模的风险一样，减轻人工智能带来的灭绝风险应该成为全球的优先事项。

OpenAI将用新方法来训练模型以对抗人工智能“幻觉”