【编者按】近日,人工智能(AI)不断霸屏各大社交媒体:AI 成为诺贝尔两大奖项最后赢家、通用人工智能(AGI)最早可能在 2026 年出现、百年难题李雅普诺夫函数谜题被 AI 攻克、AI 助力医疗取得突破进展......相关新闻引起人们广泛讨论。
那么,AI 在促进科学方面究竟发挥了怎样的作用?我们可以一起来听听新晋诺奖得主、Google DeepMind 首席执行官 Demis Hassabis 的观点。
日前,英国《金融时报》(FT)刊登了 Hassabis 接受科技记者 Madhumita Murgia 的专访。在访谈中,Hassabis 深度探讨了 AI 在生物学、材料设计、气候建模等科学领域的突破性应用及其发展方向,并强调了在推进 AGI 过程中对系统理解、安全性及社会价值观讨论的重要性。
他说道:“AI 已经到达一个分水岭,人们认识到它实际上已经足够成熟,可以帮助科学发现。”
部分核心观点如下:
- 没人知道[诺贝尔]委员会在想什么...... 这感觉像是 AI 的一个分水岭,人们认识到它实际上已经足够成熟,可以帮助科学发现。
- 希望 10 年后回顾 AlphaFold,它将预示着所有这些不同领域的科学发现进入一个新的黄金时代。
- 从某种意义上说,预测是理解的一部分。如果能预测,就能理解。
- AI 是一门工程科学。这意味着你必须先制造出 AI,然后才能研究它。这与自然科学不同,在自然科学中,现象已经存在。
- [实现 AGI 的]科学方法意味着要将更多的时间、精力和思想投入到理解和分析工具、基准测试和评估上...... AI 安全机构也需要投入 10 倍以上的精力。学术界和民间社会也是如此。
- 科学就是在一切发生之前你能理解的东西。
学术头条在不改变原文大意的情况下,对访谈内容做了简单的编译。内容如下:
Madhumita Murgia:你获得诺贝尔奖已经一天了,感觉如何?
Demis Hassabis:说实话,昨天的一切都很模糊,我的脑子完全乱了,这种情况几乎从未发生过。那是一次奇怪的经历,几乎就像灵魂出窍一样。今天仍然感觉很不真实。今天早上醒来时,我心想,这是真的吗?说实话,这仍然感觉像一场梦。
MM:由于你在 AlphaFold 模型方面的工作,蛋白质折叠问题已基本得到解决。AlphaFold 模型是一种可以预测所有已知蛋白质结构的 AI 系统。你认为 AI 要破解的下一个巨大挑战是什么?
DH:有几个。首先,在生物学方面——你可以看到我们在 AlphaFold 3 中的进展——我们的想法是了解[生物]相互作用,并最终模拟整个路径。然后,我可能想在某个时候构建一个虚拟细胞。
借助 Isomorphic(DeepMind 的药物开发子公司),我们正尝试拓展药物研发领域——设计化学化合物,找出它们的结合位置,预测这些化合物的性质、吸收、毒性等等。我们在 Eli Lilly 和 Novartis 都有很好的合作伙伴……我们与他们合作开展项目,进展非常顺利。我想解决一些疾病。我希望我们能帮助治愈一些疾病。
MM:你们有兴趣解决什么特定的疾病吗?
DH:我们有。我们正在开展 6 个药物项目。我不能说是哪些领域,但它们都是健康的重要领域。我希望我们能在未来几年内将一些药物投入临床研究——非常快。然后,显然,我们必须经历整个临床过程,但至少药物研发的部分将大大缩减。
MM:生物学之外还有什么其他领域让你感兴趣吗?
DH:我对我们的材料设计工作感到非常兴奋:去年我们在 Nature 上发表了一篇关于一种名为 GNoME 的工具的论文(一种发现了 220 万个新晶体的 AI 工具)。这是 AlphaFold-1 级材料设计。我们需要达到 AlphaFold-2 级,我们正在努力实现这个目标。
我们将在 AI 的帮助下解决一些重要的数学猜想。今年夏天我们获得了奥林匹克竞赛银牌。这是一场非常艰难的比赛。未来几年里,我们将解决其中一个重要猜想。
然后,在能源/气候方面,我们的 Graphcast 天气建模赢得了 MacRobert 奖,这是工程方面的一项巨大荣誉。我们正在研究是否可以使用这些技术来帮助气候建模,使其更加精确,这对于帮助应对气候变化以及优化电网等都很重要。
MM:看来你的重点更多地放在应用方面——关注那些能转化为现实影响的工作,而不是纯粹的基础性工作。
DH:这么说也许没错。像蛋白质折叠这样的挑战并不多。我过去称它为生物学中的费马最后定理。没有多少事情像蛋白质折叠这样重要且长期存在。
显然,我非常专注于利用基于智能体的系统推进 AGI。我们可能想谈谈 Astra 项目以及数字助理、通用数字助理的未来,我个人也在研究这些,我认为这是通往 AGI 的道路。
MM:AI 领域同时获得诺贝尔化学奖和诺贝尔物理学奖(今年的物理学奖授予了 Geoffrey Hinton 和 John Hopfield,以表彰他们在现代 AI 系统的基础技术神经网络方面的工作)如何看待这项技术在科学中的作用和影响?
DH:这很有趣。显然,没人知道[诺贝尔]委员会在想什么。但很难不认为这只是委员会的一个声明。这感觉像是 AI 的一个分水岭,人们认识到它实际上已经足够成熟,可以帮助科学发现。
AlphaFold 就是最好的例子。而 Geoff 和 Hopfield 的奖项则是为了更基础、更底层的算法工作……有趣的是,他们决定将这些奖项合并在一起,几乎是双重相关的奖项。
对我来说,我希望 10 年后回顾 AlphaFold,它将预示着所有这些不同领域的科学发现进入一个新的黄金时代。我希望我们将为这一成果锦上添花。我认为,我们是世界上非常独特的大型实验室之一,实际上我们不仅谈论将其用于科学研究,而且正在付诸实践。
学术界也有很多很酷的事情发生。我曾和天体物理学领域的一位诺贝尔奖获得者聊过,他正在用它扫描天空,寻找大气信号等等。这很完美。它正在欧洲核子研究中心使用。所以也许委员会想承认这一时刻。我认为他们这样做很酷。
MM:你的 AlphaFold 研究将为我们带来哪些新发现?你是否在其他实验室看到过让你兴奋的有趣突破?
DH:Nature上关于核孔复合体的特刊给我留下了深刻的印象,核孔复合体是人体最大的蛋白质之一,它像大门一样打开和关闭,让营养物质进出细胞核。四项研究同时发现了这种结构。四篇论文中有三篇发现 AlphaFold 预测是他们能够解决整体结构的关键部分。这是基本的生物学理解。这是让我印象深刻的事情。
酶设计确实很有趣。像 Francis Arnold(美国生物化学家、诺贝尔奖获得者)等人研究了将 AI 与定向 [蛋白质] 进化相结合。有很多有趣的组合。许多顶级实验室已经将其用于植物,研究能否让植物更好地抵抗气候变化。小麦有数万种蛋白质。没有人研究过这一点,因为这样做的实验成本太高。它对各个领域都有帮助,很高兴看到这一点。
MM:我有一个关于科学事业的概念性问题。我们原本认为预测某件事就是最重要的,于是花费了那么多时间和精力去预测,比如蛋白质的结构。但现在我们可以利用机器学习快速做到这一点,而无需理解“为什么”。这是否意味着作为科学家,我们应该努力推动自己去寻找更多的东西?这是否会改变我们学习科学概念的方式?
DH:这个问题很有趣。从某种意义上说,预测是理解的一部分。如果能预测,就能理解。现在,有了这些新的 [AI] 系统,它们就成了世界上的新产物,它们不符合物体的常规分类。它们本身具有一些内在能力,这使它们成为一类独特的新工具。
我的观点是,如果产出足够重要,例如蛋白质结构,那么它本身就是有价值的。如果生物学家正在研究利什曼病,那么他们从哪里获得蛋白质结构并不重要,只要它们是正确的,他们就可以在此基础上进行科学研究。或者,如果你治愈了癌症,你不会说:别给我这个,因为我们不了解它。在没有完全理解的情况下,这将是一件了不起的事情。
科学有很多抽象概念。整个化学都是这样,对吧?它建立在物理学的基础上,然后生物学从中衍生出来。但它可以在其自己的抽象层面上被理解,而不必理解其下面的所有物理学。你可以谈论原子、化学物质和化合物,而不必完全理解量子力学的一切——我们还没有完全理解量子力学。这是一个抽象层。它已经存在于科学中。
至于生物学,我们可以研究生命,但仍然不知道生命是如何进化或出现的。我们甚至无法正确定义它。但这些都是庞大的领域:生物学、化学和物理学。所以从某种意义上说,这并不罕见——AI 就像一个抽象层。构建程序和网络的人在某种程度上理解这一点,但这种新兴属性就从中产生,在这种情况下就是预测。但你可以在科学层面上分析这些预测本身。
话虽如此,我认为理解非常重要。尤其是当我们越来越接近 AGI 时。我认为它会比现在好得多。AI 是一门工程科学。这意味着你必须先制造出 AI,然后才能研究它。这与自然科学不同,在自然科学中,现象已经存在。
而且,AI 是一种人造的、工程化的人工制品,这并不意味着它的复杂程度会低于我们想要研究的自然现象。所以你应该预料到,理解、解构和解构一个像神经网络这样的人工制品同样困难。这种情况现在正在发生,我们正在取得一些进展。有一整个领域叫做“机理可解释性”(mechanistic interpretation),就是使用神经科学的工具和理念来分析这些虚拟大脑。我热爱这个领域,并在 DeepMind 鼓励这方面的工作。
MM:我查阅了你之前提到的一个关于利用神经网络绘制果蝇连接组(大脑图谱)的项目。AI 有助于理解这一自然现象。
DH:没错。这是一个完美的例子,说明这些东西是如何结合起来的,然后我们慢慢地对这些系统有了越来越多的了解。所以,是的,这是一个很好的问题,我非常乐观地认为,在未来几年里,我们将在理解 AI 系统方面取得很大进展。当然,也许它们也可以自我解释。想象一下将 AlphaFold 与语言能力系统结合起来,也许它可以解释一下它在做什么。
MM:AI 领域的技术行业竞争态势已经变得更加激烈。你认为这会如何影响和塑造这一领域的进步?你是否担心创意会越来越少,人们会更加关注基于 Transformer 的大语言模型?
DH:我认为,实际上许多领先的实验室正在缩小他们的研究范围,专注于扩展 transformer。显然,它们非常棒,将成为终极 AGI 系统的关键组成部分。但我们一直坚信探索和创新研究。我们一直保持着这样做的能力——在发明下一代 transformer 方面,我们拥有迄今为止最广泛和最深入的研究平台,如果需要的话。这是我们科学传统的一部分,不仅在 DeepMind,在 Google Brain 也是如此。我们正在加倍努力,同时在工程和规模化方面与其他人保持同步。
我们必须这样做——部分原因是为了看看这能走多远,这样你就知道你需要探索什么。我一直相信,在探索新想法的同时,也要将令人兴奋的想法发挥到极致。除非你知道当前想法的绝对极限,否则你不知道你需要什么突破。
在长上下文窗口(衡量 LLM 一次可以处理多少文本的指标)中看到了这一点。这是一项很酷的创新,没有人能够复制它。这只是其中一件事——我们的主流工作中还将出现更多突破。
MM:你和其他人都说过 AGI 距离实现还有 5 到 20 年的时间:实现这一目标的科学方法是什么样子的?当我们实现这一目标时会发生什么?
DH:科学方法意味着要将更多的时间、精力和思想投入到理解和分析工具、基准测试和评估上。不仅是公司,AI 安全机构也需要投入 10 倍以上的精力。我认为学术界和民间社会也是如此。
我认为我们需要了解系统在做什么、这些系统的局限性以及如何控制和保护这些系统。理解是科学方法的重要组成部分。我认为纯工程学缺少这一点。工程学只是观察——它是否有效?如果不行,就再试一次。这都是反复试验的过程。
科学就是在一切发生之前你能理解的东西。理想情况下,这种理解意味着你会犯更少的错误。这对 AGI 和 AI 很重要,因为它是一项非常强大的技术,你希望尽可能少犯错误。
当然,你希望能够做到完美,但它太新了,发展太快了。但我们肯定可以做得比过去的技术更好。我认为我们需要用 AI 做到这一点。这就是我所提倡的。
当我们距离 AGI 更近时,也许还需要几年时间,就会出现一个社会问题,而这个问题也可以通过科学方法来解答。我们希望这些系统拥有什么价值观?我们希望为它们设定什么目标?
因此,这两个问题是分开的。技术上的问题是,如何让事情朝着你设定的目标前进?但这并不能帮助你决定这个目标应该是什么,对吧?但你需要这两件事都正确才能建立一个安全的 AGI 系统。
我认为第二个问题可能更难回答,比如,目标是什么、价值观是什么等等。我认为我们需要就此展开广泛讨论,与政府、民间社会、学术界、社会各界——甚至包括社会科学和哲学界展开讨论。
我尝试与所有这些类型的人交流,但在这方面我有点与众不同。我试图鼓励更多的人这样做,或者至少充当榜样,充当将这些声音带到谈判桌上的渠道。
我认为我们应该现在就开始,因为即使 AGI 还需要 10 年时间才能实现,而且有些人认为它可能会更快,时间也不多了。