在科技不断进步的今天,AI 正在以惊人的速度拓展其能力边界,甚至今年的诺贝尔物理学和化学奖都颁给了与 AI 有关的研究成果。
近日,一家名为 Archetype AI 的美国初创公司公布了一个物理学基础大模型,名为“牛顿”(Newton)。
这个模型能够直接从传感器数据中学习复杂的物理原理,而无需预先输入任何知识。
研究人员认为,这可能会改变我们理解和与物理世界互动的方式。
Archetype AI 的联合创始人伊万·普皮列夫(Ivan Poupyrev)对媒体表示:“我们正在探索 AI 是否能像人类一样,通过仔细观察和测量来自主发现物理定律。
我们能否构建一个单一的 AI 模型,使其能够在不同的物理现象、领域、应用和传感装置中进行泛化?”
Archetype AI 是一家总部位于美国帕洛阿托市的初创公司,由前谷歌研究人员创立,迄今已筹集了 1300 万美元的风险投资。
该公司正在与潜在客户讨论 AI 模型的实际部署,重点关注工业设备预测性维护、能源需求预测和交通管理系统等领域。
图 AI 模型根据传感器观测进行推理的训练过程(来源:Archetype AI)
在最近发表的一篇论文中,该公司的研究团队详细解释了 Newton 模型解释和预测真实世界物理过程的能力。
总的来说,它展现出了“前所未有的能力”,可以仅凭原始传感器测量数据就能跨越各种物理现象进行泛化,从机械振动到热力学都能应对自如。
一般来说,人们常常认为要理解物理世界,首先需要学习物理定律,然后再将其应用到物理世界的任务中。
因此,我们可能会认为 AI 也需要被灌输相同的定律,比如能量守恒定律。这样它才能遵守这些定律,以处理来自物理世界的数据。
这种方法通常依赖于引入某些归纳偏差,即将约束条件或先验知识表示为数学语句的假设。
然而,这种方法的问题在于,它会导致高度专门化的 AI 模型。例如,如果训练一个模型使用纳维-斯托克斯方程来分析流体运动,它就无法解释涉及完全不同物理原理的雷达图像。
(来源:YouTube 截图)
此外,像电网或自动化工业机器等复杂系统,往往无法简单地仅用几个物理定律和方程来描述。
图预测复杂现实世界过程的模型示例。上:预测土耳其的电力消耗;下:预测电力变压器的油温(来源:Archetype AI)
Newton 模型的训练数据来自超过 5.9 亿个样本,这些样本来自涵盖广泛物理行为的开源数据集,从电流和液体流动到光学传感器等。
使用基于 Transformer 的深度神经网络,Newton 模型对所有这些原始、嘈杂的传感器数据进行编码,并试图通过捕捉隐藏模式和统计分布来理解它们。
接下来,研究团队训练了几个轻量级、特定于应用的神经网络解码器。这些解码器经过训练,可以执行现实世界的任务。例如,根据传感器数据预测未来结果或重建过去事件。
在实际应用中,Newton 模型可以从测量物理行为的传感器中获取实时数据,也可以与预先记录的传感器测量值配合使用,以做出准确的预测。
在一个演示中,Newton 模型能够实时、准确地预测混沌的钟摆运动,尽管它从未接受过钟摆动力学的训练。
模型的能力还能扩展到复杂的现实世界场景。它在预测全市电力消耗规律和预测电网变压器温度波动方面的表现优于专门的 AI 系统。
普皮列夫对媒体表示,“令人惊讶的是,Newton 模型并没有被专门训练来理解这些实验,它是第一次遇到这些实验,却仍然能够预测混沌和复杂行为的结果。”
Newton 模型的这种泛化能力,可能会改变 AI 在工业和科学应用中的部署方式。与其为每个新用例定制模型和大量数据集,像 Newton 这样的单一预训练基础模型可能会以最少的“额外训练”快速适应各种任务。
未来,这种方法或能推动将 AI 应用于物理系统的重大转变。目前,大多数工业 AI 应用都需要为每个特定用例进行广泛的定制开发和数据收集。
这个过程耗时、昂贵,而且通常会导致模型过于专业,并且无法适应不断变化的条件。
相比之下,Newton 模型可能会提供更灵活和适应性更强的 AI 系统。通过从广泛的传感器数据中学习物理原理,该模型更擅长应对新的情况,而且只需最少的额外训练。
Newton 模型的影响不仅限于工业应用。通过学习解释不熟悉的传感器数据,还能以新的方式扩展人类的感知能力。
“我们有的传感器可以检测人类无法自然感知的东西。现在,我们可以开始通过人类没有的感官模式来看待世界,以前所未有的方式增强我们的感知。”普皮列夫解释道。
这种能力可能会对一系列领域产生深远的影响。例如,在医学领域,AI 模型可以帮助解释复杂的诊断数据,可能识别出人类医生可能会忽视的模式或异常状况。
在环境科学中,这些模型可以帮助分析大量传感器数据,以更好地理解和预测气候模式或生态变化。
“我们的主要目标是理解物理世界,弄清楚物理世界意味着什么。”普皮列夫强调,“我们能发现新的物理定律吗?这是一种令人兴奋的可能性。”
参考资料:
https://www.archetypeai.io/blog/can-ai-learn-physics-from-sensor-data
运营/排版:何晨龙