新智元报道
编辑:David
用科幻电影的形象来类比 AI,是对大众的最大误导,有时间不如多看看论文的插图,几十年前的大佬们已经画的很明白了。
什么是人工智能?如何理解「感知」的概念?
一提这些概念就言必称《终结者》、《机械姬》,哈尔 9000,实际上是一种对大众的误导。
在一本讲述人工智能视觉史《智能的蓝图》的序言中,德国艺术家 Philipp Schmitt 提出,与其用这些不恰当的比喻来阐述人工智能的基础概念,还不如好好研究一下前辈论文中的形象或抽象的插图,看看研究人员的脑海里,这些概念最初是个什么样子。
《智能的蓝图》是一部讲述人工智能的视觉历史,书中收集了 1943 年至 2020 年间出版的机器学习研究出版物中的大量插图。
通过插图来回顾人工智能的历史,可以追踪人工智能技术发展的关键趋势。我们并不关心这些图可能会告诉研究者的信息,而是探索它们对研究者讲述了什么,这些图在神经网络的视觉表现和研究人员的认知概念之间建立了什么样的联系。
一提智能,就是「大脑+芯片」?
目前,人工神经网络是机器学习中应用的主导技术,这种技术方法受到人脑的启发,经常与 「人工智能」这一笼统的术语作为同义词使用。
人工神经网络是一个程序,与其他计算机程序一样;比如用来计算图像是否包含一个人或一辆车。但至关重要的是,神经网络不是用一步一步的指令来完成任务的。
神经网络使用一个优化过程来学习如何完成任务。在计算机视觉等领域,这种方法比人工编码的算法效果要好得多。而学习和预测,一般是两种与智能密切相关的能力。
在目前欧美主流媒体中,关于人工智能和机器学习的文章,通常用经典科幻电影中的人形角色来举例,如《终结者》中的终结者、《机械姬》中的 Eva、《2001:太空漫游》中的哈尔 9000 等。
另一种对人工智能的表述通常使用电路板或二进制代码,加上人的大脑,将这几种元素拼贴起来,一般使用蓝色色调。
在这种表述方式下,智能被归结为机械理解的、孤立的人类大脑。从身体的束缚中解脱出来,这些图似乎在暗示,智力是在数字化世界,而不是氧气的作用下发挥出全部潜力的。
谷歌搜索「人工智能」的图片,大都是如此风格
实际上,这些图片纯粹是装饰性的,往往与文章内容无关。更糟糕的是,这种比喻性的表述对公众的想象力是有害的,因为恰当的比喻对我们的决策其实很重要。
正如玛雅·英迪拉·加内什(Maya Indira Ganesh)等人所说的那样,比喻影响着我们为新兴技术制定和设计的政策,就像过去对核电技术或干细胞研究的重要决策一样。
现在这些对智能概念的不当比喻,不可能激发公众对机器学习系统中的偏见等紧迫问题进行有意义的讨论,也没有提供机会质疑我们对自身智能的理解。
这些蹩脚的比喻,只是在不断暗示读者,快点逃离「机器霸主」的支配,要么就是沉浸在一个蓝色的「数字化乌托邦」里不能自拔。
把「智能」和「感知」画出来!
在期刊文章、会议海报、教科书以及我在 2019 年至 2021 年期间参与的纽约大学实验室的日常生活中,形象化的人工智能图像基本没有。
另一方面,有很多图像,反映神经网络系统概念的图表确实存在。这些图在不熟悉的人看来可能很神秘,但在专家看来,它们就像建筑蓝图一样,描述了神经元究竟是如何相互联系,以及信息如何在网络中流动的。
可以这么说,当讨论技术细节,甚至讨论像「学习」或「智能」这样的一般概念时,研究人员会经常用手势画图,图表在构思新的算法架构中发挥了作用。可以说,正是这些图表塑造了所描绘的神经网络的性质。
如果要描绘什么是人工智能,对神经网络架构图的考察是分不开的。
通过人工神经网络的图表来观察其发展史,可以追踪该技术发展的关键趋势,可以看出当时对神经网络的视觉表达,和当时的人工智能研究人员的认知概念之间,是如何建立联系的。
从神经元到「感知器」,画的明明白白
首先是「人工神经元」概念的提出,它是由神经生理学家和控制论专家沃伦-麦库洛赫与逻辑学家沃尔特-皮茨共同发明的。
二人在 1943 年的论文中介绍了一个人工神经元,灵感来自于生物的例子。麦库洛赫和皮茨提供了一个数学模型,证明神经元的功能可以通过纯逻辑进行建模。
McCullochs 和 Pitts 提出的「神经元」示意图(1943 年)
在 20 世纪 40 年代,研究论文中的插图通常是由手绘的,然后将粘在排版和印刷的纸张上,再将照片拷贝邮寄给同事和审稿人。
在大多数情况下,我们不知道这些图究竟是谁画的。但这篇文章中,我们知道画图的是谁。
这幅图起源于作者之一麦库洛赫夫妇的厨房餐桌,在 "无尽的夜晚[......]试图理清大脑是如何工作的,麦库洛赫夫妇的女儿塔菲画了一些小图,这些小图后来成为论文中的插图。
这些图中,每个神经元都是手绘的,没有两个是完全一样的,没有一条是完全直的。神经元连接的端点略微放大,仿佛它们要插入相应的真实的凹槽中,而不只是抽象的、单纯的逻辑连接。
McCulloch 的女儿 Taffy McCulloch 当时大约 17 岁,她把神经元画成了三角形,让人想起「神经解剖学之父」 圣地亚哥·拉蒙·卡亚尔绘制的错综复杂的脑神经图。
沿着与卡亚尔的解剖图中的类似思路,McCullochs 和 Pitts 抽象出一种模块化的图示,就像积木一样,可以自由地重新组合来构成新的神经回路。
科技史学家奥里特·哈尔彭(Orit Halpern)在《美丽的数据》一书中写道,McCullochs 和 Pitts 的工作,使 「理性、认知功能、以及那些被标记为'精神'的东西,可以通过算法,从神经元的一些基本、机械的动作中推导出来。」
McCullochs 和 Pitts 对智能概念的表述,开创了对思想和生物学的机械式理解,表明大脑和计算机的工作方式是一样的,也奠定了控制论和人工智能的思想基础。
弗兰克·罗森布拉特笔下的感知器(1958 年)
1958 年,弗兰克·罗森布拉特(Frank Rosenblatt)绘制的「感知器」(Perceptron)是一个简单的视觉分类网络。
图中显示了一个「视网膜」,上面投射了一张某个形状的图像,图像被分割成 400 个 「像素」,像素以光强度作为信息,通过网络的连接流动。
只需几个例子,这个系统就能学会用连接表示和传递信息的特征模式,在没有明确编程的情况下区分不同的形状。
值得注意的是,罗森布拉特认为他的发明主要意义在于 「大脑模型,而不是模式识别」,并已经意识到这个模型的局限性。
尽管如此,感知器说明了一种基于抽象和简化的「智能」的概念,让通过纸笔和代码表示「认知」的抽象概念提供了必要的基础。
后来的很多年里,关于感知器研究项目的其他出版物中,可以发现大量不同类型的图的实验性表述,说明也许人们希望克服复杂的、伪解剖学的参照物,以更为形象的方式来表示认知功能。
奥利弗·塞尔弗里奇的「鬼域」模型(1959 年),由利安·辛顿(1977 年)绘制
奥利弗·塞尔弗里奇的「鬼域模型」是一个模式学习系统,它可以学会将摩尔斯电码翻译成文字,是对神经网络的另一种创造性尝试。在模型的示意图中,由恶魔视角取代了人类视觉。
这些恶魔一样的生物可以认识和理解,认同一个特定的字母,在听到了指定的字母信号时,会对着 「决定恶魔」的耳朵大喊作为反馈。
恶魔是超自然的存在,可以是人类或非人类,也可以是从未居住在身体里的精神。
与大多数其他生物相比,没有实体的恶魔可能是人工智能的更好的替身,因为有着人类外观的「人工智能」形象,可能让我们无法聚焦在概念本身的理解上。
尽管如此,恶魔的形象还是受到类似的视觉化问题的影响,因为如果不引用一个有生命的载体,我们似乎缺乏足够的词汇和想象力来思考和谈论智能的概念。
尽管借助了恶魔的形象,但「鬼域模型」本身的数学基础是稳固的。而纵观科学史,恶魔不时被援引为一种思想实验,或 「作为尚未理解的法律、理论或概念的某种替代」。
越来越抽象的「智能」呈现
接下来的几十年,神经网络变得越来越复杂。多个相互连接的神经元层被引入,允许进行更复杂的计算,并克服了早期神经网络的一些限制。更好的学习算法和不断提高的计算能力使得更大、更深的网络能够容纳不断增长的数据量。
萨拉-A-索拉、埃丝特-莱文和迈克尔-弗莱舍(1988)
这种发展可以从神经元的消失明显看出来。在早期的网络图中,每一个神经元都在页面上用一个标记来表示。很快,图上就只画几个神经元了,后来大都用省略号了。
Yann LeCun, LeNet-5 (1998),图中已经没有神经元的示意图,改由网络的层来表示。
再后来,神经元的表示被层所取代。在机器学习中,通常被表示为一个矩形,后来又被表示为一个带有尺寸注释的立方体(一个标明 32x32 的矩形包含 1024 个神经元)。
AlexNet 是计算机视觉领域的一篇非常有影响力的论文,是对现代机器学习的描述。如果关注这篇文章中的插图,与其说图上凸显了什么,倒不如关注说它忽略了什么。
与以前的描述相比,作者又抽象了一步,采用了等距投影法。
在 AlexNet 的论文中,将网络层和卷曲表示成嵌套的三维盒子,这本质上是一种视错觉:这页上的图完全是平面的,但却暗示了一种高维的可塑性,其中只有两个维度是真实的,第三个维度是视错觉,而所有其他维度都是无法感知的。
这个结构图的最上边部分被裁掉了,这也许是一个意外,或者作者认为这部分图无关紧要,但这也正说明了,随着时间的推移,神经网络是如何从图中慢慢从形象变抽象,最后完全从图中消失的。
Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton. AlexNet (2012)
非人类的「智能」
现代深度学习神经网络在某些情况下能够做人类做的事情,在少数情况下甚至超过了人类的能力。 同时,该领域有时会与人类的例子保持距离。
这种距离越来越多地反映在近年来发表的论文的插图中:现代神经网络架构被呈现为一种越来越抽象的、类似于工程中的流程图的形式。
Adji B. Dieng, Chong Wang, Jianfeng Gao and John Paisley (2016)
早期论文中对神经网络的生物化形态的表现形式,已经完全从论文中的语言和视觉词汇中消失。人类笔触的不准确性,已经让步于精确生成的计算机图形。
在现在的相关论文和著作中,神经网络被描绘成独立于领域的、用于学习和智能行为的模块化构件,正如当初麦库洛赫和皮茨等控制论先驱们所设想的那样。
说到底,与科幻小说相比,神经网络图是否能更好地描述人工智能?
大多数人无法理解这些概念,也无法像看待机器人那样与它们产生联系。但如果这就是这些概念最准确的特征表述呢?
与其将这些概念投射到一个金属人形目标上,还不如对人工智能论文中的插图中反映的的隐喻和象征意义的好好解读,看看这些概念的创造者们是如何思考和认知的。
遵循这种路线,我们也许可以就人工智能研究的风险和机会开展更有效的交流,这种交流不是拿科幻小说的概念类比能实现的。
也许硬核,但贵在真实。
参考资料:
https://philippschmitt.com/blueprints-for-intelligence/introduction
https://twitter.com/philippschmitt/status/1592194944953110528