为什么全人类都呼吁把通用人工智能“管起来”?

  3 月底,马斯克在内的许多社会名流共同签署了一份公开信,希望包括 OpenAI 在内的机构至少把更高能力的 AGI 研发暂停 6 个月,从而让人类社会达成某种基于 AGI(通用人工智能)威胁的协议。

  这封信虽然文本不长,但是涵盖了非常广泛的内容,内含的问题很丰富。

  比如,人类该如何算这笔账——AGI 让信息渠道充斥宣传甚至谎言;如果是人类本来就喜欢和满意的工作,是否应该被 AI 取代?而这些效率提升,是否值得我们冒着“失去对文明控制”的风险?而人类针对 AGI 的监管体系又应该如何搭设?

  这封信最终的结果是引发了硅谷规模空前的观点撕裂的大讨论。毕竟如果以 GPT3.5 进入人类社会视野为起点,对于 AGI 的发展,人类还有太多的盲点没有解决、有太多争议没有达成共识。但当人类还在争吵时,AGI 已经开始在全球各地制造麻烦了,虚假信息和信息泄露都像是一个让人不安的庞大黑箱。

  因此,最近一段时间以来,包括欧美日韩在内的各个信息发达国家都开始了对大模型监管的讨论。而在 4 月 11 日,国家互联网信息办公室也发布了《生成式人工智能服务管理办法(征求意见稿)》(以下简称《办法》)。

  这份《办法》的重要意义在于,它可以算是人类社会面对 AGI 监管中最早的官方文件之一。

  而监管视角往往是人们理解 AGI 中很独特的一个角度:

  不同于科学家视角有很多参数上的复杂解释体系、有诸多复杂的模型框架流派。监管者是社会利益的代言人,也往往是站在社会整体的角度去思考。因此监管者的思路也往往更接近大部分人朴素的直觉。但它同时又代表了核心专家群体的思考,所以它也能部分回应新事物的很多讨论。

  所以这份《办法》其实可以成为很多人普通人去理解 AGI 的一个窗口,他可以帮助我们更好地理解和参与 AGI 讨论。因为 AGI 既不是天使,也不是魔鬼。而祛魅后的 AGI 也将成为我们公共生活中的重要部分。

  “我是谁”:生成式人工智能

  如果站在硅谷的角度,AGI 约等于大模型。它是通过优化的模型、结构语料库和庞大的算力组合而成,带有一点智慧体思想特征的计算机程序。

  《文件》对这个“新物种”的划入到了“生成式人工智能”行业,即“基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。”

  显然这是从 AI 与社会关系的角度出发。

  毕竟 AGI 未来的技术特征会改变,模型大小会浮动,但它最终要追求与社会之间互动的内核不会变。而无论一个模型封闭开发多久,其最终目的都是要面向社会做内容输出。这其实是过去辅助决策、检索、安全、支付等垂直 AI 与 AGI 很核心的不同。

  而从技术远景来看,任何有广泛用户基础的“生成式 AI”,其大概率都会是有 AGI 底层能力的产品。

  而对于普通人来说,AGI(通用人工智能)这个名词确实也有点太“魅惑”。许多人将 AGI 与人类智慧相类比,仿佛让人看到了一张“赛博灵魂”,全然忘了 AGI 只是有一点智慧的苗头,未来的发展其实还有巨大的不确定性。

  所以与其说我们未来是《西部世界》似的“AGI 社会”,不如说我们将迎来一个“生成式人工智能”的世界,这可能更贴近我们这一代人的技术现实。

  “我属于谁”:服务提供者

  在 AGI 伦理讨论中存在一个经典问题:大模型生成的内容,版权到底是属于大模型公司、还是属于辛苦写 prompt(提示词)的用户?

  《办法》虽然没有明确规定版权的归属,但在监管上划出了责任义务,可以供更多人参考。根据《办法》:

  “利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人(以下称‘提供者’),包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任”。

  如果沿用这个思路,负责人其实既不属于大模型的研发人员、也不属于用户,而是属于连接大模型与用户之间的服务提供者。

  当然,在大部分情况下 AGI 的开发者和 API 提供者应该是同一个主体。但随着技术生态的演进,不同层次的主体可能会变得多元化。

  明确中间的服务提供者承担责任,其实也符合“生成式人工智能”的官方定义。同时,这样的权责划分其实也倒逼未来上游产业链必须达成足够好的内容互信。

  AGI 的“内容权”:需要标识

  与版权问题类似的争论是:AGI 内容是否可以与人类享受的内容“同权”?

  《办法》明确对 AGI 内容做出了限制,出现在了两个地方:

  ·“按照《互联网信息服务深度合成管理规定》对生成的图片、视频等内容进行标识。”

  ·“提供者应当根据国家网信部门和有关主管部门的要求,提供可以影响用户信任、选择的必要信息,包括预训练和优化训练数据的来源、规模、类型、质量等描述,人工标注规则,人工标注数据的规模和类型,基础算法和技术体系等。”

  关于 AGI 内容一直存在争议。尤其在 GPT 内测的时候,系统有时候表现得像是一个村口玩手机的大爷。它有时会直接给用户一些包含价值判断的观点,却没有足够说服力的信息佐证。

  如果《办法》落地,AGI 就会彻底告别“口说无凭”的跑火车式的内容输出,转而衍生出一些搜索似的工具属性。而像过去拿着 AI 合成作品去美术比赛拿奖的事情,也将彻底变成一段“黑历史”。

  这其实与法律的精神相匹配,AI 在内容生成上是绝对的强者,他自然也需要承担更多的举证义务。而多模态的内容形态可能存在巨大的内容风险,自然也需要相应的制约机制。

  相反,如果让 AGI 内容与人类内容完全同权,可能会对人类自己的内容生态产生难以评估的影响。

  “监管生态”:阿西罗马原则

  在开头针对 OpenAI 的公开信里有一个小细节,它提出应该有一个审计的生态(ecosystem),而非体系(system)。

  而公开信也提到了阿西罗马 AI 原则(Asilomar AI Principles),即先进 AI 对人类的影响会是一个文明级的,因此对它的规划和管理所需要耗费的资源,应该是与其本身耗费的资源相匹配的。

  换言之,如果生成式 AI 会是一个庞大的体系,那么就不能仅仅靠某个环节、某个主体完全实现监管。

  除了继续强调既有法律的监管地位外,《办法》中也强调了对生成式 AI 的全流程监管。

  比如语料库(“预训练数据”)必须合法合规、数据标记必须培训“清晰、具体、可操作的标注规则”、使用场景必须符合规范并承担相应责任、内容本身需要被标注、用户使用过程中要有明确的举报反馈通道等等。

  既然 AGI 会成为庞大的生态底座,那么监管者其实也需要用更多元化的方式去执行监管任务。

  因此尽管大模型有一定的黑箱属性,但通过一整套组合拳,也足以倒推技术黑箱后的合规能力,从而达到“开箱”的目的。

  而为了进一步明确开发者责任,《办法》中还加入了这么一条:

  “对于运行中发现、用户举报的不符合本办法要求的生成内容,除采取内容过滤等措施外,应在 3 个月内通过模型优化训练等方式防止再次生成。”

  换言之,如果监管方只是想用“内容过滤”的手段逃避进一步的模型优化责任,在《办法》中是违规的——AGI 需要一个合规的灵魂而不只是合规的 API。

  “驯火”

  有很多人将 AGI 的发明比作“火”,人类学会了生火、享受火的文明成果,但同时也要花更漫长的时间去“驯火”。

  在前面提到的公开信里,提出一个好的 AGI 应该满足至少几个标准,准确、安全、可解释、透明、鲁棒、对齐一致、值得信赖和忠诚的(accurate, safe, interpretable, transparent, robust, aligned, trustworthy, and loyal)。

  换言之,AGI 绝不能像现在这样,成为一个玄学般炼丹炉式的黑箱。它应该对人类有更高确定性的利好。

  所以公开信提出了更多远景的技术监管设想,比如建立一个庞大算力规模的、专业垂直的监管体系,达成某种底层的代码公约等等。这些提议是否值得落地,还需要更多的行业讨论。但一个相对具有确定性的事情是:

  就像人类在“驯火”的过程中才更加了解“火”一样,人类社会只有不断与 AGI 互动、博弈的过程中,或许才可以更加了解 AGI。