GameLook 报道/每当颠覆性的全新技术出现,当它们在为我们带来红利的同时也很难不与旧有的法律体系产生摩擦。自 AI 生成图像技术在公众间走红仅有不到两年,在随后经历了天翻地覆的飞速迭代。用户们领略了 AI 席卷全球的浪潮,而在浪潮之下,各大商业公司们正在为 AI 生成图像的版权归属扭打作一团。
在今年年初就有多名画师对 Stable Diffusion 和 Midjourney 提起集体诉讼,认为这些 AI 工具在训练时使用了大量拥有版权的原始素材,侵犯了这些画师的权利。商业图库 Getty Images 也对 Stable Diffusion 和 Midjourney 进行了起诉并指出,这些 AI 生成算法使用了该平台提供的上百万张高质量照片,涉嫌构成侵权。这两项诉讼目前还在审理之中,还均未得出结论。
不过,美国著作权局近期在有关 AI 版权争议的议题上做出了一项裁决,这意味着首次有美国官方机构在 AI 版权问题上做出相应表态。
一名图书作者 Kristina Kashtanova 此前将其创作的漫画书《Zarya of the Dawn》向美国著作权局提起注册,书中使用了部分由 Midjourney 创作的插图。著作权局此前曾接受了这一注册,但在前日向 Kristina Kashtanova 的律师发送了一封长达 29 页的信件称,该局将撤回对 Midjourney 部分的版权保护。
美国著作权局在信件中表示:“我们确认,Kristina Kashtanova 女士是该书中文字部分和部分图文内容的作者,这一部分版权将受到保护。然而,由 Midjourney 技术生成的图片不属于人类著作成果。”据此,著作权局将为 Kristina Kashtanova 换发新的版权许可。
官方解释:AI 生成具有”不可预测性“
此前,Kristina Kashtanova 就与美国著作权局在版权判定的相关上做出了交涉。著作权局在此次的信件中对他们做出裁定的原因做出了较为详细的解释,并对一些较有争议性的 AI 生成版权议题做出了回应。
Kristina Kashtanova 提交的 AI 创作过程
信件表示,尽管艺术家本人在前期的沟通中抗辩称他们通过“数万次的创意指令(Prompt)输入调整”来引导和微调 Midjourney 生成图像的方向,但 AI 依然是在用“不可预测的方式”生成图片,且生成者依然是 AI 的机制本身。著作权局认为,用户对 AI 输入的文字指令更像是建议而非命令,因此使用 AI 生成图片与雇佣一名艺术家让其帮助自己绘画在形式上更为相似。
著作权局援引美国最高法院对著作权(authorship)的定义称,一部受版权保护的图像作品的作者必须是“真正整合该图片的人”,且此人必须“扮演创造者或主谋的角色。”著作权局表示,尽管指令可以影响 AI 的生成方向,但无法对 AI 最终的生成结果起决定性作用,“由于用户对 Midjourney 发出的文字指令和最终生成的视觉图像有相当的距离,Midjourney 用户对最终图像并没有足够的控制权,因此不能被认定为创意的主使者。”
著作权局还将 AI 生成技术与其它辅助性计算机创作工具(如 Photoshop)做出了区别。著作权局认为,艺术家们在使用辅助性创作工具的时候,他们”选择了用来修改的材料,选择了使用的工具,决定了做出哪些修改,并通过具体的步骤控制并最终得出与艺术家们的创作构想相一致的图片结果。“但 Midjourney 的不可预测性让用户对图片的控制力并不能与这些辅助性工具相比。
Kristina Kashtanova 表示,她曾使用 Photoshop 对部分图片的细节进行了修改,但著作权局认为,这些细微的修改并不能体现 Kristina Kashtanova 本人对创作意图带来的影响。
Kristina Kashtanova 称她利用 PS 修改了生成图像的嘴唇
最后,针对 Kristina Kashtanova 此前所提出的她在调整文字指令上”花费了大量时间“的观点,著作权局回应称:”本局并不置疑 Kashtanova 女士所声称的她在 Midjourney 上付出了大量的时间和努力,但努力并不使她能够因此被认定为这些图片的‘作者’。法院已经驳回了‘额头出汗原则’的合理性“。额头出汗原则是知识产权法律领域的一条基本原则。据维基百科的相关解释,”美国联邦最高法院在 Feist v. Rural 案中否定了该原则,认为原创性不是‘汗水的积累’;版权奖励的是‘原创而不是努力’,作品至少需要‘最低分量的创造性’。“
不是一刀切!AI 画图注册版权并非无望
综合全文考虑,这篇信件看似在知识产权领域否定了用户”认领“AI 创作绘画的可能性,但事实上,该局的这一裁定并非一刀切式的全盘否定,更不如说是首次在官方层面上划定了认定的界限,即人的”创意性“。
在文章最后,美国著作权局特意强调他们并没有完全排除接受 AI 绘画版权注册的可能性,而仅仅是认定这一案例中作者对图像的影响并没有体现出足够的创意性:”本局的这一裁定基于 Kristina Kashtanova 女士的这部特定作品对 Midjourney 的使用方式。其它与 Midjourney 运作方式不同的 AI 工具或许拥有输出表达性材料的能力。但是,基于本局的此前的行政记录,Kristina Kashtanova 女士并不是由 Midjourney 生成的图片在版权意味上的作者。“
这给出了一个很明显的暗示,即如果作者的创意性能够在图片中(而非文字的输入指令)得到足够的体现,那么美国著作权局依然愿意将其纳入版权保护的范畴之中。如果说最初的 AI 生成方式还需要靠纯粹的文字输入指令进行式的生成,随着 AI 技术的进化,AI 工具的自定义性事实上在水涨船高。
越是接近高阶的使用者,”胡子眉毛一把抓“式的生成方式就越难以满足强调精准高效的开发需求。假如以 Unity 等商业引擎的发展做类比。尽管虚幻 5 与 Unity 这类成熟的商业引擎提供了能够满足大部分场景的”开箱即用“解决方案,但在现实中,很多有能力的工作室依然会根据自己工作室的开发实际需求进行进一步的引擎组件开发,乃至于对引擎进行魔改。Kristina Kashtanova 就在此前的抗辩中表示,自己花费了近一年的时间才制作出了这些图像,而著作权局也是据此认为 AI 生成具有太多不可预测性的结论。这也反映出了笼统生成模式的低效。在未来,至少有一部分 AI 生成技术将会向精准出图这一方向发展。
例如,最新的 AI 插件 ControlNet 就很大程度上改善了“出图全靠蒙”的大趋势,通过引入参考线和肢体识别的方式,AI 从此将可以以一定的方式定向生成图片,大幅提高了精准度。而对 AI 训练师的”炼金“技术要求也从单纯的文字指令拆解揣摩外延出了更多维度。
或许在未来,生成性 AI 会进入游戏引擎、图片编辑软件等生产力软件并成为重要的开发组件,成为辅助创作的得力助手。那么假以时日,总会有部分 AI 的工作流模式能够产出达到版权保护所需要的”最低分量的创造性“(minimal level of creativity)的要求。