3 月 29 日,据 The Information 报道,一位从谷歌离职现已跳槽到 OpenAI 的顶级研究员 Jacob Devlin 爆料称,Bard 是用 ChatGPT 的数据训练的。
Jacob Devlin 告知谷歌 CEO 桑达尔·皮查伊和其他高管,Bard 的机器学习模型正在使用 ChatGPT 进行训练。他还警告该 guge,此举将违反 OpenAI 的服务条款,同时也会让 Bard 的回答听起来与 ChatGPT 相似。
目前,Devlin 已加入了 OpenAI,而谷歌可能在 Devlin 发出警告后停止使用 ChatGPT 数据,并且他们有可能完全放弃这部分训练。
据报道,谷歌使用了一个名为 ShareGPT 的网站的数据,该网站记录了用户与 ChatGPT 的对话。
对于 Bard 是否剽窃了 ChatGPT 数据训练的问题,业内人士表示这一问题确实存在争议。因为基本上 Bard 会吸收实际上每个人都可以访问的数据。此外,ChatGPT 等人工智能作品的版权问题仍有待界定。所以不清楚目前唯一可以商用 ChatGPT 的微软的 License 是否也适用于这种情况。
对于以上指控,谷歌发言人 Chris Pappas 在接受科技网站 The Verge 采访时表示,“Bard 没有接受过来自 ShareGPT 或 ChatGPT 的任何数据的培训。”
竞争对手 ChatGPT 的大火,让谷歌 AI 技术一度陷入尴尬。在发布 Bard 不久后,人们在与 Bard 的对话中询问了其使用的数据集,Bard 声称它接受了谷歌内部数据的训练,包括谷歌搜索、Gmail 和其他产品。不过,谷歌后来澄清说,Bard 没有接受过 Gmail 数据的训练,回复可能是实验语言模型的错误。