谷歌Bard被曝剽窃ChatGPT?BERT一作跳槽OpenAI,揭惊天内幕

  新智元报道

  编辑:编辑部

  谷歌有大麻烦了!外媒爆料说,Bard 的训练数据部分来自 ChatGPT。谷歌可能跳到黄河里也洗不清了。

  3 月 29 日,外媒 The Information 曝出了一个惊天大瓜!

  谷歌的离职员工、已跳槽 OpenAI 的顶级研究员竟然曝出——Bard 竟是用 ChatGPT 的数据训练的!

  如果事情为真,这可真算得上是谷歌的顶级丑闻了。

  对抗 ChatGPT 的 AI,竟然用的是 ChatGPT 的训练数据,这可太讽刺了。

  并且,这也明显违反了 OpenAI 的服务条款——要知道,微软拥有将 ChatGPT 用于商业目的的独家许可,谷歌因此很可能要吃官司。

  训练 Bard,谷歌竟「借用」了 ChatGPT 的数据?

  Jacob Devlin 这个名字,可谓如雷贯耳。谷歌在 2018 年发表的 BERT 模型的论文,Devlin 就是一作。

  正是这篇论文,引发学术界 AI 研究的热潮。而 Devlin 的研究,可以说为谷歌和 OpenAI 的语言模型奠定了很大的基础。

  论文地址:https://arxiv.org/pdf/1810.04805.pdf

  虽然 Devlin 跳槽到 OpenAI,是今年 1 月的事,我们很早就知道了。

  但是 Bard 用 ChatGPT 数据训练的事,却是最近才曝出。

  根据 The Information 的报道,Devlin 从谷歌离职的原因之一,就是他发现谷歌用于对抗 ChatGPT 的种子选手——Bard 在训练时,用的正是 ChatGPT 的数据。

  他警告了 CEO 劈柴和其他高管,告诉他们 Bard 团队正在使用来自 ShareGPT 的信息训练,随后辞职。

  爆料一发出,业界人士们都炸了。

  有网友评论道:「这可是业内大忌啊。」

  而当事人之一、ShareGPT 的创建人 Steven Tey 表示,其实自己早就知道这个事了,并且此事早就在谷歌内部传开,许多员工对此很不满,很担忧。

  随后,他又发帖说,这下,猫可从口袋里跑出来了吧。(谚语,指无意间泄密)

  这也是为什么我们上周关闭了 ShareGPT 的 Explore 页面,其中有超 112k 的共享对话数据。 太疯狂了!

  其实是个「套壳」ChatGPT?

  ShareGPT,是 Steven Tey 和 Dom Eccleston 在 2022 年 12 月共同创建的一个 Chrome 扩展,能够捕捉和分享人们在 ChatGPT 中的对话内容。

  通过捕获他人与 ChatGPT 的完整对话,ShareGPT 能生成一个 URL。通过这个扩展,人们可以直接分享 URL,省去了截取多个对话截图的时间。

  也就是说,如果用 ShareGPT 的信息训练 Bard,很可能把 Bard 训练成一个「翻版 ChatGPT」。

  据内部人士透露,Devlin 发出警告后,谷歌立马停止了利用这些数据来训练 Bard。

  但在外媒 The Verge 就该事件询问谷歌发言人 Chris Pappas 时,他却否认了。

  他很肯定地说,「Bard 的训练没有使用任何来自 ShareGPT 或 ChatGPT 的数据。」

  到底用没用呢?此事目前还是个罗生门。

  有意思是,OpenAI 此前就经常陷入争议,许多网站和艺术家指控 ChatGPT 是从自己这里窃取的数据。

  而今天,这是第一次有人指控别的公司从 ChatGPT 窃取数据。

  就是说,贵圈真的是个圈。

  谷歌的反击,有些狼狈

  此前,大火的 ChatGPT 整合进必应中,已经导致了谷歌的股价下跌。

  搜索巨头地位被撼动的谷歌,正在不顾一切地迎头追赶。

  结果 Bard 在发布会上当场出错,让谷歌沦为笑柄,市值蒸发 1000 亿。

  而最关键的问题其实是,Bard 已经晚了一步。即使正式发布,媒体和坊间都反响了了,似乎无人在意。

  而 Devlin 离职谷歌、加入 OpenAI 的选择,更是寓意深刻——既然谷歌如此严重依赖 ShareGPT,那大神就干脆加入 OpenAI,不用中间商。

  而更严重的是,微软拥有将 ChatGPT 用于商业目的的独家许可。

  因此,Devlin 担心谷歌以这种方式使用数据,违反了 OpenAI 的服务条款。如果此事得到证实,谷歌很可能面临诉讼。

  当然,OpenAI 也并不清白。训练 ChatGPT 的数据,也是从公共互联网上「借用」的。这些内容,其实也未经艺术家、作家、摄像师等人类创作者的许可。

  虽然微软最近确实宣布了一些补偿计划,要补偿为 Bing Chat 的答案做出贡献的内容创作者。

  但说到底,无论是谷歌还是微软,它们唯一真正关心的事情,还是股东的利润。

  谷歌大脑和 DeepMind 联姻

  而 The Information 的报道中除了有上面那个大瓜,还有另一个瓜。

  ChatGPT 自去年 11 月 ChatGPT 爆火之后,谷歌和 OpenAI 之间的军备竞赛,就日益剑拔弩张。

  现在,为了对抗 ChatGPT,谷歌的两个最强「大脑」——DeepMind 和 Google Brain,已经选择了强强联手。

  据两位知情人士透露,DeepMind 和 Google Brain 最近几周正在开发与 OpenAI 竞争的另一产品,内部代号为 Gemini(双子座)。

  Sundar Pichai、Demis Hassabis 和 Jef Dean(从左起)

  自谷歌 2014 年收购 DeepMind 以来,DeepMind 先后发布了几款令人世人惊艳的人工智能,比如 AlphaGO、AlphaCode、AlphaFold。可以说,风头远远超过了谷歌。

  自 ChatGPT 发布后,谷歌大脑时不时更新一些进展,然而 DeepMind 一直还公布近来的大动作。

  而现在,Alphabet 这两个人工智能实验室的员工都认为,OpenAI 已经远远超越了他们。再加上,许多关键工程师和研究人员纷纷流向 OpenAI,让谷歌内部人士纷纷堪忧。

  加上上周 Bard 向部分用户开放后,表现又比不上 ChatGPT。

  眼看自己亲手培养的孩子 Bard 不如人意,谷歌研究人员干脆再要一个,目标是要能与 GPT-4 一战。

  由此看来,Gemini(双子座)重要性不言而喻。

  其中一位知情人士表示,谷歌大脑的负责人、谷歌资深人工智能研究主管 Jef Dean 已经在该项目中都自己手动敲代码了。

  可以说,Gemini 的诞生是被迫联姻的孩子。因为,此前 DeepMind 和 Google Brain 这两个实验室很少相互合作或共享计算机代码。

  一位知情人士表示,但现在,由于双方都希望开发自己的机器学习模型,以与 OpenAI 竞争,而且需要大量的计算能力。因此他们别无选择,只能合作。

  如今,这一努力让谷歌在搜索和云方面等无数团队的产品路线,因 ChatGPT 的竞争而受到了动摇。

  没钱赚,Google Assistant 重组

  这不,就在近日,Google Assistant 部门面临重组,以专注研发 Bard。

  在给员工的一份备忘录「Changes to Assistant and Bard teams」中,列出了许多高管变动。

  一位 Google Assistant 工程副总裁 Amar Subramanya 现在将领导 Bard。而另一位工程副总毛建昌「因个人原因」离开了谷歌,谷歌商务部门副总裁 Peeyush Ranjan 成为了接盘者。

  Google Assistant 业务部门副总裁兼负责人 Sissie Hsiao 在这份备忘录中称,「鉴于 Bard 团队的不懈努力,我们希望继续支持并执行未来研究项目。」

  这听起来像 Assistant 团队现在支持谷歌以对抗 ChatGPT「红色代码」的战斗。

  Google Assistant 注定是失败了吗?其实,越来越多的证据表明该部门正在走下坡路:

  • 从 2016 年到 2021 年,Google Assistant 在五年内发布了八个主要的扬声器/智能显示器硬件,但硬件发布似乎已经停止。上一次硬件发布是在 2021 年 3 月。那是整整两年前的事了。

  • 2022 年,谷歌从两个内部产品线中移除了 Assistant 支持:Nest Wi-Fi 和 Fitbit 可穿戴设备。

  • 2022 年还看到了 The Information 的一份报告,该报告称谷歌希望「减少投资开发其用于汽车和非谷歌制造的设备的 Google Assistant 语音辅助搜索」。

  • Google Assistant 的驾驶模式于 2022 年关闭。

  • Google Assistant 的「Duplex on the web」功能也于 2022 年关闭。

  • Google Assistant 的一项核心独特功能 Reminders 即将被关闭,取而代之的是 Google Task Reminders。

  • Google Assistant 从来没有赚钱过。硬件以成本价出售,没有广告,而且没有人支付月费来使用 Google 助理。处理所有这些语音命令的服务器成本也很高,尽管一些较新的设备已经以隐蔽的成本削减举措转移到设备上处理。Assistant 最大的竞争对手亚马逊 Alexa 也处于同一条船上,每年亏损 100 亿美元。

  从 Google Assistant 这些年的发展也可以看出,谷歌的运作方式真的太封建了。

  这家公司似乎有一种约定俗成的观点,即让项目在现有产品(如地图或助手)的支持下运转,才是一种可靠的挣钱方式。

  因此,尽管公司里已经囤积了许多世界上最优秀的 AI 研究人员,但他们的才能似乎只能受困于企业战略的轨道。

  在 Bard 之前,谷歌这些年在 AI 市场化上的进步,无非就是不断改进 Google Assistant 等一些小玩意,用 AI 做一些边角料。

  这样一个巨头,本应是顺应趋势、推动潮流、搅动世界的。

  网友评论

  此事一出,已经有网友放言:那咱们都算是谷歌 Bard 的联合创始人了,赶紧写到简历里。

  「这一场公关战,谷歌是真的输了……」

  参考资料:

  https://www.theinformation.com/articles/alphabets-google-and-deepmind-pause-grudges-join-forces-to-chase-openai