文|险峰创
2023 年险峰线上沙龙的第一期,我们和四位行业大牛聊了聊最近大火的 ChatGPT。
首先介绍一下本场嘉宾:陶芳波博士是前 Facebook 高级研究科学家,回国后进入阿里达摩院,搭建了阿里的神经符号实验室,属于全球最顶级的 AI 科学家之一,目前正在创业,担任人工智能公司「心识宇宙」的 CEO。
黄东旭是险峰的老朋友,「PingCAP」的联合创始人兼 CTO,他本人是国内最早一批开源数据库的创业者,在程序员圈子里非常活跃;PingCAP 也是目前 Infra 领域估值最高的科技公司之一,险峰曾在天使轮分别投资了 PingCAP 和心识宇宙。
费良宏老师是 AWS 的首席架构师,曾供职于微软、苹果等多家硅谷巨头担任技术顾问,在云计算行业里深耕多年;龙波博士目前担任 Meta 商业化 AI 研究团队的负责人,之前曾深度参与过京东搜索推荐算法的搭建。
此次圆桌由险峰长青投资副总裁李抗主持,李抗主要专注于人工智能、机器人、云计算等方向的投资。
本次我们将聊到:
-
ChatGPT 效果如此“炸裂”,AI 从业者们事先是否预见到了?
-
ChatGPT 是否能理解语言逻辑本身?
-
为什么谷歌没能做出 ChatGPT?
-
开源圈和云计算巨头是如何看待 ChatGPT 的?
-
ChatGPT 能让 TMT 投资人“再干 15 年”吗?
-
ChatGPT 正在对哪些工作岗位造成影响?
-
ChatGPT 广泛使用后,人的认知能力会下降吗?
-
ChatGPT 会导致哪些行业消失?哪些公司急需转型?
-
小公司如何抓住 ChatGPT 的逆袭机会?
-
硅谷现在如何看待 ChatGPT?
-
普通人如何拥抱 ChatGPT ?报考计算机专业还有前途吗?
-
OpenAI 的组织设计给创业者带来哪些启示?
ChatGPT 效果如此“炸裂”,AI 从业者们是否预见到了?
险峰:去年 AI 作画也火过一阵,但都没能像 ChatGPT 一样让普通人感到震撼,似乎是一夜之间,AI 就达到了一个如此炸裂的效果,基于各位对 NLP 与 AIGC 的理解,这种进步是在意料之中还是意料之外?
陶芳波:刚才主持人已经介绍过我的背景,我本人从读博士到后来工作创业,一直在从事 AI 相关的科研工作,但坦白来说,这次 ChatGPT 给我带来的震撼,并不亚于屏幕前的每个人。
传统上,越复杂的技术,信息壁垒也越高,所以过去的情况往往是,行业内的人都已经知道技术发展到了什么水平,但大众可能还不知道;而 ChatGPT 完全不是这样,它刚刚诞生 3 个月,我们就看到无论巨头大厂还是 AI 科学家们,都马上进入了一种非常紧张的应对状态,甚至可以说是应激状态。ChatGPT 突然具有了这么强大的通用性能力和逻辑推理能力,是超出很多 AI 从业者设想的。
为什么这件事会发生?我仅从个人角度做一个简单的总结。
第一,是大数据和大算力的发展,这是一个基础。2012 年深度学习刚刚诞生的时候,大家就尝试把更多的算力和数据灌输到一个模型中去,让 AI 具有更强的能力,这个逻辑在今天依然没有变化。
我们知道人脑要比动物的大脑更聪明,两者最直观的差别,是人脑的神经元和神经突触更多,比如人脑的神经元有 1000 亿,神经突触可能有几万亿,今天 ChatGPT 可以达到上千亿的参数量,已经跟人脑比较接近了,量变才有可能引发质变,AI 的发展首先要靠算力数据的指数级发展。
第二,是在人工智能的发展背后,其实一直有「专用人工智能」和「通用人工智能」的两派观点的争论。
以前我们熟悉的人工智能,比如计算机视觉算法和自然语言算法,都属于「专用人工智能」。而在他们以外,其实一直有另一拨人在尝试,有没有可能把单个的专项 AI 变成一个通用 AI?用一个统一的大模型来解决所有的问题?
这里面有几个关键性的节点,首先是 2017 年,谷歌大脑(Google brain)发表了一篇关于 transformer 的文章,奠定了包括今天 ChatGPT 所有技术的基础,细节这里不展开了——总之它让很多人意识到,通用型 AI 是有可能被造出来的。
对此,谷歌的做法是首先搞一个底座,这个底座叫做「预训练大模型」,然后不断向底座里灌输数据,让它上面能长出一个个小模型来,再用这些小模型去解决不同的任务。
这时出现了一家公司叫 OpenAI,他说我不相信仍然需要训练小模型来造出通用 AI,那我能不能直接让大模型去阅读互联网上所有的数据?砍掉中间环节,直接让人用语言去和大模型交流?
基于这种思想,OpenAI 在 2018 和 2019 年,分别推出了 GPT1 和 GPT2,但当时它的通用性还不强,没有引起太多关注,然而到 2020 年,第三代也就是 GPT3 出现了。
GPT3 直接把模型参数量从 15 亿提升到1,750 亿,接近了人脑中神经连接的数量水平,这时一个神奇的事情就发生了,AI 开始「涌现」出了一些人脑独特的能力,甚至出现了逻辑判断能力,这在以前的机器学习界是不存在的,我甚至觉得连 OpenAI 内部都不一定能预判到这件事情会发生。
而这个 GPT3,就是今天 ChatGPT 诞生的起点,正是因为 GPT3 的出现,大家才开始去基于它去开发一些全新的 AI 能力。
可以这么说,从 2020 年的 GPT3 开始,整个 AI 行业都进入到了下一代范式,至于它的边界在哪里,大家都不知道,没有人有足够的认知。
这也是我想讲的第三点,就是 OpenAI 之所以能超越于谷歌,是他们真的在尝试理解「学习」这件事的本质。
早期的 AI 要靠人工打标签,要一个活人坐在屏幕前告诉机器——这是一只猫,这是一只狗;之后发展到 GPT3,这时已经不用再打标,而是让机器直接去阅读大量的数据,看它能不能找出里面蕴含的规律和规则。
在这个基础上,OpenAI 又进一步,他们说既然 AI 已经学了这么多知识,那下一步就是怎么把这些知识输出来,变成人可以用的东西;于是 OpenAI 开始教大模型如何自我改造,更好的去解答人类提出的指令,而后甚至演化成 AI 自我对抗一个人类制定的判断标准,完成 AI 的“社会化改造”,到 2022 年,ChatGPT 横空出世了。
刚才东旭提到,他现在每天都用 ChatGPT 帮自己写代码,代码其实比自然语言更有逻辑性,站在 AI 的视角,等于你也是在帮它培养逻辑能力。
如果说 GPT3 还在无目的数据中学习,到了 ChatGPT 就已经变成了“在应用中学习”。整个过程真的很像一个年轻人走出校园,进入到公司中实习的感觉。
所以我们可以看到,OpenAI 一直在探索人类学习的本质是什么,当他们把这一整套工业化的体系和自己对 AI 的超前认知整合到一起,就创造出了 ChatGPT,这时候所有人才发现,原来我们已经落后了 OpenAI 这么多,我们还在模仿人家 2020 年的 GPT3 版本。
所以 ChatGPT 不仅对普通人是震撼,对大公司来说更是震撼,我们必须去面对这个全新的现实,思考该怎样迎接这样一个新物种的出现,以及未来人类分工的变化。
费良宏:我补充两句,今天我们看到市场一夜间被引爆,但背后绝不是一日之功。
首先是 2017 年 transformer 那篇论文,将整个 NLP 市场完全被颠覆了。以前很长一段时间里,大家都觉得非精确的模糊化语义很难被突破,但 transformer 出现之后,一下把 NLP 精度提升到了无法想象的量级。这时所有人的研究方向全部都开始转向了 transformer,这是一个里程碑式的改变,我觉得怎么样去夸它都不为过。
第二个是算力,刚才陶博士也提到,最早的时候我们自己搞一台电脑,装上 1080Ti 都可以跑一些模型,但今天由于参数提升,千亿级规模的算力已经不是普通人能参与的,也许真的是大力出奇迹,诞生了 ChatGPT,那么未来延续着这条路,不断堆积数据量,增加模型的数量,比如据说 GPT3 使用了 45PB 的数据量,未来是不是可以用 100PB 数量、万亿级参数甚至更大规模的算力?或许真能诞生出一个非常强大的通用型 AI,对此我是比较乐观的。
龙波:我对于 ChatGPT 的出现并不特别惊讶,准确的说,是对它的效果不惊讶,但是速度上我还是挺惊讶的,没想到会来的这么快。
刚才几位都谈到了一个重要的点,即 transformer 的里程碑作用,这里我想从 NLP 的角度分享一下,为什么它是里程碑?
从 NLP 发展的逻辑来看,最早的 NLP 模型是基于对单个单词统计来做的,到后来卷积网络(CNN)出现,机器开始能够基于两三个单词来理解词义;再往下发展到 RNN 时代,这时 AI 基本上就可以沿着整个 sequence 进行积累,可以理解相对长的短语和句子,不过依然还无法真正理解上下文。
随后一个很重要的突破,是「注意力机制」(attention model)被提出,其实 transformer 的核心概念也是来自于此;在这个阶段,AI 开始能够结合所有上下文,理解每个词之间表达重要性的不同。
这就很像我们的快速阅读,为什么人类能够做到“一目十行”,是因为我们能看到一些关键词,而每个词的重要性不一样。
「注意力机制」正是起到了这个作用,它告诉 AI 各个关键词之间的关系如何,谁重要谁不重要。整个行业再往后就是 transformer 诞生,然后 Bert(Bidirectional Encoder Representations from Transformers)诞生,其实 Bert 也非常重要,就像陶博士刚才提到的,Bert 可以使用大量没有标注的数据,自己创建一些简单任务来做 self learning。
举个例子,比如一句话,AI 会把其中的一个词藏起来,然后猜这个词应该是什么,有点像机器自己和自己玩游戏,如此它的语言理解能力就变得越来越强——我觉得到了这个时间点上,当 AI 开始利用大量非标注数据完成自主训练,ChatGPT 的出现就只是个时间问题了。
但是这也是它的局限性,ChatGPT 无论如何惊艳,它仍然是个统计语言模型,本质还是基于它所看到过所有数据,用统计意义上的预测结果进行下一步输出,当它拿到的数据里有逻辑的时候,它会通过统计的方法把逻辑找出来,让你感觉到它的回答很有逻辑,但假如它读了很多杂乱无章的文本,它一样会说话没有逻辑,这是统计语言模型天生的缺陷。
所以我并不确定,未来随着参数越来越多,ChatGPT 能否真正成为 AGI(通用人工智能)?因为人的推理能力并不完全基于统计信号,这是我个人比较保守的看法。
ChatGPT 是否能理解逻辑本身?
险峰:这个话题本来是后面的,正好提到了就提前探讨一下。
现在很多人会觉得 ChatGPT 很酷、很有逻辑,但有的时候也会觉得它在一本正经的胡说八道,有些很简单的问题它会答错,这件事反过来也会让大家好奇,ChatGPT 是否真的具有逻辑?或者说理解逻辑?
对此,也有两派观点,一派是觉得极致的模拟就可以实现逻辑,虽然只是基于统计学,但看起来有逻辑其实就等于逻辑本身;另一派觉得所有模拟都只能得到大概的正确,最后还是要建立在极其精准的规则之上,两派的分歧可能就是统计和规则的区别。
此外还有第三种观点,借鉴了生物组织的复杂性来解释这个问题,比如蚁群,单独一只蚂蚁可能不知道自己在干什么,但是一个蚁群就可以做很多复杂的事情,这两者也类似于神经元和大脑的关系,对这个问题也想听听几位的思考。
黄东旭:先说一个外部视角,我最近一直在用 ChatGPT 写代码,可能是玩的确实太多了,基本没有遇到 AI 胡说八道的情况;个人观点,很多人觉得它不准有两种情况,一种是问题没问对,如果问题本身是模糊的,它给出的答案也会是模糊的,比如一些开放式的问题。
第二是它有些回答不一定是假的,只是中间跳过了很多步骤,比如一个问题,需要从A到B再到C依次推理,其实每一步都会有一些假设,但如果某个假设错了,答案也会出问题。
所以我们内部在使用时,会不停地教 ChatGPT 如何思考,跟教小朋友一样,他回答错了就跟他说,你要不再读一遍题目?或者直接问他——那你觉得这个问题应该如何提问?最后你会发现,只要你把你想要的思考方法教给他,他回答的准确率会非常高。
注意,在这个过程里,我们并没有向它提供任何的信息增量,所以我觉得 ChatGPT 已经超越了一个传统意义上的语言统计模型,绝对不是单纯的鹦鹉学舌,但我也不知道它为什么会有这个能力。
陶芳波:我也简单说一下我的看法。我观察到一个现象,在 GPT3 出来之后,特别是今年 ChatGPT 出来之后,很多 AI 领域非常资深的人都在激烈地反对大模型。
我曾经也有这样的心态,觉得这个东西也许就只是一个统计模型,解决不了人类的终极问题。但是现在我认为,这样的思想说严重点,就属于是“旧时代的余孽”,当然这句话是自嘲的,因为我曾经就是旧时代的余孽,但今天我选择去拥抱他。
因为对于人工智能,我们永远都可以从「它在某某事情上做得还不够好」来批评它。但是如果我们回过头来想一下,一个人如果只有大脑,我们的逻辑能力又有多强?
人的所谓逻辑能力,说到底也无非是通过直觉,跳过两三步来推演出一个结果,如果真到了六步七步的推理,我们光靠一个大脑也解决不了,也需要草稿纸和计算器,换句话说,人类也是要通过外部工具来增强逻辑能力的。
从这个角度讲,今天 ChatGPT 所涌现出来的逻辑能力和人是其实差不多的。
但是大家低估了一个东西,如果用发展的眼光再往前推一步,你觉得 OpenAI 下一步会做什么?微软下一步会做什么?一件非常可能的事,是他们会把 ChatGPT 跟各种各样的工具结合起来。
那时,ChatGPT 完全可以把这些工具变成自己的“草稿纸和计算器”,他自己只完成逻辑的部分即可。
所以,我们其实可以把 ChatGPT 当做是一个非常稳定的原始大脑,未来他还将去学习使用工具,那时他所具有的能力会比今天大得多,这将是一个非常有想象力的未来。
费良宏:非常认同陶博士,前几天看到 LeCun 在推特上跟人论战,谈 ChatGPT 对于 AI 的影响,我也有同样的感觉,就是可能很多人对 ChatGPT 的判断太拘泥于以往的经验了,还是把它当做是 GPT3 或者 GPT2。
比如 OpenAI 在发表 ChatGPT 的那篇论文中,专门提到他们使用了人类反馈的强化学习,去弥补堆砌资料造成的一些不足。所以某种程度来讲,ChatGPT 的逻辑不仅仅是来自于文本的训练,还来自于人类给它的主观反馈,我们利用这种奖励机制,让 AI 产生一种内部的自我判断能力。
我觉得这是一种非常巧妙的进步,相当于把强化学习跟大模型结合在了一起。今天可能我们的资源投入还比较有限,让 ChatGPT 不足以解决更广义上的所有问题,但未来如果我们的投入足够大,强化学习的引入程度足够高,机制设计得足够巧妙,会不会结果也将远远超出我们今天的预期?
不过,这也引出了另外一个问题,就是关于 ChatGPT 倾向性的争论。随着人类用越来越多的反馈干预了它的判断,那会不会让 ChatGPT 带有某种思潮,比如说政治倾向,最近我看到国外有一些人对它进行测试,发现它在政治上并不是完全中立的,是一个左翼的自由派环保主义者。
从这个角度出发,我认为 ChatGPT 是具有逻辑的,因为这个逻辑是由人赋予他的,也是人自身所存在的,这是我的看法。
龙波:当一个非常有冲击性的产品出来后,人的观念很容易受到冲击,但这里还是要看一些根本问题是否发生了改变,这个话题涉及到一些更深刻的东西,即我们如何理解统计模型?
比如大家都提到,ChatGPT 反馈模型的提高,这是一定的,因为你给了它更多的统计数据,不论是用 AI 的方法,还是传统方法,模型都会提高,LeCun 也谈到过这个问题,他并不是反对统计模型本身,他只是想说,如果我们要创造真正的通用人工智能,仅仅靠统计模型就够了吗?
统计模型应用在人工智能领域已经几十年了,到深度学习神经网络达到高点,但是我们想一下,人的认知是纯粹基于统计的吗?我们每个人都知道,太阳从东边升起,这是我们每天都看到的,100% 的概率,这是统计学上的认知,但是我们没有停留在这一点,我们最终理解了行星之间的相互作用力,从物理学的角度解释了这个现象。
所以人类认知的本质是什么,我们对此的认知也还不够透彻,我觉得大师们是想说,统计模型之外,还有什么东西让机器能更接于近人?这个问题其实没有答案,他想表达的是一种 open 的心态,即统计模型不能解决一切,它甚至都没解决我们自己认知的问题。
为什么谷歌没能做出 ChatGPT?
险峰:刚才大家都提到了 transformer,它其实是由谷歌发表出来的,但今天做出 ChatGPT 的却是微软系的 OpenAI,各位觉得这背后的原因是什么?
龙波:确实很多人都有这个疑问,但其实到今天我依然认为,谷歌在技术上是非常领先的,ChatGPT 最关键的核心模型起点,无论是 transformer,还是后来的 bert,这些概念都是谷歌首先提出来的。
我们知道微软在算力方面给了 ChatGPT 很大帮助,但谷歌自己的 TPU 研发能力也非常强大,谷歌不缺算力,更不缺数据,但正因为如此,大公司要做出这种创新性很大的产品,注意我是说产品,一般都会被自己的优势束缚住手脚。
首先谷歌是一个搜索引擎巨头,它对此非常自信,这反而让它对其他系统的投入和关注都不够,在我看来,谷歌被 ChatGPT 反超其实是有先兆的。
比如语音助手,坦白说谷歌的产品是不如亚马逊和 Siri 的,像 Google Assistant ,采用的依然是搜索引擎的用户界面,你给它搜索词,它就给你最高质量的回答,强调的还是单次交互,这种观念已经深入产品的设计之中,我觉得在互动体验上谷歌的投入是不足的。
但这并不是说谷歌技术不行,我有不少前同事就在谷歌 research 工作,他们的技术发展得非常好、非常成熟,他们有最好的资源可以从事研究,但是他们认为搜索是他们最重要的产品,他们会下意识的用搜索的观念去做一些新产品,对用户的交互式体验本身就没有那么注重,这是我从产品角度的观察。
费良宏:这个话题让我想到一段商业史故事。世界上第一台数码相机,是一名叫史蒂夫萨森的工程师在 1975 年发明的,他后来被称为"数码相机之父",但是当时,他是一名柯达公司的员工。
后来据他回忆,这是一次前所未有的尝试,“公司内的反之强烈超出了他的想象”,结果 38 年之后,由于数码相机的崛起,传统胶片时代的王者柯达公司破产,我觉得回顾历史,跟今天也有非常相似的地方。
今天整个搜索市场,谷歌占了 96%,微软只有3%,但因为 ChatGPT 的出现,微软很可能也会颠覆搜索领域的格局,而谷歌空有技术却没有做出这个产品,我觉得可见一斑,历史总是惊人的相似。
黄东旭:这是件特别有意思的事情,因为以前扮演这个颠覆者的,其实是 Google 自己。
2000 年的时候,雅虎的地位就和今天的 Google 一样,当时雅虎的搜索引擎走的是人工标注路线,说你看我人工标注的黄页多准确,而 Google 是当时几个大学生搞出来的,结果历史又一次重演。
如果抛开数据量和算力这些硬性限制,只去看里面最核心的代码量,其实就是一个小团队就能写出来的。一家巨头再次被一家小公司打败,我觉得这就是软件行业有意思的地方,一个非常硅谷的故事。
开源圈和云计算巨头是如何看待 ChatGPT 的?
险峰:谷歌的早期模型都是开源的,但 ChatGPT 却选择了闭源,结果在 2 个月内用户破亿,东旭对此怎么看,ChatGPT 的选择对于后来者是否有参考价值?
黄东旭:我觉得 ChatGPT 的成功,并不在于开源或闭源,而是它向整个业界证明了某种技术的可行性,其实开源的工具一直都在,关键是有没有人会拿出几千万美金去做这些东西,对此我是比较乐观的,据我所知已经有一些开源项目在做和 ChatGPT 差不多的事情,未来很短的时间之内,一定会出现一个开源的通用语言大模型。
它可能没有 ChatGPT 那么强,但是也会大致够用,甚至可能是一个通识模型,你可以把它装载到自己的系统里面去,跟它一起去协作,我觉得很快就会有人沿着 ChatGPT 的路线,做出可以私有化部署的开源大模型,可能会是一个大厂或者一个 foundation,每隔半年 change 一次,然后大家下载下来用。
险峰:云计算大厂们怎么看 ChatGPT?
费良宏:AI 的商业化主要是 SaaS 化,之前有很多成功案例了。另外从技术角度来看,AI 的推理能力 API 化也已经是一种标准做法,比如在云上部署一个推理服务器,让前端用户可以非常快速地获得图像语音内容,这两种模式在云计算发展的历史上已经被证明是完全可行的。
接下来的关键就是如何差异化的大模型,我个人认为,我们可能低估计了 ChatGPT 的工程化难度,比如说并行训练、标注以及数据管理的工作量和成本开销,都会是非常巨大的,所以我不认为在短时间内,会有大量能完全媲美 ChatGPT 的竞品出现。
当然,下一步还是有很多人会去做与 ChatGPT 类似的事情,但是我认为时间上可能会比较久,这其中,我个人比较看好谷歌和微软,因为他们之前的积累已经有足够多。
其实刚才也谈到了微软的问题,虽然微软只是给 ChatGPT 投了钱,技术上没有参与,但是从它的布局来看,我觉得微软其实非常有野心,要知道 2019 年微软就开始向 OpenAI 投钱,第一次就投了 10 亿美元,2020 年就跟 OpenAI 谈妥了 GPT3 的独家授权,2021 年微软就专门给 OpenAI 构建了自己的超算能力。
微软提供的这些工程能力和云计算能力,足以确保 OpenAI 继续保持领先优势,如果未来任何一个竞争对手想要超越 OpenAI,在这些资源上都要加倍付出,甚至要在短时间内实现突破才有可能,但是现在,时间反而是最稀缺的,像之前“学徒巴德”(Apprentice Bard)在谷歌的发布会上“翻车”也说明,互联网产品的竞争是非常残酷的,虽然你也能做出来一个差不多的,但只要你不能超越市场中最好的,那就意味着失败。
陶芳波:我接着这个话题稍微说下,因为我们的业务跟大模型接触非常多,首先大模型开源这件事不是刚刚开始,其实去年很多公司已经出来了,包括 OPT(Meta AI 的开源项目)和 BLOOM(法国政府资助的开源 AI),但其实它们和 ChatGPT 的差距非常大。
我觉得 OpenAI 的竞争力,表现在他们对于数据使用方式的认知,还有刚才费老师提到的工程能力和数据体系,这套东西不是说拿出 50 亿美金,招很多的人马上就可以解决的,这是现在很多投资人的误解。
另外,我觉得 AI 的分层其实在今天就已经开始了,像 Sam Altman(OpenAI 首席执行官)自己就说过,OpenAI 现在就是个 Infra,未来在它上面可能会有中间层,这个中间层的作用是帮助一个个大模型 Infra 变成各个行业里的解决方案。
ChatGPT 能让 TMT 投资人“再干 15 年”吗?
险峰:ChatGPT 下一步会往何处去?会不会被下一个 transformer 颠覆?
陶芳波:个人观点,我们可以从底层视角来看,比如今天 OpenAI 做出了 ChatGPT,未来或许还会有 GPT4,我们先假设 OpenAI 的技术是最领先的,现在后面有一堆大厂巨头和创业公司,正在或者将要做大模型,那如果我是 OpenAI,我接下来会做什么?
我觉得第一个方向,还是怎样用好手上的现有数据,把模型的潜力全部挖掘出来。下一代 GPT 的参数量也许还能再大个 10 倍,但估计也就是这个规模了,不可能再扩大 1000 倍,因为参数要有足够的数据来匹配,全世界的优质数据就这么多,参数量搞得再大效果也不有太大提升。
另一个方向,也是 Anthropic 提出的,叫做「宪法 AI」。就是我们能不能让 AI 在一套宪法,或者说一套规则下,实现自我进化,最终变得符合这套规则。举个例子,每个国家都有自己的监管体系,比如中东地区,只有符合当地监管的 AI 才能进入该国,我觉得这会是一个非常好的方向,可以大大降低 AI 吸收信息的成本,提高它的效率。
第三个方向是多模态,让 OpenAI 变成一个思考引擎。我们知道人类的感知不是单一的,而是许多模块组成的,不是说用户说了一段话,我能感受到这段话就够了,最简单的,比如看漫画书,人能够把感知图像和感知文字结合在一起,而不是两个单独的东西。
所以我觉得,接下来大模型会在这些方向上继续发展,这是一个底座,这种状态会维持相当长一段时间,而接下来才是更巨大的挑战,无论是投资人,还是创业者,我们到底应该怎样去迎接 ChatGPT 的革命性变化,在它上面重构一个巨大的新体系?
举个例子,2007 年 iPhone 诞生,10 年之后你会发现整个互联网生态都变了,iPhone 上面长出了各种各样的应用,这 10 年间,全球诞生了多少独角兽,诞生了多少千亿、万亿美金级的公司,这些公司在 iPhone 出现之前都是不存在的,都是从一个很小的作坊开始做起来的。
我觉得今天大量的机会其实是这里面,首先是中间层的机会,就像在大模型外面搭一个脚手架,让它有 1000 只手 1000 只脚,可以做更复杂的事情,比如基于如何使用大模型构建一个社区,这是一种最轻量级的创业思路。再比如教会大模型怎么去使用外部工具,怎么样更好的去理解对面的用户,而不只是从文字输入来理解他——这也是我们正在做的事情。
在中间层上面,还会有各种应用层,刚才费老师也讲到,AI 在 SaaS 端已经被验证了,但我个人认为这一波 AI 浪潮席卷的范围会远大于 SaaS。因为 SaaS 更多还是服务于企业的效率工具,但 ChatGPT 肯定会拓展到C端,比如说健身、医疗,都有机会可以重做出一个交互式的软件,把用户界面完全抛弃掉,和移动互联网时代相比,我认为这会是一种全新体验的产品。
黄东旭:我也有类似的观点,其实软件的进步一直都是交互方式的进步,以前是字符界面,到后来是 UI,沿着这条线往下走,未来最重要的软件交互形态其实就是自然语言。过去我们一直在尝试,让软件的使用变得更加贴近人类自然语言,但是今天我们终于有了这样一个新工具,能重新去塑造我们跟软件的沟通方式。
以前我们用软件,比如说 Linux,输入一堆命令,机器才能去完成一件事情,相当于我们要去学习机器的语言。但现在有了 ChatGPT,你可以直接去跟他说,我想要到达到某某结果,我不管你怎么干,最后能给我结果就好,这其实是一个非常颠覆性的东西,所以我们现在正在做的,不断跟 GPT 磨合的,也是类似的思路。
陶芳波:我记得 ChatGPT 刚出来的时候,就有投资人提出一个观点,说 TMT 可以重新再干 15 年,我觉得这个逻辑是对的,因为上个时代我们基于移动互联网,做出了各种各样的 APP,而今天新的交互形式出现了,每一个细分的赛道上可能都会成长出一个全新的独角兽,或者全新的商业模式,我觉得是一个完全的大洗牌。
今天 ChatGPT 的潜力大概只发挥了百分之几,就已经创造出超过了万亿的市场,未来这个规模可能是几十万亿。
ChatGPT 正在对哪些工作岗位造成影响?
险峰:这个问题是帮别人问的,他是个很早期的 NLP 从业者,想问大模型出来以后,其他的模型可能就成为历史了,他们这些人未来应该怎么办?
龙波:这个问题的答案还是比较清晰的,以前那些传统的 NLP 的手段,在这个时代肯定是不会再有用了,比如大量的语法树之类,非常繁琐,过去开发过程很痛苦,要一支很大的团队才能做出一个很小的东西,我们肯定不会再回到那个年代,老的技术基本都可以用大型语言模型(LLM,large language model)替代。
对于 ChatGPT 的未来,我非常同意陶博士刚才说的,如果只是一味地增加数据或增加参数,不一定还能得到好的 ROI,因为你给了更多的数据,就意味着有更多的噪音,最后信噪比可能反而更差,这也是为什么我们有时觉得 ChatGPT 会回答错的原因,所以还是要关注如何提高数据的质量。
与数据质量同样重要的,可能是跟大模型的互动。举个例子,如果我们真的要让 ChatGPT 变成某个领域的专家,不再犯什么错误,可以想想我们培养一个 PHD 的过程是什么样的?他需要和他的导师、行业大牛反复地交互讨论学习,才能最终成为专家,而不是说简单的筛选高质量数据喂给他就完了。
如果再进一步,我们要让 ChatGPT 成为真正的通用人工智能,在每个领域都很精深,也需要有一个方法能够让 AI 迭代高质量数据,所以我觉得未来在算法层面可能会有一些突破,比如说让 RL 和大语言模型更完美的结合,能够更好地筛选出高质量数据,甚至是自动采集这种数据,这些都会跟人学习的过程越来越像。
到那时,我不知道是不是只靠现在的统计模型或者大型语言模型就够了,还是会跟其他新技术绑定在一起,比如现在也有人在研究,怎么把真正的推理能力和神经网络相结合,这是我看到一些未来可能发生的事情。
险峰:接下来可能是很多 CEO 比较感兴趣的问题,创业公司应该如何使用 ChatGPT ?它将可以替代哪些岗位?
黄东旭:个人认为可以从两个方面来看,对内和对外,我先说对外。
首先在 AI 爆发的大背景下,我们做数据库的还是一个挺安全的生意,因为不管怎么样你还是要存数据。在过去没有 AI 的时候,我要从数据库里提取数据,学过计算机的朋友可能都知道要用到 SQL,或者其他语言,总之是需要敲代码才能去跟数据库做交互。
举个例子,之前我曾经把我自己所有看过的电影、所有看过的书,全都导到了我的数据库里,我就可以直接去问我的数据库说,在我去年看过所有的电影里,哪个导演的片子最多?他会直接帮我生成 SQL,SQL 再去数据库里进行查询,非常快速且准确,但是前提是你必须会敲代码,懂得机器的语言。
沿着我刚才的理论——自然语言会变成下一个软件交互的 UI,大家想象一下,如果你是个 CEO,你公司里面有很多运营数据,每次你去找财务,或者数据分析师,说我需要一个某某数据,他可能过好几天才能返过来,但现在如果有这样的一个很神奇的数据库,CEO 可以直接开口问 AI,比如今年公司花钱最多的部门是哪个,马上就可以得到答案。
那如果再推一步,我们把背后的数据集换成了区块链,换成了房地产信息,换成了股市信息,你会发现一下子人人都是数据分析师,这对于各个行业都会是一个巨大的颠覆。
至于对内部,我觉得 CEO 一定要放弃 ChatGPT 可以完全取代人的观念,现阶段肯定是取代不了,但是它能提高人的效率。
如果大家写过程序就会知道,一个工程师可能有 80% 的时间都是做重复劳动,未来这 80% 的工作其实都可以让 ChatGPT 来做,比如说写文档、写单元测试,生成一些脚手架之类,它不会完全取代程序员,但是确实能带来很大的提升效率。
大家如果看过《钢铁侠1》,里面有一个 AI 助手叫做贾维斯,现在我跟 ChatGPT 的工作模式与它很像,我会告诉它我要做什么东西,你先做一个原型出来,然后一步步跟它交互,告诉它可以这样这样搞。
所以至少目前,我并不会把 ChatGPT 当做是一个可以取代人工的东西,而是给所有的工程师都配了一个账号,告诉他们遇事不决先问一下 ChatGPT,搞不好效率就提升了,这是我大概的经验分享。
陶芳波:我稍微插一句,我觉得东旭他们公司很厉害,已经开始使用 ChatGPT 来提高效率了,其实很多国内的公司都可以学一下。
另外他讲的第一点我感触很深,数据库公司未来一定会存在,但也一定还会很多有提供其他互联网信息服务的公司,我觉得他们可能都要去思考,是不是今天我暂时是安全的,ChatGPT 跟我就没有关系?
我觉得可以换一种视角,现在的现实是,这个超级大脑已经在那里了,他未来一定是会跟各种各样的东西连接在一起,这里面有一个很重要的点,以前我们说信息服务的连接端口是 API,还有一大堆代码之类的,但今天这个端口很可能会变掉,变成一个更加接近于人类语言的东西。
所以我觉得每一个服务提供商,如果觉得你的信息服务很有价值,我觉得都可以尝试去拥抱 ChatGPT,看看怎么跟他建立起对话通道,越早拥抱,就越早可以让 ChatGPT 把你的服务分发到更多的场景、更多的用户。我觉得这件事情谁做得快,谁就可能成为自己赛道里的下一代巨头企业。
ChatGPT 广泛使用后,人类的认知能力会下降吗?
险峰:ChatGPT 出来以后,主流声音认为以后可能就不再需要搜索引擎了,但也有一些悲观者认为,我们将来接触的大部分信息都会由机器生成,里面会有大量的假信息,这将威胁人类的认知和判断能力,如果我们从小就依赖这样的产品,可能会是一个灾难性,对此各位怎么看?
费良宏:这不是一个新问题,其实互联网从诞生之日起,就一直在改变我们使用和消费信息的习惯。
比如,最开始出现的是浏览器,它让网页信息变成了一种规范的、可以被浏览的形式;之后,随着信息总量的不断增长,大量垃圾信息开始影响我们的用户体验,这时出现了雅虎的黄页,它通过人工方式去维护目录,给每个网页设置优先级。
再往后,当信息量继续爆炸,黄页的维护开始跟不上数据的生产速度,人们慢慢意识到,使用搜索可能会比使用黄页更有效率,这时诞生了最早期的搜索引擎,比如 AltaVista 和 Infoseek,但是它们的能力受限于当时的技术,还只能在一个很小的范围内能进行搜索。
后来的故事大家都知道了,1998 年,谷歌的两个合伙人开始创业,他们希望用计算机构建一个更广义的集群,通过大量廉价的硬件设备来满足整个互联网的搜索需求。在当时,大家认为这是不可能实现的,但后来的事实证明,技术的进步远超我们的想象,于是人类进入了关键字搜索时代,开始通过搜索引擎来使用和消费互联网信息。
到了今天,互联网上的信息总量已经是一个天文数字,你的每一次搜索,结果可能有成百上千页,里面存在大量无用或者重复的信息,那我们应该如何应对这样的局面?这时 ChatGPT 出现了,它可以帮助我们去做总结归纳,如果从信息消费的历史来看,这是一个巨大的进步,这点无可否认。
而从历史来看,一旦我们养成了新的信息消费习惯,就没有办法再回到之前的时代,我们不可能用黄页去替代今天的搜索引擎,同样的,未来当我们适应了 ChatGPT,我们也回不到关键字搜索时代。
因此,人类下一阶段的信息使用习惯一定是更高级别的,当然这里还有成本问题,比如像 ChatGPT 的每一次搜索大概需要 1.3 美分,成本还是比较高的,如果再能降低 10 倍的话,我觉得整个搜索市场会被完全颠覆。
从这个角度说,ChatGPT 的历史地位可以等价于浏览器的出现,或者是谷歌搜索引擎的出现,人类每一个信息消费习惯的进步都意味着一个里程碑式。
龙波:非常赞同良宏的观点,ChatGPT 的交互方式让我们获取信息更加高效,它带来的影响是不可逆的,肯定会对搜索引擎,甚至推荐引擎都带来冲击,而且我认为冲击会很大。尽管短时间内会有些技术上的挑战,比如如何把 ChatGPT 融入到搜索引擎中去,但我认为这些都不是问题,很快都会被解决。
那么 ChatGPT 的挑战是什么?第一个挑战是商业化,任何 2C 的技术应用背后一定要有商业支撑。
刚才良宏谈到谷歌的巨大成功,但是其实在 1999 年,布林和拉里佩奇是准备以 100 万美元的价格把谷歌卖掉的,据说最后已经谈到了 75 万,如果当时交易达成,也就没有后面的故事了;到了 2002 年,雅虎打算收购谷歌时,开出的价格是 100 亿美金,等于说 4 年翻了一万倍。
为什么形势会逆转呢?因为商业模式走通了,从 display as 到 search as,搜索广告的收入开始有了巨大的增长,当时所有人都看到了谷歌的商业潜力,所以价值一下就不一样了。也正因为如此,谷歌才能有资源雇最好的员工,创造最好的企业文化。
未来 ChatGPT 也会面临同样的问题,比如现在的搜索引擎是靠点击量来收费,本质上卖的是用户的注意力,而如果 AI 一秒钟就完成了答案交付,那卖广告的模式肯定就不再 work 了,一定还需要寻找新的商业模式来支撑它,当然,我相信最后肯定也会找到。
第二个挑战是人文方面的,刚才问题中也提到了,ChatGPT 会极大影响人的认知模式。
在搜索引擎时代,我们每完成一次信息收集,其实都是完成一次学习的过程。举个例子,比如我们发论文,每篇文章后面一定要有一个 reference(参考文献),你要先把前人做出的研究成果讲清楚,再说你在这个基础上取得什么成果,这是一种知识的传接,如果没有 reference 就不可以被称为学术论文。
谷歌的搜索引擎,也是把它认为最相关、最高质量的链接排在最上面,最后还是需要你自己去做判断,这是人类学习的方法,你一定要有出处,要有 reference,这是我们作为研究者对人类知识积累的一个基本态度。而如果 AI 就只给一个答案,会让信息茧房变得更严重。
传统来说,我们在互联网获取信息有两种基本方式,一个是搜索,一个是推荐。搜索是说用户知道自己想找什么,我就给他什么,推荐是用户不知道自己想要什么,那我就猜你想要什么。而当 ChatGPT 出来以后,因为它每天都会和你有交互,它会猜得更准确,更严重的是,它还会主动创造出一些让你喜欢的答案或信息,你听了会觉得那就是真实的,而且又没有 reference。
到那时,我们要面对的信息茧房会比推荐引擎时代大得多,每个人可能只听到自己想听到的,只理解自己能理解的,我不知道这会对人类产生什么影响,但这个影响一定是世界范围的。
ChatGPT 会导致哪些行业消失?
险峰:在你们看来,ChatGPT 的出现可能会把哪些行业冲垮?哪些公司现在急需转型?
黄东旭:非常主观的个人观点,不一定对。
第一我觉得是一些简单的内容编辑,或者简单的内容生成工作,比如写新闻稿、写一些简单的 summary,或者一些初级分析岗位,未来可能都要想一想,但很遗憾这样的工作其实可能还挺多的。我觉得 ChatGPT 出来以后,肯定对整个社会分工造成很大的改变,但这个改变不会马上出现,会有一定的滞后性,但是这个改变一定是很深远的。
第二是程序员这个行业会被改变,你想象一下,相当于过去大家都是步行赶路,现在突然每人发辆自行车,好处是效率一定会提升,但当有一波人能够熟练使用 ChatGPT 的时候,公司老板就会想,到底还需不需要雇这么多人了?甚至当未来 AI 能够自己写程序时,程序员在里面的位置又是什么?我自己会稍微有点悲观。
陶芳波:其实从我的观点来讲,大公司可能是第一波受到冲击的,都会被迫面对这样一个巨大的变革。
今天早上我跟一个非常知名的 TMT 投资人交流,提到了一个点,就是苹果的壁垒到底有多高?在移动互联网时代,用户只能用一台手机去处理许多复杂的事情,所以需要强大的算力,需要非常好的人机交互,这是苹果真正的壁垒。
但如果 ChatGPT 开始与各种产品结合,产生了一种新的交互形态,是不是最后手机就会变成了一个普通的终端?换言之,如果未来 AI 的软件部分,提供的服务比重越来越高,就意味着硬件价值会越来越低,苹果手机做得再好,以后还会有那么大的价值吗?
当天平的两端发生调整,如果苹果不能及时入场,为自己的开发者生态提供 AI 化的能力,我觉得它其实也是很危险的,再比如说亚马逊,它的内部也一定是 red alert(亮起红色警报),假如一个微软云的客服,跑过去告 AWS 的用户说,你要用 ChatGPT 吗?来,come to Azure,我觉得至少对很多中小企业来说是一个巨大的诱惑。
所以在我的视角里,未来大公司的格局会首先发生变化,就像是微软拿着一把全世界最牛逼的屠龙刀,一刀一刀的斩过去,就看谁的反应够快。
同样冲击也会向下影响到中小公司,比如说订票软件,假设行业有 10 个竞争者,那么谁第一个拥抱 ChatGPT,把自己的数据和大模型进行链接,为客户提供一种交互式模式的订票服务,就像一个私人助理一样,这家公司就能把所有的订单吸过去,其他 9 家可能就会死掉。
这个逻辑在任何行业都会存在,因为人总要订票,总要接受医疗服务,法律服务,各种各样的服务,总要恋爱和社交,所以我在内部分享时常说一句话,当 ChatGPT 出现后,全世界只有两种人,一种叫溺水者,他的头被按在水下,他想要浮起来,奋力的想抓住一些东西让自己活下来,谷歌就是这种感觉。第二种人叫淘金者,他想冲到这波浪潮里面去淘金。
这是今天市场上的两种公司,我觉得可能谁都无法完全置身事外。你适应能力很强,能接受现实,快速拥抱这个趋势,就能抓住下一个时代的机会。
小公司如何抓住 ChatGPT 的逆袭机会?
费良宏: ChatGPT 这一波技术革命来得比较迅猛,我个人是有点担心,主要是两点。一个是从个人层面。我们回顾历史,第一次、第二次工业革命彻底粉碎了手工业者,过去这些人曾处于一个比较优沃的社会位置,靠一门手艺就够确保自己的美好生活,但是机器大生产将他们变成了普通工人。
在手工业者衰落的同时,另一个新群体开始崛起,就是知识工作者,在二战以后,他们成为了贡献和收益都最大的一群人,当然我们也都受益于这个群体。但 ChatGPT 出现之后,无论是程序员,还是知识工作者,都有着被机器取代的可能,这种模式一旦出现,对每个个体的挑战是非常巨大的,我对此会有担忧,尤其应该思考我们未来的价值在哪里?
第二是从企业的角度来看,OpenAI 并不是微软内部孵化的,它到今天也只有 375 个员工,是一个 100% 的创业公司,而且是一个小型创业公司。包括 DeepMind 也是家小公司,截止到今天它的员工数量也才 1000 个人,和谷歌的 19 万员工比起来九牛一毛。为什么微软和谷歌内部无法孵化出这些项目,而要依赖于外部的这些小企业?很重要一点,是大企业在创新上的天生存在弊端和不足,哪怕是最厉害的硅谷科技公司,也无法逃脱这个规律。
我前几天读了一本书,Netflix 的创始人里德·哈斯廷斯所著的《不拘一格》,其中提到一个观点叫「人才密度」——这是创新的前提和基础,只有足够聪明的人聚在在一起共事,才会产生创意的火花,推动伟大的创意变成伟大的产品。而如果是在人才密度相对较小的环境中,哪怕他真的是一个人才,也会被淹没在各种噪声和平庸的见解中。
OpenAI 只有 375 个人,但他的人才密度一定比微软、谷歌更好,这样的小企业才会推动真正的科技进步。所以从创新角度看,我并不认为大企业会对整个市场产生多大的影响,反倒是在资本加持之下,创新小企业才是科技的颠覆力量。
所以我觉得,ChatGPT 给我们开了一个窗口,这个是一个千载难逢的机遇,但它是为创新型小企业准备的,而不是大企业。这点上,我的观点会和大家不太一样,我并不认为大企业能够获得最大的红利。
龙波:谈下我的视角,这次 ChatGPT 带来的冲击和改变,无论是大企业小企业都必须要去适应。在它面前,我甚至认为所有公司都是创业公司,如果大企业不进行二次创业,那么就会失去自己的优势,走下坡路。
总体来说,小企业的机会可能更多在应用层。大企业的话,更要在基础层和中间层开始二次创业,不然的话那么肯定会受到巨大的挑战。
举个例子,很多人现在会关注微软和谷歌的竞争,这是一条明线,但暗线的话,我认为微软下一个对手其实是 AWS,微软完全可以利用 ChatGPT,改变整个 cloud service(云服务)格局,实际上 ChatGPT 非常适合做各种 to B 或者 cloud-based service 一类的工作,比如刚才东旭讲到的数据库例子。
再往前推一步,大家都知道,过去电商平台要搭一套推荐系统,是一件非常复杂的事情,因为你的库里已经录入了过去 10 年的商品,这些商品都是基于关键词搜索系统设计的,如果要改成推荐制,需要招一支非常资深的工程师团队,小公司完全用不起。但是如果将来,这些东西都可以通过 ChatGPT 指令自动化完成,整个 cloud 的格局都会改变,我觉得微软在这方面的机会很大,我更看好这条线。相反,在搜索引擎方面,我觉得除非是谷歌犯下很多致命的错误,不然它还是很有机会能翻身的。
硅谷如何看待 ChatGPT?
险峰:现在国内媒体对于 ChatGPT 讨论的非常热烈,硅谷那边的情况如何?他们主要关注的点是什么?
黄东旭:一样非常火。无论是在推特上,还是我身边的人,ChatGPT 应该近几年最大的 IT 新闻了。
我举个例子,从 ChatGPT 第一个 demo 出来到现在,可能也就是两个多月的时间,但硅谷可能已经有上百家基于类似产品的创业公司出来了,所以我觉得硅谷这边可能动作更快一点,而且大家不只是在讨论,我甚至觉得很快就会有独角兽出现了。
Everything is a wrapper of openAI,现在就是这样的一个市场。
龙波:同样的热度,中美都一样。不同点可能有两个地方,只是我自己观察的,不一定准确。
第一是硅谷这边更多还是在聊未来,聊技术路线的分歧,比如现在的大模型是不是能产生通用 AI?未来还需要融入哪些新技术?国内的话,我觉得反思的人可能会更多一些,比如为什么我们在 AI 领域落后了?下一步要如何追赶?这是我看到的不同,但我觉得两者都非常好,无论是反思还是展望,可能都是我们现在非常需要的。
第二是硅谷对于人文关怀的讨论会多一些,大家更关心 ChatGPT 对社会、对人类有什么样的影响。比如很多人会持有一种悲观的观点,认为它不利于人类社会去中心化发展。
想象一下,有一个万能的 AI,它给你提供了所有答案,人人都依靠它,无条件相信它,它就变成了你的权威,实际上意味着一种中心化对个人思想的控制,而且这种东西往往只有大公司才能做出来,那就意味着大资本对整个社会思想的控制。所以可能大家会更关心如何避免这种情况发生,同时又能让这样的新技术提高我们效率和幸福感。
普通人如何拥抱 ChatGPT ?
险峰:最后一个话题,各位觉得自己或者自己所在的业务部门,面对 ChatGPT 会有哪些思考和行动?
陶芳波:因为我们自己就是 AI 公司,可能参与会比较直接。刚才也提到,国内现在没有办法使用 ChatGPT,目前来看,虽然有一些很不错的团队正在组建,但离跑出来可能还需要一段时间。
我觉得整个 ChatGPT 的生态,会在未来一两年内逐渐形成,所以对中国企业来说,这里面还是有一些全球性机会的,中国的创业者不一定非要窝在家里,等着国内的生态建立起来。
就我们公司而言,第一,是尝试探索未来的中间层在哪里,怎样把 ChatGPT 的能力提升,并用它服务于其他的企业。像东旭刚才讲的,everything is a wrapper of GPT,那么 how can we be the best wrapper?我觉得能做好一个 wrapper 本身就很有价值。
第二就是作为中国企业,我们未来怎么样帮助中国参与到全球的 AI 生态竞争当中?最近有几个大新闻,包括王慧文也在组建中国的 OpenAI 团队,我们也在时刻关注着,毕竟中国是一个世界大国,无论从国家安全考虑或者科技竞争考虑,中国都需要一个这样的东西出来。所以我们也在跟政府、大企业去合作,看看能不能帮到一些忙,或说是能参与到其中的建设。
费良宏:可以预计的是,云计算跟 AI 的结合会越来越紧密,随着 ChatGPT 对整个市场的普及和教育,大家对 AI 的认识达到了一个新的高度。我身边很多非技术的朋友都开始跟我探讨 ChatGPT,这是一个非常好的苗头,未来无论是 AI as services 或者是 Model as services,一定会越来普及,帮助 AI 与人实现更好的交互。
对于一个开发人员来讲,与 ChatGPT 相关的工程化能力未来会是一个非常关键的技能,所以抓紧时间窗口的机会,尽快掌握这个能力,ChatGPT 对每个人来说都是公平的,也是有挑战的,总体来讲还是机会大于挑战。
黄东旭:说一个我最近的思考:在这个时代,我们应该放弃一种观念,就是人比 AI 强,未来不应该是我们去教 AI 做事情,而是让 AI 来教我们做事情,放弃这个执念以后,你才可能打开新世界的大门。
比如之前我教 ChatGPT 写代码,会给他一些例子,告诉他说你不要这么做,你应该这么做,但他学了这些例子后,做出来的东西效果反而更不好了。后来我干脆放开手脚,让 AI 自己去弄,你觉得怎么样好就怎么做,结果反而更好。这件事给我带来一些哲学思考,我会经常提醒自己放下执念。
龙波:我之前主要从事 Computational Ad(计算广告行业),大家都知道,计算广告是支撑起整个互联网最重要的商业模式,前面我也谈到过,ChatGPT 的挤占了传统广告的注意力空间,对这个行业带来巨大的冲击,这是挑战的一面。
反过来,用户之所以讨厌广告,是因为这些广告的体验不好,用户觉得为什么你要让我看到这些,我不喜欢。但如果,未来 AI 会变成你最贴心的的管家,变成钢铁侠的贾维斯,那时广告可能会达到它的最高境界,即完全不损坏用户体验,我给你的就是你最需要的东西,也许 ChatGPT 真能做到这一点,这会是一个巨大的机遇,这是我的一些思考。
险峰:谢谢几位,下面是几位观众的留言提问,有人问现在考大学的话,CS 专业以后还有前途吗?各位怎么看?
费良宏:如果一年之前,我肯定会鼓励他学习计算机专业,但是今年答案可能就没那么简单了,比如经济环境改变的裁员问题,包括 ChatGPT 带来的冲击。
但冲击其实无处不在,我记得是去年 Alpha Fold 刚出来的时候,对大家冲击其实不亚于这一次,我们用一个简单的语言模型就能预测出 2 万多种生物蛋白,而且准确率非常高,整个分子生物学的格局都被改变了,背后也是千千万万的从业者受到影响。
所以我是在这么看的,我们不一定要以薪酬高低来选择自己的行业,而应该看按照自己的特长。简单来说,如果你是基于薪水多才选择了做程序员,在大变革面前你很难坚持下来。但反过来,如果这是兴趣专长或爱好,能够长期坚持,我相信在这个世界当中的机会无处不在。
回到最初这个问题上,我不建议大家简单的把专业定位在计算机或非计算机上,而是更大程度上选择你擅长和喜欢的领域,接下来 AI 会和各行各业发生连接,如果你有能力把自己的专业与 AI 相结合,可能会是一个更有价值的选择。
OpenAI 的组织设计给创业者带来哪些启示?
险峰:有观众问,未来各巨头都会有自己的大模型,所有大模型之间会不会趋同?以后差异化会在哪里?
陶芳波:这个是一个很预测性的问题,可能我也不能完全回答,但我觉得 ChatGPT 本身需要调教,这个调教的过程里就包含了很多你对于业务的理解,最终的形态肯定也会很不一样。这件事我一个人的大脑肯定是不够用的,现在全世界无数的人都在想大模型的下一个形态是什么?我觉得可以多关注一些行业动态,我相信一定有人已经在做类似的事情。
险峰:有观众问到,OpenAI 团队和组织框架设计上的一些独特之处,是否对他们的成功产生了影响?
龙波:我可能刚才提到过一点,对于创新型企业,坚持是其中一个非常重要的品质。做出 ChatGPT 要调用大量的资源,对一家小企业来说其实是很困难的,另外站在当时看,技术路径也远不如现在清晰,所以他们选择了一个非常独特的非盈利组织架构,就是不想被短期商业利益所胁迫,这让创始团队在早期就打下了一个比较深厚的技术烙印。
所以你看这次王慧文老师出来创业,也是要做一家关注技术创新,而不是短时间内商业变现的企业,我想这可能是 OpenAI 对我们的启发,要坚持长期主义,更加集中注意力,真正做出一些有深度的东西。
陶芳波:非常同意龙波总说的,可能我俩都属于 AI 科班出身,会非常有共鸣。我觉得 OpenAI 的成功,跟团队成员都有着非常强烈的技术信仰有关,他们相信这件事情一定能成,在 5 年前刚开始做 GPT1 的时候,他们就坚信,只要把自回归的大语言模型做到极致,就一定能可以做出 AGI,所以才能一直坚持下来。
其实在 GPT3 出来之前,根本没人在乎他们,大家都觉得,这些东西我们也能做,但 GPT3 出来之后,那些大厂才开始追随他们去跟进,但此时他们已经继续再往前推了。所以我想说,坚持当然不一定能成功的,99% 的坚持最后可能也都是失败的,但如果不坚持,至少就不会像他们那么成功。凡是取得巨大成功的人,一定是坚持下来的人,人有时候是要对抗全世界的,我觉得这种感觉真的会特别好。