文数字力场,作者佘宗明
ChatGPT 太火了,火到新晋“叔圈”顶流张颂文都得在热搜上避让三分。
要完整理解 ChatGPT 的内核,原本需要了解很多技术名词,包括但不限于——
生成式 AI、NLP(自然语言处理)、LLM(大型语言模型) 、ILQL(隐式语言Q学习)、RM(奖励模型)、RL(强化学习)、RLHF(基于人类反馈对语言模型进行强化学习的技术 )、PMP(偏好模型预训练) 、PPO(近端策略优化)……
可在讨论被引向“文能写文章、武能改 Bug”“将端掉无数人的饭碗”后,ChatGPT 的评论门槛已被无限拉低。
在眼下,几乎没有什么话题是不能蹭上 ChatGPT 的,如果有,那就换个角度蹭蹭,实在不行硬蹭也能蹭着。
以至于,不找个陡峭的角度,都没法从 ChatGPT 凿出的巨型流量池里分一杯羹。
但这个世界上的太多事物,都是兴勃亡忽,来得快去得也快。
那,再过半年,还会有人像现在这样热议 ChatGPT 吗?
这说的,不是 ChatGPT 的话题半衰期问题,而是 ChatGPT 的生命周期问题。
ChatGPT 留给人们的问题,远不止于此。
“鲲之大,一锅炖不下”,ChatGPT 之热,“六问”能稍解。
一问:ChatGPT 是诺基亚,还是 iPhone?
诺基亚和 iPhone,分别是功能机与智能机品牌的王者,代表的也是两个时代——一个是工业化时代,一个是智能化时代。
虽然已“不做大哥好多年”,但诺基亚当年挟信号接收能力好、超长待机之利,称霸手机市场,作为一代人心中“永远的机皇”的诺基亚 N95,那时候更被视作高度集成化移动终端。
值得注意的是,早在 21 世纪第一个十年,诺基亚就曾想给手机加载上网功能,但它仍未跳出做功能手机的思维窠臼,最终在功能机时代领跑 14 年后,在智能机时代被迫插草卖身。
如果说,诺基亚是“手机+互联网”,那 iPhone 无疑是“互联网+手机”,顺着第一性思维,乔布斯将手机看成可移动超级终端,最终用 iPhone 重新定义了手机。凭着 iOS 系统+硬件产品+软件生态一体化的优势,iPhone 成功掀起了移动互联网革命。
问题来了:眼下正火的 ChatGPT,究竟是诺基亚,还是 iPhone?
目前不少科技圈大佬都将 ChatGPT 视作跨时代性产品:
马斯克曾表示,ChatGPT 好得吓人,我们离强大到危险的人工智能不远了;
微软现任 CEO 纳德拉认为,这是自己从没见过的技术扩散,“这就完全等于工业革命”;
Gmail 创始人保罗·T·布赫海特断言,像 ChatGPT 这样的人工智能聊天机器人将像搜索引擎杀死黄页一样摧毁谷歌,“谷歌可能只需要一两年时间就会被彻底颠覆”;
京东技术副总裁何晓冬直接将 ChatGPT 跟 iPhone 相提并论:ChatGPT 是第一款真正意义上的 AI 原生的产品,就像第一款 iPhone,一面市就展现出高完整度、高体验性和高平台性。
▲马斯克此前曾发推盛赞 ChatGPT。
毋庸置疑,ChatGPT 代表了 AI 技术应用的新高度,就像自动驾驶技术从 L2 跃升到了 L3+ 那样——这是个里程碑式节点:以往是以人为主、机器为辅,现在是机器为主、以人为辅。
只不过,ChatGPT 可能既不是诺基亚,也不是 iPhone。说 ChatGPT 不是诺基亚,是因为它跟以往的 AI 产品都有别;说 ChatGPT 不是 iPhone,只因 iPhone 是范式革命, ChatGPT 是核聚变。
iPhone 是认知升维的结果,ChatGPT 则是 AI 技术从量变到质变的产物:跟造手机不一样,AI 产品信奉的是“大力出奇迹”——超强的算力+超多的数据,带来规模效应与网络效应,最终击穿阈值。
袁进辉博士将 ChatGPT 的出比作“登月”,不无道理:登月不是突然就能登上的,而是发射很多次火箭后的大突破,它离不开技术的日积月累。
ChatGPT 的魔法,就是交互体验的高流畅度加文本生成高完整度达到阈值后的创造物。
二问:内容从智力密集型变成技术+资本密集型产业?
这些天,很多人调侃,有了 ChatGPT 后,胡锡进要慌了——ChatGPT 用胡锡进体写出的文章也很“胡锡进”。
这链接的命题是:作为超级内容生成器的 ChatGPT,将掀起内容生产领域的历史性变革。
内容行业的上次变革,是字节跳动挟算法之力撬动的,它的改变主要在于内容推荐分发方面,机器由此取代人工成为重要的推送决策者。
ChatGPT 带来的变革,则主要在于内容生产维度,也就是 AI“写手化”。
说起来,ChatGPT 是 AIGC(人工智能生产内容)领域的典型应用与顶尖模型,而 AIGC 就被视作新一轮内容生产方式的变革。
在有些人看来,PGC(专业生产内容)、UGC(用户生产内容)对应的分别是 Web1.0、Web2.0 时代的内容生产方式,AIGC 则是 Web3.0 时代的主流。
去年 7 月,百度 CEO 李彦宏就曾表示:AIGC 或许将颠覆现有内容生产模式,实现以十分之一的成本、以百倍千倍的生产速度,去生成 AI 原创内容。
▲AIGC 作画产品文心一格。
都知道,当下各个内容平台的内容源头供给,仍有赖于媒体与文字工作者。整体上,内容生产依旧是个智力(也是苦力)密集型产业。
到了将来,ChatGPT 会不会成为“非灵魂写作”的杀手?其实不用问都知道,答案是肯定的。
可以预见,在不久的将来,内容平台会用类 ChatGPT 工具生成大量文字、图片、视频内容,去降低原创内容采买成本——考虑到内容安全红线问题,AI 替代人工的进度条会被减缓。
被称作美国“今日头条”的内容平台 Buzzfeed,就宣称计划使用 OpenAI 的 AI 技术来协助创作个性化内容。
到那时,内容从智力密集型产业变成技术+资本密集型产业,只会是必然。
今天很多公众号流水线式、产品化的写作,到时 AI 都能干。读者想要多少个爆点、想看怎样的爽文,AI 都能奉上。
对内容行业而言,是时候做好最坏的打算了,最起码,得降低自身生成内容的可替代性——尽管 AIGC 不具备特别的创作者人格魅力,但能取代那些平庸的公式化内容。
在“今日头条改变内容消费,ChatGPT 改变内容生产”的背景下,内容行业必将受到一次强震。
三问:ChatGPT 会从知识搬运工变成垃圾内容集散地吗?
ChatGPT 本身不生成知识,而是知识的搬运工——它靠着自学习能力,对海量知识进行了智慧化重组;并依据海量的语料数据库和人对话、互动,去完成撰写文本生成任务。
鉴于知识扩散和积累是知识再创造的前提,这对知识图谱丰富有着积极价值。
但现实问题也随之而来:ChatGPT 会从知识搬运工,变成垃圾内容集散地吗?
科普作家张田勘就指出,就语法(规则)、逻辑和事实三个方面而言,集合了“语言识别-修正和文本分类-文本生成”能力的 ChatGPT,很少在语法上犯错,其答案经常很顺,但在逻辑和事实上经常犯错。
就算正在研发中的 GPT 4 没准能减少这类问题,在此过程中,仍会有大量似是而非、经不起二次校正的不可信内容出现。
即便能杜绝,ChatGPT 批量制造的大量无营养内容,也会削减整个内容池的质地。
正如藻类大量繁殖会让池塘里的生命窒息那样,AIGC 量产的垃圾内容也可以“杀死”内容平台的公信力。
而在当今社会,人们缺的也不是信息密度,而是信息精度——人类社会过去几百万年,都在解决信息匮乏问题,但过去几十年,要着力解决的慢慢变成了信息过剩问题。
在信息过剩的情况下,“弱水三千,只取一瓢饮”会是常见的信息获取需求,“信息的海水再多,也难止渴”则是普遍的信息获取困境。
ChatGPT 恐怕会加剧这样的困境。它会不会生产出更多民粹、极端的内容来,也挺值得观察。
更何况,ChatGPT 被有些人诟病侵犯知识产权——美国语言学家乔姆斯基就认为,ChatGPT 是个高科技剽窃系统,从海量数据中发现规律,并依照规则将数据串连在一起,形成像人写的文章和内容。它获取的很多数据,本质上是未经授权剽窃而来。
这样一来,ChatGPT 就跟这几天出现的一堆山寨 ChatGPT 那样,甩不掉一口“侵权”的锅了。
四问:ChatGPT 会不会成为“无用阶级”制造器?
《奇葩说》议长马东说过:内容的本质是解决人的焦虑。
可 ChatGPT 却让很多人更焦虑了——因为它解决的似乎是“人”。
准确来说,它让不少人变得不重要了。
这让人想起赫拉利在《人类简史》中的预言:AI 将让 99% 的人沦为“无用阶级”。
赫拉利说:“我使用了 useless 这个单词,以凸显我们讨论的是从经济和政治体系角度看起来的无用,而不是从道德角度的无用。”
格隆汇也梳理过,三次工业革命——从机械化到电气化再到自动化,除了第二次(电气化)是以“赋能”为主,其他的都是“替代”为主。
而大部分 AI 技术,都是“劳动替代型”,也就是替代掉一堆人的工作。
你很难说,替代就替代了,时代总会惩罚那些不学习的人。在当今舆论场,“社达”的下一步是社死。
《流浪地球》台词不是说了吗——没有人的文明,毫无意义。
得看到,所有的技术进步,都酝酿着反技术进步的诱因。
因而,在新事物替代旧事物的过程中,总会出现激烈的利益博弈,这会诱发反技术的“新勒德主义”盛行。卢德运动,就是典型例子。
而能否减缓新技术带来的就业冲击与现实摩擦,往往决定了技术能否顺利落地。
▲ChatGPT 自己对是否会替代人们工作的回答。
ChatGPT 如今已带来广泛的“失业焦虑”,那它怎么解决这问题?
中国互联网大厂用教训换来的经验,指了个方向:科技向善。
至于怎么向善法,得 ChatGPT 平台方去参透了。
着眼长远,可以肯定的是,当 AI“成精”——也就是越来越像人,人的处境也必然发生剧变。
五问:ChatGPT 会变成下个阿尔法狗吗?
很显然,ChatGPT 的横空出世,已成 AI 发展史上继 2016 年阿尔法狗(Alpha Go)之后的重要里程碑事件。
可,阿尔法狗之前一鸣惊人后,“不羞答答的它”就在静悄悄地开了。
这是 AI 技术发展至今的缩影。
有人概括,AI 在过去很长时间里,都在以5-10 年为周期经历着波动:先是出现某个现象级的产品,让人们惊呼“人工智能的春天”来了,密集的炒作纷至沓来;之后热度散去,寒冬又会笼罩到整个行业,直到下一个现象级产品的出现。
迄今为止,谷歌都没能打开阿尔法狗最高效的商业化路径,反倒在微软系的 ChatGPT 出来后成了“最大输家”。
ChatGPT 确实很牛,但烧钱能力惊人。
东吴证券研报分析,GPT、GPT-2 和 GPT-3 的参数量从 1.17 亿增加到 1750 亿,预训练数据量从 5GB 增加到 45TB,其中 GPT-3 训练单次的成本就高达 460 万美元。当前开放的 ChatGPT 版本是 GPT-3.5,成本更高。
有消息称,OpenAI 为了做出 ChatGPT,每年大概投入超 25 亿美元。
有些人只看到算法的牛,却看不到算力成本的高——目前用一次 ChatGPT 问答,综合成本就高达 0.8 美元。
小冰公司 CEO 李笛此前预算,“如果小冰用 ChatGPT 的方式来运行系统,现在小冰每天承载的交互量就需要花近 3 亿人民币的对话成本,即使 ChatGPT 可以把成本优化到现在的 10%,也赚不回来。”
2 月 1 日,OpenAI 官方发文称,将推出 ChatGPT 的试点订阅计划 ChatGPT Plus,定价每月 20 美元。
它接下来要怎么找到赚钱场景、填补烧钱窟窿?
这不啻为是 AI 商业化能力的“正名之战”。
六问:中国版 ChatGPT 靠谁来扛旗?
自从 ChatGPT 走红后,中国科技巨头们也没做“局外人”:
百度:2 月 7 日,官宣了类似于 ChatGPT 的项目“文心一言”,称“ChatGPT 相关技术,百度都有。在人工智能四层架构——芯片、深度学习框架、大模型以及最上层的搜索等应用中,百度有全栈布局”,将在今年 3 月展开内部测试。
阿里巴巴:阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段,从曝光截图来看,可能将 AI 大模型技术与钉钉生产力工具深度结合。
京东:京东云旗下言犀人工智能平台已聚焦文本、声音、对话和数字人生成等四方面开展工作,将借助 ChatGPT 等相关技术成果加速我国人工智能领域的应用落地。
腾讯:2 月 3 日,申请的“人机对话方法、装置、设备及计算机可读存储介质”专利获授权,与 ChatGPT 原理相似。
三六零:公司前期在 AIGC 技术上有相关投入,但所形成的全部成果均仅作为公司内部自用的生产力工具使用,尚未进行商业化,公司的类 ChatGPT 技术的各项指标,与 ChatGPT 相比尚有代差。
(字节跳动也被曝出人工智能实验室(AI Lab)正在开展类似 ChatGPT 和 AIGC 的相关研发,未来或为 PICO 提供技术支持,但已辟谣。)
▲阿里被曝正内测阿里版 ChatGPT。
在以 ChatGPT 为代表的 AI 竞争中,科技巨头们掀起的军备战迹象已隐约可见。
因为它们都想抓住下一个时代。
而就云计算能力积累与数字化基础设施完备度而言,未来最有希望在 AIGC 应用市场上领跑的,也依旧是坐拥技术与市场之利的美国和中国。
但这注定是个长跑项目,虽说先行优势也很关键。
做“ChatGPT”不是做 PPT。光是那些多模态大数据积累和强化学习能力强化,就需要不低的投入和不短的时间。
要知道,就在这两天,谷歌为了应对 ChatGPT 而快速推出的 AI 聊天机器人 Bard,就受演示视频中出现答题答错了的影响,股价一度跌去近 10% 市值,损失高达 1200 亿美元。
国内大厂们,又做好充分准备了吗?
对于这些问题,庞麦郎在《我的滑板鞋》中唱的那句词,或许挺适合作答:
时间,会给我们答案。