2024过半,AI卷到哪儿了?

  定焦(dingjiaoone)原创

  作者黎明

  编辑魏佳

  AI 创业者陈冉,发现行业里有一些“怪现象”。

  很多客户向他反馈,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪个好用;同时,自己也不知道大模型怎么跟业务结合;另外,自己的数据集究竟能不能精调出一个好用的大模型,心里也没谱。

  最后的结果就是,愿意投入大模型,但不知如何下手,即便下定决心了,也抠抠搜搜拿不出太多预算来。

  这进而导致,大模型公司开始卷价格,打起了价格战。“拼到最后就是,又烧钱、价格还低、还没人用的状态。”

  陈冉是人工智能社区和生态公司开放传神(OpenCSG)的创始人、CEO,他认为大模型行业的无效内卷是一种消耗。去年一哄而上做大模型的公司们,最终没能避免掉进当年 ofo 们踩过的陷阱。

  这逼得行业大佬、零一万物创始人李开复放话,“如果中国市场就是这么卷,大家宁可赔光、通输也不让你赢,那我们就走外国市场”。

  做了多年技术开发,很早就开始 AI 创业的李友峰,同样对今天的现象感到不解。“以前我们讨论一个项目,会关注它有什么价值,但到了 AI 大模型,大家很少讨论价值,都在讨论领先。”

  铺天盖地的榜单,五花八门的排名,自吹自擂的营销,让这个行业显得浮躁喧嚣。厂商们最后花了很多钱,产品落地不了,技术实际上也没有太领先。

  5 月下旬,清华系大模型公司衔远科技被曝换帅,创始人周伯文将离开公司。消息传出后,有创业者称:聚焦算法,或许是一条弯路。

  大模型创业,在中国是一条窄路,对某些团队也许是不归路。

  如今,2024 年过半,“百模大战”也过去一年多了,行业发展到哪了?接下来又会往哪卷?

  卷技术:考高分的太多,能干活的太少

  国内大模型行业,今年明显比去年“安静”。去年是“阿猫阿狗”都来参与,几百个大模型面世,今年除了几个科技大厂和头部的创业公司,其他大部分都消停了。

  因为大家发现,吆喝再大声,落不了地都是白搭。

  国内的大模型不是太少,而是太多,尤其是吹牛的多。

  “厂商总是宣传大模型能干啥,却不说不能干啥,客户就有点被误导,以为大模型什么都能干,想着把原来的业务颠覆重做一遍,这不现实。”陈冉对「定焦」说。

  回看过去一年大模型行业的发展,我们会发现,最先打起来的不是价格战,甚至也不是技术战,而是营销战。

  营销是为了抢声量。开发布会、刷榜、投广告甚至碰瓷对手,能吸引更多关注,让大家“觉得”自己领先。至于好不好用,真实的技术实力如何,可以后期再补课。

  李友峰告诉「定焦」,现在国内所有的所谓自研大模型,基本都是基于开源架构改的,没有真正意义上的原创和全自研。这意味着,大模型公司之间的技术差距并不大。

  这也是为什么一家创业公司,能在两三个月内从零到一推出一款全新大模型。最好的例证是,去年李开复的零一万物发布“Yi”系列模型,被指使用了 LLaMA 的架构,只对两个张量进行了重命名。

  陈冉认为,国内大模型还没有形成完整的创业生态,大家一蜂窝冲上来,发布几个模型证明不了什么。他以智能汽车行业早期做类比:大家都想造车,做轮胎的、造发动机的、甚至做雨刷的,都想亲自下场,但最基本的电池、电控甚至轮子座椅都还没准备好。

  单纯从技术层面,时至今日,国内没有哪个团队处于绝对领先位置。

  AI 大模型有三大要素:算法、数据、算力,国内厂商们过去一直在啃算法,大家发布模型,本质上是发布一套算法和系统。大家比拼谁的算法更先进,谁的模型参数更大,推理效率更高。但现在越来越多从业者发现,算法其实没有壁垒。陈冉更是直言“大模型不值钱”。

  “我认为企业级的大模型没意义,开源企业级就行了,因为最重要的是数据。”他说。

  数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代,算力可以通过砸钱买卡获得,但优质的数据没有渠道售卖,花钱不一定能买来。

  训练模型跟训练学生类似,数据相当于教材或教育资源,过程就叫预训练。偏远山区的孩子和一线城市的孩子,从小获得的教育资源不同,训练过程不同,最后高考考上重点大学的概率也必然不同。某种意义上,拥有优质数据,预训练就成功了一半。

  过去一年,行业里评估一个大模型好坏的标准,是通过测评,相当于考试。既然是考试,就有作弊的空间,或者可以通过刷题得高分。这就导致,很多大模型其实是“应试教育”的产物——参数大、得分高、性能强,但没啥实践能力。

  李友峰认为,算法有很大局限性,如果脱离具体的应用场景,算法没有意义。“比如模型的参数大,计算能力很强,做数学题也许表现很好,但这并不意味着它能在实际业务里产生价值。”

  今年以来,大模型拼参数的风气有所改观,各种杂七杂八的“野榜”也有所收敛,说明公众不好糊弄了。问题是,如果不比参数,大家还能比啥?

  卷价格:C端不敢收,B端收不起

  一个模型或一个项目要证明自己有价值,最直接的方法是从市场上赚到钱。今年以来,越来越多 AI 创业者和投资人,开始将商业模式挂在嘴边。

  大模型行业的商业化有两大类——To C 和 To B,即向个人用户收费,和向企业(包括政府、开发者)收费。去年行业达成共识,To C 收费很难,先从B端入手。

  B 端企业是大模型的最大客户。一家做系统集成公司的员工曾对「定焦」说,他们很早就接入了百度的千帆大模型平台,拥抱大模型的意愿很强,不过他们不是因为模型效果好而使用,仅仅是怕被 AI 落下。而一旦模型收费,他们就得再考虑考虑了。

  这代表了很多企业的心态:能白嫖就白嫖,付费就必须得看到效果。用陈冉的话说:“让客户花钱,就得让他看到成倍的增效,不见兔子不撒鹰。”

  李友峰认为,真正用大模型的企业,都关注业务数据而不是算法指标。“比如转化率、点击率和其他关键指标,分别提升了几个百分点,如果不能做到这些,即便算法有 1 万亿参数,价格低至 1 毛钱,客户也不会买单。”

  5 月的这一波价格战,大模型 API 的调用价格直降超过 90%。以字节跳动、阿里、百度为例,每百万 token 推理输入量的价格,降到了 8 毛、5 毛和免费。

  然而这更多被市场解读为营销行为,有点清仓大甩卖的意味。

  Lepton AI 创始人、阿里原副总裁贾扬清说:“今天不是说 API 贵才没有人用,而是因为,企业首先得搞清楚到底怎么用起来产生业务价值,否则的话,再便宜也是浪费。”

  出门问问创始人李志飞更是直言:“将 API 价格降到无限逼近零,说明 OpenAI 对消费者收费和对企业收费的两种商业模式在中国竞争环境下都不可持续。”

  百度是C端B端两手抓,其中面向C端的文心一言 4.0 是付费版,连续包月 49.9 元,百度一直没有公布文心一言的付费率数据。据 AI 产品榜的数据,后起之秀月之暗面的 Kimi,网页版的访问量在 4 月超过了文心一言。Kimi 没有选择用收会员费的形式“自废武功”,而是非常另类地推出了打赏功能,非强制,在高峰期算力不足时可获得优先使用的权益。

  这还是C端大模型的头部选手,由此可见收费之难。归根到底,当前的大模型产品还不够好用,不是那么刚需,需要给人们一个付费的理由。

  AI 初创公司语核拿到了奇绩创坛的投资,它一开始的产品都是面向C端,解决各种实用需求。创始人池光耀告诉「定焦」,其中一款主力产品 CopyAsk,既能免费使用,也可以付费解锁更多功能,但超过 99% 的用户在白嫖免费额度,收上来的钱很难养活公司。

  今年初,语核进行转型,开始做面向B端的 Agent 产品,目前已经拿下两个订单,“客户付费意愿还不错,现在有钱赚了蛮好。”不过,要彻底跑通某个垂类的B端业务,还需要一段时间探索。

  有极少部分公司,抓住了市场需求,并打通了业务场景,率先赚到钱。

  陈冉想做生态,他的 OpenCSG 线上做社区,线下卖软件 CSGHub 和 Starship,客户以B端企业和D端开发者为主,已探索出应用分佣和用户订阅两个变现模式,未来还可以增加算力分佣模式。他告诉「定焦」,公司今年预期营收几千万,盈利大几百万。

  卷应用:爆款应用未出现,产品和工程落地难

  大模型发展到今天,从业者一方面想办法赚钱,同时也在等待爆款应用出现。之前我们见证了妙鸭相机、Kimi、Suno 等应用的走红,但这都还称不上爆款。而只有出现爆款,才能说明 AI 不是纸上谈兵。

  大模型厂商打响 API 价格战之时,有人不以为然,有人嗤之以鼻,也有人格外兴奋。

  作为一个独立应用开发者,池光耀认为API 降价是巨大利好。API 降价之前,他每个月要花 200 元左右的预算在模型调试上,现在他调用降价之后的深度求索 DeepSeek-V2 模型,半个多月只花了 1.11 元。

  他去年开发了好几款应用,受限于高频调用带来的高额推理成本,而用户又不愿意付费,导致至今产品没有推出去。现在他迫不及待想让这些应用“跑”起来,“要不是现在手上有B端的单子推不掉,我就直接去做C端产品了。”同时,那些以前因为负担不起 API 调用费而做不了的B端订单,现在也可以做了。

  他认为,接下来几个月,会有海量关于大模型的应用场景的探索,很可能会带来应用场景的大幅增加。一些过去需要依靠人工或工程化的手段判断的高频的、低逻辑需求的,且延时不敏感的应用场景,或许可被免费的大模型 API 取代掉。

  大模型落地,一定是从场景开始突破。无论大模型 API 是否降价,找场景都会成为下半年的共识。

  李友峰认为,下半年出圈的应用会越来越多,找到合适的场景,在规模产出的基础上覆盖规模的成本。“大家应该拼命去找价值,而不是卷价格。”

  目前的 AI 应用中,有两类已经显现出了价值,并获得了不错的反馈。

  一类是提效,Kimi 帮助职场打工人搜索资料、整理文献;造物云给品牌用 AI 做产品设计和营销物料,创始人邱懿武告诉「定焦」,他们用 AI 给某咖啡品牌做了 2000 个杯子的设计方案,不算模型投入,算力成本只要 10 块钱。

  另一类是娱乐,比如 Suno 这种 AI 写歌软件,以及很多创业公司在做的 AI 陪伴、角色扮演。

  目前行业里普遍认为,Agent AI 是下半年行业的重点,国内外从业者都在往这方面卷。

  随着对产业的探索加深,李友峰发现,AI 真正难的是产品和工程(指构建、开发和部署大型机器学习模型的一系列技术和实践)。“不断让大模型走向产品、工程、商业、产业,是中国创业公司成长的唯一路径。”

  一旦工程问题解决了,模型反而不重要了,用户在使用产品的过程中,不关心底层用的是哪个模型,自研占多大比重,效果好比说啥都强。

  现在的情况是,大模型在具体应用时,还不能百分之百保证效果。以大语言模型为例,“胡说八道”的毛病一直没有克服。“这种不可控的状态,很难让它在生产中发挥很大作用,还需要时间打磨。对于大部分B端客户,如何跟上社区和大模型生态发展和进化才是应该关注的。“ 陈冉说。

  他认为,之前行业对大模型过于乐观,总有“训练一个大模型改变世界”这种不切实际的幻想,事实上大模型还没有真正形成生产力。在 AI 1.0 到 AI 2.0 之间,还有一个过渡的过程。“就是如何通过 AI 先赋能已有体系,而不是全盘否认。”

  在向上爬的过程里,必然有一些公司会摔下去被淘汰,尤其是那些还不具备造血能力的公司。斯坦福大学以人为本人工智能研究院在一份报告中称,2023 年全球对人工智能的投资连续第二年下降。

  在国内,以阿里、百度为代表的科技大厂还在持续投资,比如阿里就耗资 8 亿美金,投资了 Kimi 的母公司月之暗面,占股 36%,市场传闻腾讯也在洽谈跟进。

  然而,对于推动原始创新和产品落地,这些大厂究竟发挥了多大作用、扮演着什么角色,我们越来越难以评估。大厂一方面自己做大模型,同时又投资了市面上几乎所有的明星创业公司,用股权把对手绑定。甚至这一波被开发者称赞的 API 降价,也不是由大厂发起,而是一个叫幻方量化的私募巨头,以及创业公司智谱 AI 带头,随后的大厂跟进,充满了被动和营销的味道。

  下半年,行业依然会很卷,毕竟国内大模型从一开始就是竞争驱动的。也许,我们能卷出来几个赢家,爆款应用也不远了。

  *题图及文中配图来源于 Unsplash。应受访者要求,李友峰为化名。