文科技新知,作者丨王思原,编辑丨赛柯
前不久,来自沙特的一笔“热钱”涌入一家国产大模型企业,成为万众瞩目的焦点。
市场消息显示,国内人工智能初创公司智谱 AI 在今年 6 月初完成新一轮融资,投资方为中东石油巨头沙特阿美(Aramco)旗下风险投资部门管理的基金 Prosperity7,融资金额达 4 亿美元。
此轮融资后,智谱 AI 估值将达到约 30 亿美元,跻身 200 亿俱乐部,也成为第一个获得国外基金机构融资的国内 AI 独角兽。
智谱 AI 能够成为投资界的焦点,与其清华系背景,以及独有的自研技术路径脱不开关系,但资本的簇拥,并没能让智谱 AI 脱离大模型行业普遍的焦虑。
智谱 AI 相关高层多次强调,对标 Open AI“是(公司)成立以来的目标”,而为了完成目标,或者说为了努力留在牌桌上,激进的商业化拓展便成了智谱 AI 近两年打造的新筹码。
然而随着大模型技术的快速演进,以及市场商业逻辑的不断变化,智谱 AI 也迎来一些值得思考的问题:智谱 AI 的优势究竟是什么?离 OpenAI 还有多远?商业化上如何解题?未来的想象空间又有多大?
与 OpenAI 试比肩?
早在 2020 年,智谱 AI 便开进行 GLM 预训练架构的研发,并训练了 100 亿参数模型 GLM-10B;2022 年合作研发了 1300 亿级超大规模预训练通用模型 GLM-130B;2023 年,智谱 AI 推出千亿开源基座对话模型 GLM 系列,并在 2024 年 1 月推出 GLM-4。
入局时间和迭代节奏几乎跟 ChatGPT 一致,也因此拿到众多投资,并被看作国产 OpenAI 的先驱。
这次中东的大额投资,《金融时报》给出的标题非常直白:沙特基金投资中国,意在打造 OpenAI 的竞争对手。
分析人士也指出,这笔投资一方面给智谱 AI 带来了资金支持,有利于发掘市场机遇,拓展后续可能的国际业务,另一方面,中东资本也并不希望将大模型时代的话语权完全交给欧美。
值得注意的是,5 月下旬在首尔举行的第二届人工智能安全峰会上,OpenAI、谷歌 DeepMind 和 Anthropic、微软、亚马逊、IBM、Meta 等 AI 圈头部公司悉数到场,而智谱 AI 同样作为唯一受邀的中国大模型企业参会,与上述公司达成技术和安全方面若干协议。
与全球顶尖 AI 巨头同台,来自全球范围内的认可短期内接踵而至,让智谱 AI 正逐渐向大模型舞台的中心区域靠拢。
不过,一个不得不接受的事实是,目前智谱 AI 与全球顶级大模型企业仍有一定差距。
去年底智谱 AI CEO 张鹏也直言说,“GPT-4 的发布让我们认识到,其实距离还是很大的,人家也在以更快的速度往前奔跑。”这点从两家的产品以及技术层面也能窥知一二。
首先在模型规模方面,OpenAI 的 GPT 系列语言模型规模已突破万亿,而智谱 AI 的模型规模还在千亿级别,作为基座模型,数据规模的大小,也意味着在处理自然语言数据的能力上,存在一定差距。
从技术角度来看,OpenAI 从一开始走的便是通用大模型的路线,所以更加注重通用性、可移植性和可扩展性,这也使得 GPT 系列语言模型可以在多个场景下应用,并且具有高度的可定制性。
相比之下,智谱 AI 的技术路线是“大模型+小模型”,通过大模型的预训练和微调,来适应不同场景和任务的需求。这种技术路线可以提高模型的泛化能力和应用范围,就相当于将一个大模型分割成多个小模型,但也会产生模型复杂度高、计算量大、训练时间长等问题。
更为简单的说便是,无论资金成本还是时间成本都会大大增加。不过不能否认的是,这种路线在行业专注度上也更为出色和精准,对于垂直行业应用或许是一个较优的解法。
张鹏也坦言,和国外大模型相比,国内的大模型发展起步晚了一些,加上高性能算力限制、数据质量的差距等,国内大模型在规模和核心能力上都与世界先进水平存在一定差距,这样的差距大约在一年左右。
事实上,智谱 AI 面临的挑战不仅仅是技术上的,更在于其商业化和生态构建的能力。能否训练出与 GPT-4 相媲美的语言模型,对于智谱 AI 来说至关重要,但更为关键的是,如何将技术优势转化为商业价值,构建起一个健康、可持续的生态系统。
商业化难题涌现
与其他创业团队不同,从成立之初,智谱创始团队就表现出有别于多数创业学者的商业热情。
据熟悉智谱节奏的投资人透露,从去年 2 月开始,张鹏等人便开始对外寻找商业化负责人,招揽了前大搜车 CTO、连续创业者张帆,据科技新知了解,截至去年底,智谱 AI 的商业化团队已经从最初的十几人迅速发展到上百人,从售前到售后、包括解决方案均建立了完善的团队。
而之所以快速搭建商业化团队,除了热情外,更实际的还是资金问题。随着智谱 AI 大模型能力持续提升,训练参数自然也需要提升,对算力、存储等需求也会增加。粗略来看,私有化部署一个千亿规模的大模型,一年费用接近 4000 万,但这 4000 万花出去能带来多少价值,却是一个未知数。
所以资金从哪来,是一个亟待解决的问题。按照智谱 AI 的策略,B端的付费意愿比C端好很多,所以智谱 AI 从一开始就瞄准B端。而其盈利方式和行业盈利方式基本一致,一是根据客户需求,提供大模型定制化开发服务。二是标准版大模型,提供 API 接入方式,按照 tokens 使用收费。
然而大模型行业的“价格战”来的比预想的更快。
目前,OpenAI 年内 GPT-3.5 Turbo 降价 50%,还更新了可限量免费使用的 GPT-4o,API 价格同样五折。国内 AI 大厂更是“丧心病狂”,字节跳动、百度、阿里、科大讯飞接连砸价,大量性能尚可的模型官宣免费,付费业务的定价标准甚至降至小数点后四位的水平——阿里云 Qwen-Long API 输入价格降至 0.0005 元/千 tokens,字节跳动豆包大模型 0.0008 元/千 Tokens。
与这些大厂相比,智谱 AI 无论从公司体量还是资金储备上显然都不在同一量级,但颇为意外的是,6 月第一周,智谱 AI 也官宣下场参与价格战,入门级产品 GLM-3 Turbo 模型调用价格从 5 元/百万 Tokens 降至 1 元/百万 Tokens,降幅高达 80%。
毋庸置疑,大模型定价的持续走低有望带来更快的商业化落地,但同时“价格战”往往意味着企业需要在价格上做出让步。另外,根据工信部赛迪研究院最新数据,预计在 2024 年国内市场规模仅有 132 亿元,然而随着大模型供给和开源企业增加,短期内买方仍以国企、央企等具备资金实力和需求场景明确的企业为主,这十分考验智谱 AI 的销售团队。
事实上,对于初创企业来说,口碑不够、根基不稳本就是其销售短板,尤其是和华为、阿里、字节等厂商相比,其在客户积累上本就不足。
以华为为例,做 ToB 服务起家的华为,手中已积累大量国企、央企等客户,而且内部有专人跟进这些客户需求。一旦这些客户有大模型需求时,华为则会迅速介入。另外,针对 ToB 销售,大企业还可通过交叉销售的方式分摊成本,并且为客户定制更系统的解决方案,这也是智谱 AI 这些初创企业短时间难以突破的。
客观来看,目前国内大模型的业态,属于百花齐放,已经开始出现同质化的特征,这样的大背景趋势下,智谱 AI 凭什么脱颖而出呢?
智谱 AI 筹码渐空
此前业内对于智谱 AI 共识的优势有三点,一是商业化快,二是算力多,三是生态在不断完善。
但站在当下来看,商业化能力已经开始与价格挂钩,价低者得逐渐成为清晰的走向;至于算力,简单来说,谁的卡多,谁能成为中国 OpenAI 的机会便更大。
然而没人知道其他同行手里还有多少“王炸”,在超级认知、超级对齐上的技术突破,会被快速被迭代跟进,坦白讲目前国内外主流大模型在算法层面尚不存在代际差,但是在算力和数据方面存有差距。
所以,对于智谱 AI 来说,生态完善或许才是重中之重。
按照智谱 AI 规划,将联合生态伙伴发起总额 10 亿元的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。智谱 AI 还为大模型开源社区提供计算卡、奖金、免费 API 等方式用来支持与大模型相关的开源项目。此外投资相关 AI 公司也是其计划之一。
然而,智谱 AI 生态上的布局看似“热火朝天”,但也存在漏洞。
纵观这些大手笔投资,几乎都是围绕技术层面,但模型质量的提升,除了技术进步外,另一个重要的点是要有扎实且优质的数据储备。除了传统的文本处理之外,语音识别、图像生成、视频理解和推荐系统等也都是未来发展方向。
只是与一些同行相比,智谱 AI 在数据的多样性和规模上可能存在一定差距。例如,百度、字节等大型科技公司拥有更广泛的数据源和海量的数据积累,能够涵盖更多领域和场景,从而为模型训练提供更丰富的素材,并且对于一些本就以内容起家的科技企业来说,也有更完善和精细的数据标注体系,确保数据的准确性和可用性。
另外,互联网巨头在计算、存储能力以及数据资源方面有着较大地优势。而对于智谱 AI 而言,这些都需要其投入大量的资金去搭建。当然,与云厂商巨头的合作,可以很大程度上降低研发成本、提高研发效率。但目前主流的云厂商几乎也都有自己的大模型产品,智谱 AI 能否拿到合适的价格,以及如何解决数据安全的可信,都是问题。
当下智谱 AI 正于大模型的江湖中奋力闯荡,虽获资本青睐、技术亦有突破,然与顶尖高手相较,差距仍存。商业化的鏖战、生态的构建,皆为待解之难题。未来,智谱 AI 是能披荆斩棘、笑傲江湖,还是深陷泥沼、铩羽而归,还需时间给出答案。