
雷递网雷建平 3 月 31 日
智谱(HK:02513) 今日正式发布 2025 年全年业绩,这是其上市后首份财报。智谱 2025 年营收 7.24 亿,较上年同期的 3.12 亿增 131.9%。MaaS 商业飞轮全面运转,MaaS API 平台实现 ARR 17 亿(约 2.5 亿美元),同比提升 60 倍;且盈利能力大幅改善,MaaS API 平台毛利率同比提升近 5 倍至 18.9%。

智谱的收入分为云端部署收入和本地化部署收入两部分,其中,智谱 2025 年云端部署收入为 1.9 亿元,较上年同期的 4850 万元增长 292.6%;此项增长主要归因于集团通过持续迭代提升了模型智能上界。提升后的模型智能表现推动了模型调用量的增加。

智谱 2025 年本地化部署收入为 5.34 亿元,较上同期的 2.64 亿元增长 102.3%,此项增长主要得益于本集团通过持续迭代提升模型智能上界,模型通用性的增强和市场的需求维持强劲。
智谱 2025 年毛利为 3 亿元,较上年同期的 1.76 亿元增长 68.7%;智谱 2025 年综合毛利率 41%。MaaS 商业飞轮全面运转,MaaS API 平台实现 ARR 17 亿元(约 2.5 亿美元),同比提升 60 倍;且盈利能力大幅改善,MaaS API 平台毛利率同比提升近 5 倍至 18.9%。
智谱首次定义 AI 生产力价值——Token 架构力(Token Architect Capability),即“智能调用量 × 智能质量 × 经济转化效率”。
智谱 CEO 张鹏表示:智能上界的提升,是大模型 AGI 时代唯一的“第一性”。2026 公司将进一步探索智能上界的突破,引领范式创新以及作为底座持续输出高质量 Token。
前十大互联网公司中,有 9 家深度调用 GLM 模型
AI 公司 Anthropic 凭借指数级增长,印证 API 商业模式的潜力。智谱的商业化路径与 Anthropic 高度一致,即以模型智能为核心壁垒,以 API 为主要产品形态。
2025 年,智谱凭借 GLM 系列在“智能上界”侧的代际领先与推理侧的极致成本优化,实现了从开发者生态到全球化的全面爆发。
智谱旗舰基座模型 GLM-5 发布后 24 小时内,即获得字节跳动 TRAE、阿里巴巴 Qoder、腾讯 CodeBuddy、美团 CatPaw、快手万擎、百度智能云及 WPS Office 等头部平台产品的官方接入。
智谱称,目前中国前十大互联网公司中,有 9 家深度调用 GLM 模型。截至 2026 年 3 月,智谱的平台注册企业及用户突破 400 万,服务全球超过 218 个国家及地区。
Claw Plan 上线 20 天订阅用户就破 40 万
此外,2025 年智谱在国内第一家推出 GLM Coding Plan(编程套餐),凭借模型的高质量编码能力,全球付费开发者数量快速突破 24.2 万,Token 调用量 6 个月涨了 15 倍。
2026 年 2 月,即使上调价格 30% 并取消首购优惠,编程套餐依然保持供不应求的态势,成为全球增长速度最快的 AI 编程服务之一。
2026 年 3 月,继 Coding Plan 之后智谱推出 Claw Plan,上线仅两天订阅用户即破 10 万,上线 20 天订阅用户突破 40 万。
目前,GLM 模型已全面部署于 Google Vertex AI、AWS Bedrock、Fireworks、Cerebras 等全球顶尖云服务商,并入驻 OpenRouter、Vercel 等国际主流模型聚合平台。
GLM 已成为国际知名 Coding 平台(如 Windsurf)、知名 CodingAgent 平台(如 OpenCode)的默认模型。当前,智谱已成为国内付费 Token 消耗量最高的厂商之一。
实现“量价齐升”
2025 年,智谱完成从氛围编程(Vibe Coding)到智能体工程(Agentic Engineering)的迁移。GLM-4.5、4.6、4.7 到 GLM-5、5-Turbo 的高频发布,在全球模型中仅次于 GPT、Claude 和 Gemini。
此外,GLM-5 在 Artificial Analysis Intelligence Index 榜单达到 50 分,这是开放权重模型首次达到这一高分。
此外,智谱推出的 Slime 框架实现异步强化学习效率革命,配合自研算法让模型从超 1 万个真实软件工程环境高效学习,支撑起全球首款 OpenClaw 基座模型 GLM-5-Turbo 的诞生。
同时,GLM-5 完成国产芯片软硬协同设计,通过创新量化策略将显存占用压缩至极限,单台国产服务器即可稳定部署,成本降低 50%,在国产芯片上实现比肩国际顶级芯片的推理效率,构建起“智能上界+自主计算底座”的技术闭环。
智谱称,凭借超强模型效果,在 2026 年一季度 API 涨价 83% 后,调用量不降反升,市场依然供不应求。这一“量价齐升”的态势,显示出客户为更确定的生产力付费的高度意愿。
未来聚焦高质量 Token 输出
中国 AI 需求加速扩张,模型能力成为核心竞争要素。
智谱称,2026 智能范式将从轻量化的 Vibe Coding(氛围编程)向工业级的 Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与 Token 调用的指数级增长。
当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为 TAC(Token Architecture Capability,Token 架构能力)。TAC = 智能调用量 x 智能质量 x 经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为 Token 架构师,在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂 Agent 系统的自主运行。
智谱称,其目标是成为提升全社会 TAC 的基础设施,让每一滴 Token 都能转化为可交付的经济增量。
雷递由媒体人雷建平创办,若转载请写明来源。
