国思软件 - “我本以为AI六小虎为大厂探路，没想到连大厂都给DeepSeek探路”

　　（图片来源：钛媒体 AGI 编辑林志佳拍摄）

　　“我原以为 AI 六小虎是为大厂探路，没想到如今，其实连大厂都在给 DeepSeek 探路。”梅花创投创始合伙人吴世春近期在清华大学举行的一场演讲中表示，不只是 AI 六小虎公司，很多“独角兽”中的独角“猪”融了很多钱，但没有造血能力。

　　回顾 2024 年的 3 月，月之暗面（Moonshot AI）、智谱、百川智能、MiniMax、零一万物、阶跃星辰这“AI 六小虎”发展如火如荼，当时月之暗面的 kimi 智能助手迎来了一波好评热潮，智谱大喊全面对标 OpenAI，王小川还在讨论要做 Super App 杀手级超级应用。

　　但仅仅过了 360 多天后的今天，开源 AI 模型 DeepSeek 热潮席卷全球，用 7 天完成了 1 亿用户的增长。随后，百度、腾讯等多家互联网大厂和中小企业、政府机关开始接入和适配 DeepSeek。

　　如今，“AI 六小虎”被视作受这一轮热潮冲击最为显著的代表，已然踏上“分化”之路，各自在收缩业务战线、探索盈利途径：百川多名联合创始人离职，并选择深耕医疗 To B 领域；零一万物则不在研发万亿规模超大参数模型，转而拥抱 DeepSeek；MiniMax 削减B端投入，将发展重心转移至模型和C端应用；智谱则在短短 93 天内公布 48 亿元融资，为自身发展“冬储”能量。

　　管理咨询机构 Roland Berger 指出，中国 AI 应用中，字节豆包、DeepSeek 已成为超级入口。今年 2 月数据显示，豆包和 DeepSeek 与第三名 Kimi 的月活规模差距扩大至 3600 万，而部分新晋者如腾讯元宝凭借接入 DeepSeek 模型的流畅体验，积极投流，在短时间内也实现了显著增长。然而，文小言、智谱清言等“老牌”AI 助手因增速不及，面临不进则退的挑战。

　　零一万物创始人兼 CEO 李开复 3 月 21 日表示，DeepSeek 掀起的行业变革彻底颠覆了 AI 行业发展模式，可能让 OpenAI 创始人辗转难眠。他预测，中国市场最终可能只剩下 DeepSeek、阿里巴巴和字节跳动三家主要的 AI 模型公司，其中 DeepSeek 目前势头最强。

　　李开复强调，中美两地的投资人几乎不再下注更多更贵的底层模型公司，他们更愿意投资 AI 应用、消费者应用、AI 基础设施类型的创新企业。

　　中国“AI 六小虎”融资信息统计（数据仅供参考）

　　进入 AI 大模型下半场，形势已然明朗。

　　尽管 DeepSeek 讨论热度渐趋下降，但阿里、腾讯、字节等大厂凭借自身全方位的资源投入，向“AI 六小虎”彰显出一个残酷现实：百度 CEO 李彦宏所预判的“99% 的 AI 公司会在泡沫破裂时面临倒闭风险，仅有1% 的公司能够存活”正逐步成为现实。

　　DeepSeek 之后，六小虎从追基模转向“求生存”

　　“虽然对 AI 来说是重要的进步，但还算不上革命，”TrueAGI 和人工智能超级联盟 ASI Alliance 首席执行官 Ben Goertzel 博士指出，DeepSeek 带来了 AI 技术的“寒武纪爆炸”，表明更少的计算能力就能实现 AGI（通用人工智能）。

　　DeepSeek 于 2024 年 12 月发布了处理语言、运行对话应用的基础模型 V3，并于 2025 年 1 月开始提供具有强大推理功能的 R1 模型。DeepSeek 之所以爆火，原因在于 R1 模型在更低成本与开源生态的基础上，多个关键任务层面展现出与美国 OpenAI o1 等顶尖闭源模型相匹敌，甚至更优的性能。

　　美国风险投资家 Marc Andreessen 表示，DeepSeek 模型是 AI 的“斯普特尼克时刻”，即是 20 世纪 50 年代末苏联卫星发射，开启太空竞赛的时刻。

　　DeepSeek 披露过几个关键数据：V3 训练成本仅花费 560 万美元，V3/R1 模型理论一天的总收入达到 56.2 万美元（约合 407.41 万元）、成本利润率高达 545%。

　　然而，大众对 DeepSeek 的成本估算存在分歧。其中，Meta 前工程师表示，560 万元不包括算力运营、数据中心服务等费用，这些算力服务成本更加高昂，至少需要花费数亿美元。

　　PPIO 派欧云联合创始人兼 CEO 姚欣近期独家对钛媒体 AGI 表示，545% 只是理论数据，不代表行业趋势。“如果全行业 545%，大家都别干了”。他强调，这份没有收入起伏的数据，证明了 DeepSeek 全天近 16 个小时都是在峰值期，没有办法完整地满足用户的请求和服务，这样的服务质量是“不及格”的。

　　不过，这些都无法阻挡拥抱 DeepSeek 热潮。

　　当下，微软、英伟达、亚马逊、英特尔、AMD 等全球科技巨头相继宣布上线了 DeepSeek 开源模型推理服务，国内厂商诸如腾讯云、阿里云均支持 DeepSeek 的一键部署和调用，腾讯微信、浏览器、元宝、小红书等多款国民级产品接入 DeepSeek，涵盖社交、云服务、办公、地图等领域。

　　据钛媒体 AGI 统计，目前已有超过 300 家企业接入了 DeepSeek。

　　但 DeepSeek 并没有让算力需求消失。今年 GTC 大会上，英伟达创始人兼 CEO 黄仁勋表示，Meta、亚马逊、谷歌和微软前四大云服务商去年购买了 130 万颗的H系列芯片，今年则是要购买 360 万颗 BlackWell 芯片——但芯片行业人士指出，最终出货的系统数量其实并没有增加多少，这是黄仁勋的“单位换算”文字游戏。

　　黄仁勋认为，从两年前的 ChatGPT 到如今 DeepSeek 引发的推理能力，Scaling Law（规模定律）并没有消失，而是从一个变成了三个——预训练扩展、在代理人工智能（Agentic AI）阶段的后训练扩展，如今的算力需求已比去年预估的规模高出 100 倍。

　　然而，大会当日英伟达收跌 3.4%。华泰证券最新研报称，R1 等推理模型和传统的大语言模型相比，所需要生成的 token 量接近传统大模型的 20 倍。此次 GTC 上，虽然英伟达也提出了后训练 Scaling 和测试时间 Scaling 的叙事，但从英伟达当天股价表现上来看，此次 GTC 或未能打消投资人在算力需求增长方面的担忧，同时英伟达的 GPU 方案能够胜出目前还不确定。

　　如今，“AI 六小虎”面临着复杂严峻的局面。DeepSeek 开源模型正处于如日中天的发展态势，影响力持续扩张。与此同时，行业内训练成本与算力成本不断攀升，“烧钱”规模远低于大厂，这让“AI 六小虎”收入微薄却深陷高额亏损的困境。

　　也正因如此，今年，“AI 六小虎”不得不陆续放弃对基座模型的追逐，转而将重心调整为“求生存”，努力在艰难的市场环境中探寻可持续发展之路。

百川智能：缩减对预训练大模型的投入，今年将逐渐加大对医疗增强大模型的倾斜。3 月 20 日，百川智能与北京儿童医院、小儿方健康共同发布全球首个儿科大模型“福棠·百川”儿科大模型。此外，仅 3 月，百川就从裁金融组团队，到百川联合创始人焦可、联合创始人陈炜鹏陆续离职，此前百川智能联合创始人、商业化负责人洪涛已于去年离职。
零一万物：推出万智企业大模型一站式平台，为企业级 DeepSeek 部署定制解决方案，内置 DeepSeek V3/R1 等平台。李开复回应钛媒体 AGI 等：公司未来不再做单一大模型，而是采取模型开放策略，研发能够兼容适配国内主流模型的产品，转型之后，零一万物从基座大模型重投入调整为软硬件解决方案提供商，不再训练万亿参数规模的超大基模，但仍会继续做轻量化模型。
智谱：一面融资、一面转 Agent 和大模型落地。仅在 3 月内，智谱便先后宣布获得杭州国资、珠海华发集团、四川成都高新区 18 亿元融资，合作搭建首个城市级 GLM 大模型空间“智谱+珠海华发空间”、联合打造四川省基座大模型“智谱诸葛大模型”以及 AI 基础设施等。
MiniMax：在收缩B端业务后，持续投入视频生成、视觉多模态与海外产品，包括万卷等多款 App 停止更新、海螺整合成 MiniMax，统一力量发力 AI 应用落地。此外，有消息称 MiniMax 还在讨论收购深圳 AI 视频生成创企鹿影科技(Avolution.ai)，后者对外发声想要尽快被高价收购。
月之暗面：大幅收缩产品投放预算，逐渐披露在长文本与开源技术方面的进展，并且与“豆包”一样的界面加速迭代 kimi 智能助手，满足市场对 AI 应用的需求。
阶跃星辰：开源图生视频模型——Step-Video-TI2V，基于 30B（300 亿）参数 Step-Video-T2V 训练的图生视频模型，支持生成 102 帧、5 秒、540P 分辨率的视频，具备运动幅度可控和镜头运动可控两大核心特点，同时天生具备一定的特效生成能力。同时，跃问 AI 拥抱 DeepSeek，并重点推进智能车、手机终端、金融、机器人等领域的 AI 大模型技术落地。

　　总的来看，除了 MiniMax、月之暗面之外，剩下四家大模型公司都希望在 To B 企业端实现更大的收入增长，并且希望用 API 接入方式，代替传统 AI 软件的“定制化”需求。

　　李开复对钛媒体 AGI 表示，公司已经全面转向应用阶段，2025 是 Al-First 应用爆发年，也是大模型商业化的大考年，而 AI 需要市场，市场也需要 Al，行业亟需“性能x性价比”最优解。

　　“今天，大模型我们走（发展）了两年多，2025 年最重要的事件是开源力量+中国实力，DeepSeek 的横空出世，不但是中国的骄傲，而且也带来了更加清晰的终局，也就是开源必将胜出，大模型的格局将从拼比底模的技术指标，走向拥抱开源模型的商业赋能，那么中国就有超大市场、超多场景。”李开复称，未来的大模型的行业竞争将不再单指模型性能的比拼，更关乎从中台到应用的能力，即模型能否快速响应场景需求、基于中台构建行业应用。

　　然而，企业借助 To B 端服务实现扩张后，能否持续生存，目前仍存疑。依图科技联合创始人林晨曦对钛媒体 AGI 表示，如果在 To B 端，医疗 AI 对于大模型六虎并不一定是正确的方向，医疗 AI 行业订单的客单价很薄，收入和投入不成正比，几乎还是死路一条，医疗 AI 行业的商业环境本质上没有什么变化。

　　钛媒体 AGI 从行业人士处获悉这样一个案例。北京一家公立医院计划借助 AI 大模型，结合 CT / 核磁共振等现有技术，直接精准观察肿瘤病灶位置，该医院要求颇高，却将成本压得极低。字节、百川等企业参与了此次竞标。

　　最终，字节经评估认定，以当前技术水平，无法达到医院所期望的要求，况且订单价格过低，连成本都难以覆盖。但出人意料的是，百川却选择与医院展开合作。一位参与竞标的人士向钛媒体 AGI 透露，“连我们这些大厂都觉得难以实现的方案，百川就算拼尽全力、耗尽资源去做，最终也很难获得可观的收入。”

　　此外，这些 AI 公司内部管理存在严重问题。比如北京的一家 AI 公司办公区，有一层颇为特殊。与其他楼层不同，这一层全是实习生，却能享受诸如午餐、零食等优渥待遇，而其他楼层的员工则无此福利，不仅如此，公司内部的采购部门和商务销售部门矛盾频发，冲突不断，同时公司不断调整商业化方向，导致收入低于预期。

　　另一家北京的 AI 公司，其内部情况错综复杂，该公司的一位创始人行事风格独断，将 CEO 管理的诸多人员全部辞退，唯独留下自己人，致使公司 CEO 被“架空”，沦为有名无实的“吉祥物”。同时，在技术与产品层面，该公司状况堪忧，其自研基座模型被舍弃，小模型和产品服务在市场上毫无竞争力可言，然而公司仍硬着头皮大力开展推广销售工作，究其背后原因，创始人的最终目标是自身影响力变大，并且能将公司高价“变卖”给大厂。

　　显然，国内 AI 公司的扩张和“派系”背后，仍有很多隐忧无法消弭。

　　“这些‘大模型六虎’正在以三倍速，走当年我们‘AI 四小龙’（依图、旷视、云从、商汤）2017-2019 年的老路。”林晨曦对钛媒体 AGI 表示，如果 AI 创业公司想在国内 C 端产品中获得商业化，能力和最终结果远不及字节等互联网大厂，后者有大量的投入、人力资源、流量与用户规模，这是创业公司无法做到的。

　　追逐 OpenAI，奥尔特曼暗示 GPT-5 将免费提供

　　如今，阿里、腾讯两家互联网大厂都已经决定向 AI 技术领域加大研发投入。

　　其中，阿里巴巴集团 CEO 吴泳铭已经宣布，未来三年，阿里将投入超过 3800 亿元，用于建设云和 AI 硬件基础设施，总额超过去十年总和。这也创下中国民营企业在云和 AI 硬件基础设施建设领域有史以来最大规模投资纪录。

　　而腾讯 2024 年研发投入达 706.86 亿元，年度资本开支更突破 767 亿元，同比增长 221%，创历史新高。其中，AI 项目发展所涉及的资本开支就达 390 亿元。腾讯总裁刘炽平表示，腾讯计划 2025 年进一步加大资本开支，预计会占 2025 年总收入的“低两位数百分比”。这意味着，2025 年腾讯的资本开支可能接近 1000 亿元的水平。

　　据钛媒体 AGI 统计，过去十年，阿里、腾讯的研发支出各不相同，腾讯稳步提升，阿里的研发投入则随着业绩而变化，并在 2024 年达到最高的 934 亿元。

　　“AI 爆发远超预期，国内科技产业方兴未艾，潜力巨大。阿里巴巴将不遗余力加速云和 AI 硬件基础设施建设，助推全行业生态发展。”吴泳铭表示。

　　事实上，DeepSeek 热潮让国内投资界人士、政府机构都变得异常活跃，转向了“中国 AI 能力赶超美国”的叙事逻辑中，而中国是否已经在 AI 领域“弯道超车”，也引发热议。

　　对此，清华大学计算机系副教授刘知远表示，“AGI 新技术还在加速演进，未来发展路径尚不明确。我们仍在追赶阶段，已经不是望尘莫及，但也只能说是望其项背。在别人已经探索出来的路上跟随快跑是相对容易的，接下来我们要面对一团未来迷雾。”

　　事实上，DeepSeek 的创新，很好地说明了什么叫“需求是创造之母”。

　　这轮热潮带有一些无奈的色彩，DeepSeek 在算法、架构、工程方案的创新方案，核心因为算力被卡住，所以这样的方案几乎只有可能在中国公司出现，因为只有中国公司才会同时面临“巨大需求和巨大限制”这两个问题。因此，DeepSeek 的创新在中国以外也是很难复制的。

　　DeepSeek 这家中国本土的团队，因为其意外争气的表现，拉动了市场对于“中国 AI”想象，相应地中国科技公司也都是“与有荣焉”，努力以各种各样的方式赶上这波流量。

　　腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生认为，AI 行业还处于早期阶段。大家都在跑马圈地，尝试着不同的商业模式。有的在追 Scaling Law，有的在打造 To C 市场新入口，有的在做产业落地，非常热闹。

　　“AI 正在跨过产业化落地的门槛，站在普及应用的全新节点上。行业由之前的模型训练主导，发展到今天更多是应用与 Agent 驱动；我们看到，云上 DeepSeek API 调用量激增，语音交互的需求也带动了 ASR（自动语音识别）与 TTS（文本转语音）模型的 API 调用；模型推理的算力消耗正在高速增长，规模化推理的成本优化，成为云厂商的核心竞争力。”汤道生说。

　　无论是从 “AI 六小虎” 离职的高管，还是大厂出身及科学家转型的 AI 创业者，在创业早期，都在思考如何兼顾收入与 AGI 发展这“双重目标”。这情形就像，火锅店大师傅刚调好秘制底料，后厨的二把手、三把手便带着徒弟另起炉灶，分别去开串串香店和冒菜馆。商业江湖从不缺新风口，AI 大模型赛道才刚起步，那些本应专注于此的 “掌勺人”，却已被隔壁“烧烤摊”的香味吸引，蠢蠢欲动。

　　在金沙江创投主管合伙人朱啸虎看来，目前市场已经没必要去关注“AI 六小龙”了，创业公司做底层模型已经毫无意义。未来基础模型的竞争格局内，大厂中只会留下阿里、腾讯、字节这三家。至于创业公司，朱啸虎认为必须找到自己的根据地，才有机会异军突起，但从现状来看，他认为还没有看到能够颠覆阿里、腾讯、字节的万亿美元机会。

　　李开复认为，中美市场中的超大模型预训练正在逐渐寡头化，并且寡头化的程度在不断加大，其中开源圈展现出压倒性的优势。美国市场中，OpenAI 和 Anthropic 都相信自己还能训练出远超其他玩家的闭源模型。但从结果来看，OpenAI 在 2024 年的运营成本为 70 亿美元，而 DeepSeek 的运营成本可能只有 OpenAI 的2%。

　　“有了这样一个强大的竞争对手，我认为 OpenAI CEO 奥尔特曼（Sam Altman）可能夜里辗转难眠。”李开复表示。

　　从技术角度，各家模型优势各异，但 DeepSeek 将成本低数倍的开源模型免费推向市场，已经有效地将计算成本降低了五到十倍。而开发最尖端 AI 的过程中，丰富的计算资源仍然是强有力的武器。

　　其中，由马斯克领导的美国 xAI 于 2 月 17 日开始提供的新 AI 模型 Grok 3 系列，其在数学、科学和编程能力方面超过了竞争对手，主要因为大幅扩建数据中心，拥有 30 万英伟达显卡进行训练，比此前模型计算能力大 10 倍以上。

　　如今，OpenAI 的战略方向发生转变，不再一味执着于大模型本身的研发推进，而是将工作重点转移到了 ChatGPT 应用的用户增长层面，全力拓展用户规模。

　　奥尔特曼表示，未来五年，拥有十亿活跃用户的网站更有价值，同时，AI 战略优势将体现在软硬件的完整生态、实现最经济和最充足的推理能力，以及持续进行前沿研究保持开发出最优秀模型。

　　随着今年 2 月底训练数据量高达 120 万亿 tokens 的规模最大、知识储备最丰富模型 GPT-4.5 发布，AI 模型竞争进入“白热化状态”。OpenAI 计划在数个月内公开的基础模型“GPT-5”不仅具备知识能力，还具备高度的推理能力。合并后的 AI 预计变得庞大，因此需要大量的最高性能 GPU。

　　奥尔特曼认为，AI 是能够实现真正创造力的基础。他暗示，OpenAI 正在重新考虑其封闭战略，GPT-5 有可能免费提供，而同时也会发布开源的技术。

　　《创新者的窘境》一书中曾提到，“为什么成功的大企业会倒掉？因为他们按照既定技术轨道发展自己，能力结构逐渐固化，成为无法变革成功的死穴”。

　　外部市场环境瞬息万变，企业的战略规划与组织架构必须与时俱进、实现自主进化，否则必将被市场无情淘汰。大模型行业同样遵循这一规律。“AI 六小虎”的发展进程仍在持续，百川和智谱手握大量资金积极“冬储”，为未来布局。鉴于此，大模型行业未来的格局充满变数，当下实难作出精准预测。

　　但唯一可以确定的是，DeepSeek 已经成为了美国企业的“眼中钉肉中刺”。

　　3 月 13 日，OpenAI 向白宫提交了一份 15 页的信函，称要求美国政府禁用 DeepSeek，并向特朗普政府建议实施“AI 技术出口管制”，限制 AI 技术流向中国等国家。

　　正如 OpenAI 全球事务副主管勒汉在信中称：“虽然美国目前在 AI 领域仍保持领先，但 DeepSeek 的出现显示我们的领先优势正在缩小。”

　　这场大模型之战仍将持续，短时间内难见分晓。各方在技术研发、市场拓展、应用创新等维度的较量正酣，未来的竞争态势愈发复杂，鹿死谁手尚未可知。

　　（本文首发于钛媒体 App，作者｜林志佳）

“我本以为AI六小虎为大厂探路，没想到连大厂都给DeepSeek探路”

我们的产品

相关链接

关于我们

联系我们