本文字数:2749,阅读时长大约 4.5 分钟
作者 第一财经彭海斌
DeepSeek 给云计算厂商带来立竿见影的回报。
“基本上把各家主要云厂商,包括运营商的云端算力库存清空了。”一家大模型研究机构的研究员对记者表示。这家机构调研国内云厂商后得出这一结论。
1 月 20 日,DeepSeek-R1 大模型发布后,各家云计算厂商纷纷上线其满血版或者蒸馏版模型。它开源且相对高效,推动了人工智能在国内渗透率进一步提高,并促进云计算厂商加大对基础设施的投资。
“云端算力全给吃完了”
DeepSeek 现在是各家云计算厂商竞争的焦点。
“DeepSeek 就是最好的试金石,哪家云的托管服务性能好,吞吐大,延迟低,直接测试就知道。”火山引擎总裁谭待在其朋友圈表示。
DeepSeek 发布的模型包括多版本,既有 671B 参数的满血版,也有 1.5B、7B、70B 参数的小模型。参数不同,所需计算资源不一样,部署的终端也不同。比如 1.5B 的模型可以部署在几千元的手机端,而 70B 的模型可部署在几万元的工作站,而 671B 的满血版模型部署在云端更具性价比。
火山引擎是字节跳动旗下的云与 AI 服务提供商。它除了支持自己的豆包大模型,也上线了月之暗面、智谱等多个系列模型。春节刚刚过完,火山引擎上线全尺寸的 DeepSeek 模型。DeepSeek 模型开源、好用,企业级用户想在云端使用满血版的大模型,需要向云计算厂商采购算力或存储业务。
谭待的表态是对企业客户喊话,也面向其他云计算厂商。
云计算厂商围绕 DeepSeek 的竞争,在春节期间就打响了。为了尽快上线 DeepSeek,不少工程技术人员度过了一个无休的春节假期。云计算厂商竞争本就激烈,价格战打了一轮又一轮。因此,腾讯云在接入阿里大模型的时候心存顾虑,反过来,阿里云也不会全心全意接纳腾讯混元模型,百度智能云也不会青睐腾讯或阿里的大模型。
开源的 DeepSeek 看起来人畜无害,而对云计算厂商有益,因此获得更广泛的接纳。中国的科技企业已经发布了上百款大模型,但没有一款产品像 DeepSeek 这样具有穿透力,可以在每一片云上轻盈地跳跃。
DeepSeek 也带动了开源的浪潮。
百度曾是闭源路线的坚定拥护者,但也在年后宣布 6 月 30 日全面开源其文心大模型 4.5 系列。百度智能云也已经接入 DeepSeek 大模型,并以更低的价格吸引开发者使用。
在 2025 阶跃星辰生态开放日,大模型六小虎之一的阶跃星辰宣布将在今年的三月份开源其图生视频模型。此前,阶跃星辰已经发布了 11 款多模态大模型,其中两款是开源的产品。
“阶跃从成立之初就规划了实现 AGI 的路线图,具体说来有三个阶段,模拟世界、探索世界和归纳世界。”阶跃星辰创始人、CEO 姜大昕表示:“阶跃的工作,正是沿着这三个阶段展开。在去年一年时间里,我们发布了一系列模型,形成了从千亿参数到万亿参数,从语言模型到多模态模型,从多模理解到多模生成,从模仿学习到强化学习的全方位模型矩阵,涵盖了这种路线图里的多个关键节点。”
模型一旦开源,就有它自己的生命力,开源大模型生态更能激发开发者使用的热情。
中国大模型产业正经历结构性的转变,一些企业如零一万物等已经放弃了成本高昂的通用大模型研发,转向投入成本更低、更快见到商业效果的垂直产业模型。
DeepSeek-R1 模型引爆市场热情之后,“杰文斯悖论”的有效性得到验证。DeepSeek 指向更低的算力需求,但算力使用效率的提高,使得推理模型快速渗透到千行百业,从而拉动了算力需求的整体增长。
“模型更新太快了,最好的模型一定是在云上。”谭待在 2024 年年底的采访中表示。
OPPO 手机已经接入了阶跃星辰的大模型,小红书已经接入了 DeepSeek 以增强其搜索功能。火山引擎方面则表示,已经协助国信证券、平安证券、易方达基金等 60 家金融机构接入了 DeepSeek 大模型。
“推理模型的发布,导致海量的玩家涌入,把云端算力全给吃完了。”上述研究员对记者表示。
相比阿里云、腾讯云等头部企业,腰部及以下的云计算企业更迫切需要这样的机会来改变收入下滑的颓势。
优刻得 2021 年收入达到 29 亿元,但此后的两年收入连续下滑,2023 年只有 15 亿元。2024 年中报,优刻得收入同样下滑至 7.3 亿元,且出现了 1 亿元的亏损。青云科技在 2020 年收入 4.29 亿之后,同样收入不振,2023 年营收为 3.3 亿元。
这一轮的中国科技资产重估中,优刻得和青云科技的市值都在 2025 年初至今实现翻倍,但现在它们同样需要实实在在的业绩倍增。
新投资周期?
DeepSeek 正在中国科技大厂中激发一轮云和 AI 基础设施的投资。
阿里巴巴集团 CEO 吴泳铭在 2 月 24 日宣布,未来三年将投入超过 3800 亿元,用于云和 AI 硬件基础设施。这一投资超过了阿里巴巴集团过去十年投资总额。
2 月 25 日,百度宣布以约 21 亿美元价格收购欢聚集团在国内的视频娱乐直播业务 YY Live。新协议达成后,此前存入托管账户的约 16 亿美元已全额返回百度。百度方面表示,将把 16 亿美元投入云与 AI 基础设施建设。
今年的 1 月份,移动云的苏州汾湖智算中心一期投入运营,一期总投资 26.8 亿元。移动云的苏州项目总规划投资 60 亿元,全部建成后可承载 2.4 万个机柜,50 万台服务器装机能力,总算力可达到 10EFLOPS。
“火山引擎的算力储备肯定是非常够的,这也是我们有信心去大规模、低价格而且高吞吐地承接业界服务很重要的一个原因。”谭待在 2024 年底的采访中对记者表示。
相对阿里云、百度云等企业,火山引擎是云计算市场的后来者。“你想做得更快,一定要在新的技术变革中做到第一。新的技术变革是什么?其实就是 AI 和大模型,所以这块我们的目标就是第一,而且我们在朝这个方向在前进。”谭待说。
国产算力可望借此机会更深地嵌入人工智能生态。
“DeepSeek 的爆火对我们算力的需求是比较旺盛的。”移动云方面对第一财经表示。移动云会对 DeepSeek 的模型做一些微调、蒸馏,以符合特定行业内企业的需求。移动云提供的是全国产化的部署的环境。这尤其能打动部分央国企,不管是本地部署,还是云端部署。
据移动云方面表示,它所提供的算力很大程度上满足了央国企的需求。2025 年 2 月,移动云协助中国石油完成 DeepSeek 全栈国产化的训推适配和私有化部署,这背后离不开昇腾的算力支撑。
英伟达的 GPU 满足了云计算企业九成以上的需求,但 DeepSeek 的出现给国产算力提供了可能。沐曦、摩尔线程或者华为昇腾 GPU 获得越来越多云计算平台或终端企业的接纳。
中国芯片企业也紧紧抓住这次机遇趁势而上。
在 DeepSeek 系列模型上线不久,昆仑芯就完成了全版本的适配,并在蛇年开工当天宣布已经点亮了其新一代产品 P800 万卡集群;2 月 20 日,昆仑芯又官宣在 P800 上实现单机部署满血版。
自 DeepSeek 启动“开源周”以来,它已经陆续开源了四个代码库。摩尔线程目前已经完成了 DeepSeek 开源库 FlashMLA 和 DeepGEMM 的适配。
美国对中国进口高端芯片进行了限制,这倒逼中国企业实现技术突破。目前英伟达 GPU 在算力性能和生态成熟度上具有优势,但随着国产芯片研发的推进、算法能力的提升,以及行业对供应链安全的重视,国内有希望逐步降低对英伟达单一依赖的风险。
“这一过程需要时间和技术积累,但已是不可逆的趋势。未来的算力底座更可能呈现‘多元共存’的形态,而非某一厂商的绝对主导。”摩尔线程方面此前对记者表示。
微信编辑 七三