国思软件 - DeepSeek阴影下的大厂

　　最后一个反击 DeepSeek 的主要玩家终于姗姗来迟。

　　2 月 18 日晚间，马斯克的 xAI 带着 Grok3 亮相直播。发布会上，马斯克强调，为了训练 Grok3，用了超过 20 万张 H100，总训练小时数达到两亿小时。而收获的成果是，在分数上，Grok3 超过了目前公开测试的所有模型，包括 DeepSeek R1.。

　　马总的成果让不少推上观众开始觉得，大力出奇迹仍然是有效的。但很快，就有人发现，Grok3 虽然刷分成绩优秀，实际表现却并不如想象中惊艳。比如它仍然无法识别 9.11 和 9.90 谁更大，给出的许多答案和建议也存在明显错误。

　　即便马斯克后续发文挽尊，表示 Grok3 每天都会改进，现在还只是个测试版，但昨晚的展示又进一步证明了 DeepSeek 带来的阴影——大力出奇迹并不是 AI 的唯一解，大模型的竞争关键正在从算力转向优质训练数据。

　　和试图反驳 DeepSeek 的美国同行不同，国内的大厂们纷纷拥抱了 DeepSeek。

　　字节旗下的火山引擎官宣接入 DeepSeek；百度不仅从闭源转向开源，还把核心的搜索业务也接入 DeepSeek。

　　阿里巴巴在云服务、1688、天猫精灵、国际业务等多个板块都部署 DeepSeek；让市场反应最大的，还是微信接入 DeepSeek，在搜索栏新增了 AI 搜索的服务。消息一出，腾讯股价一度上涨至 512 港元，创下了 2021 年 10 月以来的最佳表现。

　　当下的情况在某种程度上印证的李彦宏的那句名言：在所有大厂都看好的情况下，创业公司成功的概率几乎为零。当行业发生重大转向时，去年还风头正劲的 AI 六小龙有些泯然众人，但大厂依然可以凭借自身业务去做落地场景开发，同时凭借自身的赚钱能力继续投入，留在牌桌上。

　　旧世界的分崩离析

　　2 月 10 日，在法国巴黎大皇宫，AI 学者、斯坦福大学教授李飞飞在“人工智能行动峰会上”发表演讲，并表示，“毫无疑问，历史学家今后一定会把这段时间称作‘真正的第一个 AI 时代'”。

　　新技术浪潮来临的特点之一，大概是正因为探索的是一片无人区，所以你永远不知道哪里是正确的方向。当所有人都以为通往 AGI 的道路只有“大力出奇迹”这华山一条路时，DeepSeek 告诉你，往哪个方向都是路。

　　DeepSeek 对过去路线的改变主要有三点：成本、开源和路径。

　　自 AI 浪潮诞生以来，所有的关键技术突破都在美国，因此硅谷的风向可以当作行业的风向。OpenAI 认为算力能够解决一切，所以竞争的关键是足够的卡。

　　你能看到的是，即便是现在，马斯克仍然试图用 20 万张 H100、2 亿训练小时去证明过去的路线。但事实是，虽然 Grok3 在大模型竞技场榜单上的得分排名第一，但是领先的分数并不多。

　　DeepSeek 的例子证明了，算力虽然也重要，更重要的是数据质量，成本也存在大幅优化的空间。

　　国内大模型行业的风向也因此改变。

　　大厂对于 AI 这波机会的“FOMO”情绪是显而易见的。阿里、腾讯等大厂都投资了半数甚至半数以上的“AI 六小龙”。不仅自己投，大厂也在自己造。

　　阿里分别推出了开源大模型 Qwen 系列和闭源大模型通义千问 2.5；腾讯则推出了混元大模型；最早投入 AI、也是最早跟上 OpenAI 节奏的百度则推出了文心一言。

　　相对于以上三家，字节的反应更慢，但是投入也更猛烈。根据《财经》报道，字节对大模型的投入“不设限”。豆包团队不仅规模达数千人，甚至不少人员都是字节加了 50% 甚至 1 倍的薪资，从其他大厂里挖来的。

　　根据浙商证券的分析，2024 年字节跳动的资本开支约为 800 亿元，接近百度、阿里、腾讯三家的总和（约 1000 亿元）。

　　一个字节后来居上的例子是，在 DeepSeek-R1 横空出世之前，字节旗下的豆包日活已经来到了国内第一。

　　但是仅仅一个月，甚至没有任何成本，DeepSeek 就超越它来到了行业第一。成为史上最快突破 3000 万日活的 App。

　　只是一转眼，DeepSeek 活成了豆包梦想的样子

　　根据《晚点 LatePost》报道，在日前字节的全员会上，CEO 梁汝波反思说去年 9 月 OpenAI 发布长链思考模型、成为行业热点后，字节意识到技术重大变化，但 “没有觉得要马上复现出来 ...... 现在回头看，如果一开始重大问题就争先，我们有机会更早实现。”

　　此前一直坚持闭源路线的百度也宣布免费和开源。

　　大厂的特权：一边加入一边追赶

　　几乎是没有任何犹豫的，互联网大厂们都选择了加入 DeepSeek。

　　据了解，在年前和过年期间，多家大厂都开了线上电话会，要求完成 DeepSeek 的适配和接入工作。一方面，DeepSeek 开源的比较彻底，下载、部署、使用非常方便；另一方面，作为目前讨论度最高的大模型，DeepSeek 意味着巨大的流量，并且其创始人梁文锋致力于实现 AGI，并没有想拿日活做文章的意思。

　　可以说，谁能吃到 DeepSeek 这波机会，至少取得了 AI to c 的先机。这也是这轮大厂 to c 业务调整的契机。

　　意料之外而又情理之中的是，动的最快的是腾讯。从产品来看，腾讯把 DeepSeek 接入了自家最核心的微信，灰度测试了 AI 搜索功能。并且腾讯地图、QQ 音乐、腾讯文档都已经接入 DeepSeek。

　　从组织层面来看，根据《智能涌现》报道，继今年 1 月腾讯元宝（全能 AI 产品）从 TEG（技术工程事业群）转入 CSIG 之后，包括 QQ 浏览器、搜狗输入法、ima 等更多产品和应用，将正式转入 CSIG（云与智慧产业事业群）。

　　虽然第一个把 DeepSeek 接入核心产品的行为，并不符合腾讯“敢为人后”的风格，但理由也不难猜测。

　　此前行业普遍认为大模型的推理能力一定会出现，不过这个过程可能会很长。DeepSeek 的出现一下把节点提前了，应用场景逐渐清晰起来。

　　以搜索为例。过去腾讯坐拥流量入口，但是在搜索这块始终折戟。行业的共识是，AI 一旦出现，最先颠覆的一定是搜索，因为 AI 本身的能力能够让你在最短的时间内得到最想要的答案。腾讯旗下的游戏等业务也是 AI 落地的核心场景。

　　既然目前 DeepSeek 没有做 to c 的想法，也没有外部融资的计划，借助它的流量和能力，去培育自己的产品，何乐而不为呢？

　　其他几家大厂也都选择把 DeepSeek 接入自家业务，只不过步子迈的没有那么大。比如阿里旗下 to B 的钉钉率先接入了 DeepSeek，在 to c 层面，阿里把夸克当作核心，同时和苹果的合作有望让阿里承接更多用户和流量。

　　大厂们也没放弃基础模型的研究。

　　从《晚点 LatePost》的报道来看，字节重提务实的浪漫主义。针对 AI，梁汝波提出了三个重点目标：意识追求智能上线，不忽略关键技术节点。二是探索新的交互。但是加强规模效应。同时成立探索通用人工智能（AGI）前沿研究的 Seed Edge 项目，项目员工的考核周期和目标也比其他员工放的更宽。

　　腾讯在微信搜一搜接入 DeepSeek 不久，就在腾讯元宝上线了自研的混元 T1 深度思考模型，围绕 AI 搜索场景打造自主的模型能力。

　　DeepSeek 的惊喜本就不是颠覆式的创新，反而加重了行业“FOMO”情绪。有子弹的大厂一定不会放弃拿到 AGI 船票的机会。

　　写在最后

　　据了解，前任当红 AI 炸子鸡月之暗面也主动调整了策略。界面新闻报道，月之暗面近期决定大幅收缩产品投放预算，包括暂停多个安卓渠道的投放，以及第三方广告平台的合作，把主要精力放在模型能力的提升上。

　　而此前的 AI 六小龙里，阶跃星辰和 MiniMax 已经接入 DeepSeek-R1 模型，零一万物明确表示不做基础大模型，转向应用层开发。百川智能推出了以 Baichuan-M1 为底座打造的“AI 儿科医生”，智谱 AI 则选择加码 Agent 智能体。

　　我们常常说大厂没有创业的土壤，但事实是创业公司在拿到风投的钱以后，也需要考虑到股东回报的问题，从而不得不把中心放到商业化上。

　　至于 DeepSeek？它不缺钱。（路费）

DeepSeek阴影下的大厂

我们的产品

相关链接

关于我们

联系我们