DeepSeek获三大国产GPU力挺!日活突破2000万

  智东西

  作者云鹏

  编辑漠影

  智东西 2 月 4 日消息,上线 20 天,日活突破 2000 万,这是 DeepSeek 创下的又一个新纪录。

  根据国内 AI 产品榜统计,DeepSeek 应用(不包含网站数据)上线 5 天日活就已超过 ChatGPT 上线同期日活,成为全球增速最快的 AI 应用。

  相比之下,根据 Quest Mobile 数据,国内前 AI 应用明星 Kimi 在 2024 年 12 月的月活用户数为 2101 万。

  就在昨天,硅谷顶尖风险投资家、a16Z 联合创始人 Marc Andreessen 发文引用 SensorTower 数据:目前 DeepSeek 日活用户数已经达到了 ChatGPT 的 23%,并且应用每日下载量接近 500 万。

  ▲Marc Andreessen X 平台发文

  不过 SensorTower 统计的 DeepSeek 日活用户数绝对值在 1250 万左右,与国内 AI 产品榜统计数据有较大差异。

  ▲Marc Andreessen 引用的数据图表,来源:SensorTower

  DeepSeek 日活数、下载量的暴涨也侧面印证了其在普通消费者中的火爆,春节期间 DeepSeek 相关话题频频刷屏。

  昨天央视新闻官方发文“点赞”DeepSeek,DeepSeek 对于网友一系列问题的回答可以说是惊艳、深刻而富有温度。

  比如对于“‘过好这一生’的真相是什么”这一问题,DeepSeek 在回答中提到,没有完美的人生剧本,所有选择都有代价,关键是承担选择的勇气。我们不是来“赢”的,而是来感受花开、日落、爱与被爱的。

  ▲DeepSeek 针对网友提问给出的答案,来源:央视新闻

  就在今天,中国常驻联合国代表傅聪在纽约联合国总部举行记者会中回答记者提问时特别说道:“永远不要低估中国科研人员的聪明才智。DeepSeek 引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界、特别是美国需要学习的一课。”

  傅聪反问:“从华为到 TikTok,再到 DeepSeek,美国还想禁多少?”

  ▲中国常驻联合国代表傅聪在纽约联合国总部举行记者会中回答记者提问,来源:CMG 国际时讯

  DeepSeek 在消费者中引爆的同时,这两天国内又有更多云巨头加入到支持行列中。昨天下午,阿里云和百度智能云先后官宣了对 DeepSeek-V3、DeepSeek-R1 模型的支持。百度智能云更是直接公布了模型的输入和输出价格。

  ▲百度智能云公布的模型的输入和输出价格

  加之此前的华为云、腾讯云,目前国内四大云巨头都已正式支持 DeepSeek。此前海外的 AWS、微软智能云等云巨头已官宣支持。

  ▲近期官宣支持 DeepSeek 模型的云服务企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)

  在芯片领域,今天一大早,天数智芯、摩尔线程接连宣布支持 DeepSeek 模型,而英伟达、AMD、英特尔等海外芯片巨头已早早完成支持。

  ▲近期官宣支持 DeepSeek 模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)

  DeepSeek 卷起的全球 AI 风暴,已深度卷入产业中的每一位玩家,而中国芯片圈和云服务领域的巨头和创企们,已然集体出动。

  一、中国四大云巨头官宣支持 DeepSeek,亚马逊、微软云拥抱积极

  随着春节假期进入尾声,国内企业也逐渐进入复工状态,越来越多的国内企业陆续宣布对 DeepSeek 的模型支持。

  2 月 1 日大年初四,华为云正式官宣,经过华为云和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的 DeepSeek-R1/V3 推理服务。

  ▲硅基流动联合华为云上线的 DeepSeek-R1/V3 推理服务

  华为云提到,得益于自研推理加速引擎加持,双方支持部署的 DeepSeek 模型可以获得持平全球高端 GPU 部署模型的效果。

  2 月 2 日,腾讯云官宣了对 DeepSeek-R1 模型的支持,在腾讯云的 HAI 平台上,开发者大约花 3 分钟就可以接入并调用模型。

  ▲腾讯云 HAI 平台

  2 月 3 日下午 16 点 58 分,阿里云官宣其 PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1。44 分钟后,百度智能云也宣布了其千帆平台正式上架 DeepSeek-R1 和 DeepSeek-V3 模型,并直接公布了价格。

  ▲PAI Model Gallery

  根据官方信息,从上线到 2 月 18 日 24 点,模型限时免费。

  除了四大云巨头,国内云服务厂商无问芯穹更是早在 1 月 28 日除夕一大早就宣布了其 Infini-AI 异构云对 DeepSeek-R1-Distill 32B 模型的支持。

  PPIO 派欧、云轴科技则同在 2 月 2 日官宣了其对应云服务平台对于 DeepSeek 模型的支持。

  PPIO 派欧算力云支持了 DeepSeek-V3、DeepSeek-R1、蒸馏模型 DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。

  ▲PPIO 派欧算力云

  云轴科技 ZStack 宣布 AI Infra 平台 ZStack 智塔支持企业私有化部署 DeepSeek V3/R1/Janus Pro 三种模型,可基于海光、昇腾、英伟达、英特尔等国内外 CPU/GPU 适配。

  ▲云轴科技 ZStack 智塔

  海外市场,全球第一大云巨头 AWS 也在 1 月 31 日官宣了 DeepSeek-R1 模型的全面上线。

  用户可以在 Amazon Bedrock Marketplace 和 Amazon SageMaker JumpStart 上部署 DeepSeek-R1 模型;在 Amazon Bedrock 上自定义导入 DeepSeek-R1-Distill 模型并在 Amazon EC2 Trn1 实例上部署 DeepSeek-R1-Distill 模型。

  ▲Amazon Bedrock

  微软的 Azure 云服务则是在 1 月 30 日宣布 DeepSeek-R1 正式上线微软的 Azure AI Foundry 以及 GitHub。

  微软还贴心地给出了使用教程视频。

  虽然 DeepSeek 的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。

  简单来说,通过支持 DeepSeek 模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用 DeepSeek 模型。

  客观来说,像 DeepSeek-V3 这样的 MoE 模型总参数量有 671B,部署门槛并不低。

  同时开发者还能在平台上以更少甚至零代码去实现从训练到部署再到推理的全过程,AI 开发和应用的流程更简单、更高效。

  二、国内 GPU 创企纷纷力挺响应,美国芯片三巨头到齐

  除了云巨头,国内外芯片厂商也纷纷快速响应,宣布对于 DeepSeek 模型的支持。

  在海外芯片三巨头英伟达、英特尔、AMD 之中,AMD 是响应最积极的一个,AMD 早在 1 月 25 日新年前就已经官宣,他们将 DeepSeek-V3 模型集成到了自家的 Instinct MI300X GPU 上。

  在X平台发文中,AMD 特别感谢了 DeepSeek 和 SGLang 团队的密切配合。

  1 月 31 日,AI 芯片算力扛把子英伟达也正式官宣了其 NVIDIA NIM 微服务预览版对于 DeepSeek-R1 模型的支持,NIM 微服务基于 HGX H200 系统,每秒能够处理 3872 个 tokens。

  开发者们可以调用 API 进行测试和试验,而这一 API 后续会作为英伟达 AI 企业软件平台的一部分进行提供。

  同样在 1 月 31 日,英特尔也宣布 DeepSeek 能够在英特尔产品上运行,包括在搭载英特尔处理器的 AI PC 上离线使用。

  英特尔提到,在其最新发布的酷睿 Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B 模型能够顺利运行,在因式分解演示中,能够迅速演绎逻辑思维,并最终解决数学难题。

  基于 DeepSeek-R1 模型,一台轻薄笔记本电脑可以完全离线、本地化地帮你翻译、做会议纪要、进行文档撰写。

  国内芯片厂商这边,华为的昇腾系列 AI 芯片自然不必多说,此外还有 GPU 芯片厂商沐曦也联合中国开源大模型平台 Gitee AI 发布了全套 DeepSeek-R1 千问蒸馏模型。

  ▲沐曦模型资源包发布

  根据官方信息,2 月 2 日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云 GPU 上。

  DeepSeek-R1 模型+沐曦曦云 GPU+Gitee AI 平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100% 国产 AI 的力量”。

  今天一大早,天数智芯和摩尔线程也接连宣布了对 DeepSeek 模型的支持。

  根据天数智芯官方信息,天数智芯与 Gitee AI 合作,仅用时一天,就完成了与 DeepSeek-R1 模型的适配工作,并且已正式上线多个大模型服务,包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B 等。

  ▲天数智芯完成 DeepSeek-R1 模型适配,上线多个大模型服务

  天数智芯提到,国内 GPU 与 DeepSeek 的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内 AI 产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内 GPU 拓展市场,吸引更多上下游企业合作,完善产业链生态,促进应用加速落地。

  国产 GPU 创企摩尔线程这边,其已经实现对 DeepSeek 蒸馏模型推理服务的部署,这意味着开发者可以基于摩尔线程的 GPU 进行 AI 应用开发。

  ▲摩尔线程官宣信息

  此外,摩尔线程即将开放自主设计的夸娥(KUAE)GPU 智算集群,支持 DeepSeek V3、R1 模型及新一代蒸馏模型的分布式部署。

  摩尔线程提到,DeepSeek 的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能 GPU 对复杂 AI 任务的支持能力,为 AGI 技术普惠化提供了可行路径。

  三、日活 2000 万跑出“中国速度”,DeepSeek 倒逼行业跑得更快,竞争焦点来到应用层

  从上线第 5 天的 259 万日活用户数到今天突破 2000 万大关,DeepSeek 只用了 15 天,可以说是实实在在的“中国速度”。

  根据 AI 产品榜数据,DeepSeek 上线 18 天日活用户数达到 1500 万,而 ChatGPT 达到同样的数字,花了 244 天,DeepSeek 的速度是其 13 倍之多。

  ▲DeepSeek 与 ChatGPT 日活用户增长趋势对比,来源:AI 产品榜

  根据雪球平台用户明月桥投资 2024 年 11 月 28 日引用的 Quest Mobile 数据,当时豆包的日活用户数大约为 1200 万,而 Kimi 到日活用户数约为 300 万。

  ▲来源:雪球

  有业内人士称,DeepSeek 如此之快的爆发速度,一方面刺激着各路厂商加速适配模型,另一方面也刺激着算力产业的整合,随着模型同质化趋势凸显、开源模型的加速成长,AI 应用生态层的商业价值会越来越高,应用层竞争也将成为后续行业聚焦的重点。

  根据 Sensor Tower 数据,DeepSeek 现在的日活用户已经远超谷歌 Gemini、Perplexity、Claude 等热门海外 AI 应用,其应用日下载量更是断崖式领先。

  DeepSeek 的飙涨态势能持续多久,会是后续的一个关注点。

  结语:DeepSeek 朋友圈阵容豪华,合作共赢才是未来 AI 发展必由之路

  DeepSeek 给整个 AI 产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek 对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入 DeepSeek“生态圈”。

  DeepSeek 无疑正在重塑全球 AI 产业的竞争版图,中美之间的 AI 竞争格局也在改变。算力神话被打破、更多玩家有机会在 AI 新时代更轻松地拿到“入场券”,AI 应用生态的发展也愈发重要。

  诸多国产 GPU 玩家的加入,让我们看到在 AI 的蓬勃发展中,不可能只有一家独大,必定是百花齐放。

  正如 DeepSeek 创始人梁文锋近日在接受《暗涌》采访时提到的,在这波 AI 浪潮中,DeepSeek 的出发点是走到技术前沿,去推动整个生态发展。正如英伟达的领先不只是一个公司到努力,也是整个西方技术社区和产业共同努力的结果,中国 AI 的发展,同样需要这样的生态。

  梁文锋说,DeepSeek 希望形成一种生态,他们只负责基础模型和前沿的创新,其它公司在 DeepSeek 的基础上构建 toB、toC 的业务。

  中国知名生物学家、北京大学终身讲席教授饶毅昨天一大早发布了题为“鸦片战争以来,中国对人类最大的科技震撼:DeepSeek”的文章,一时激起广泛热议。

  毫无疑问,DeepSeek 给海外诸多产业和领域都带来了巨大震撼,中美之间的 AI 竞争仍然事态焦灼、充满不确定性。中国 AI 或许正走在一个历史最关键时刻。

  正如傅聪所说:“我们不需要更多的禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益。”