DeepSeek于知乎开设官方账号 首次公布模型推理系统优化细节

  3 月 1 日消息,DeepSeek 于知乎开设官方账号,独家发布《DeepSeek-V3/R1 推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek 开源周”正式收官。

  据介绍,知乎一直是 AI 从业者和创业者密度最高的社区,此次 DeepSeek 选择知乎作为开源发布的最后一站,进一步引领了全网最重要的 AI 趋势发布。

  作为“DeepSeek 开源周”的收官之作,DeepSeeK 知乎官方账号正式亮相,并发布文章详述 V3/R1 推理系统。文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek 的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用 EP 增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得一提的是,文章还率先披露了 DeepSeek 的成本和利润率等关键信息。“假定 GPU 租赁成本为 2 美金/小时,总成本为$87,072/天。……如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为$562,027,成本利润率 545%。”

  据了解,“DeepSeek 开源周”自 2 月 24 日至 2 月 28 日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM 和 3FS 四个开源项目,以及 DualPipe、EPLB 等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论。(定西)