DeepSeek GitHub 平台热门项目星数超 OpenAI

  截至 2 月 7 日下午,DeepSeek 在 GitHub 平台的热门项目「DeepSeek -V3」的点星数已达到 7 万加,超过了 GitHub 上 OpenAI 最热门项目。

  DeepSeek-V3 模型于 2024 年 12 月 26 日发布,官方表示,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。该模型的多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

  此外,官方表示,通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。