国思软件 - 腾讯T1登场：押注非transformer，速度、推理、价格全面对标DeepSeek

　　3 月 22 日消息，昨晚深夜，腾讯宣布推出基于混合 Mamba-Transformer 架构的超大型推理模型“混元 T1”正式版，并在腾讯云官网上线。

　　T1 是腾讯自研的强推理模型。该模型的前身是今年 2 月中旬在腾讯元宝 APP 上线的 T1-Preview（Hunyuan-Thinker-1-Preview）。

　　据悉，技术层面，混元 T1 结合 Mamba 在长序列处理上的优势与 Transformer 在复杂上下文捕捉上的能力，降低了推理成本和 KV-Cache 占用。腾讯未披露更多技术细节，但 Mamba-2 研究表明，Transformer 中的注意力机制与 SSM（结构化状态空间模型）之间存在数学联系，这为融合模式的实现奠定了基础。

　　据介绍，T1 的吐字速度能达到 60~80 token/s，在生成效果上远快于 DeepSeek R1。

　　此外，腾讯还表示，混元 T1 在多个公开数据集上的表现与 DeepSeek R1 和 OpenAI o1 相当或略胜一筹。在 MMLU-pro、CEval、AIME 和 Zebra Logic 等中英文知识和竞赛级数学、逻辑推理测试中，T1 已跻身顶级大模型行列。此外，T1 的基础模型 Turbo S 已在全球大模型竞技场中进入 TOP 15。

　　T1 正式版已在腾讯云面向 API 用户开放，输入价格为 1 元/百万 tokens，输出价格为 4 元/百万 tokens，约为 DeepSeek R1 标准时段价格的四分之一，接近 DeepSeek R1 优惠时段水平。

　　腾讯表示，T1 未来可能更多通过元宝和其他自家业务向C端用户开放。（袁宁）

腾讯T1登场：押注非transformer，速度、推理、价格全面对标DeepSeek

我们的产品

相关链接

关于我们

联系我们