2 月 27 日,腾讯混元自研的快思考模型 Turbo S 正式发布。
据官方介绍,区别于 Deepseek R1、混元 T1 等需要「想一下再回复」的慢思考模型,混元 Turbo S 能够实现「秒回」,吐字速度提升一倍,首字时延降低 44%,同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S 部署成本也大幅下降。
具体来看,在业界通用的多个公开 Benchmark 上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5 等业界领先模型的效果表现。同时通过长短思维链融合,腾讯混元 Turbo S 在保持文科类问题快思考体验的同时,基于混元 T1 模型合成的长思维链数据,显著改进了理科推理能力。
架构方面,通过创新性地采用了 Hybrid-Mamba-Transformer 融合模式,混元 Turbo S 有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。
目前,腾讯混元 Turbo S 模型已在腾讯云官网上架,开发者和企业用户可以通过 API 调用,同时将逐步在腾讯元宝灰度上线。腾讯混元还表示,正式版的混元 T1 模型 API 也即将上线,对外提供接入服务。