三言科技 1 月 29 日消息,大年初一,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型。
Qwen2.5-Max 模型是阿里云通义团队对 MoE 模型的最新探索成果,预训练数据超过 20 万亿 tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源 MoE 模型以及最大的开源稠密模型。
三言科技 1 月 29 日消息,大年初一,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型。
Qwen2.5-Max 模型是阿里云通义团队对 MoE 模型的最新探索成果,预训练数据超过 20 万亿 tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源 MoE 模型以及最大的开源稠密模型。