阶跃星辰开源新图生视频模型,性能登顶 VBench 评测榜

  3 月 20 日消息,阶跃星辰宣布开源全新图生视频模型 Step-Video-TI2V。

  该模型基于 30B 参数的 Step-Video-T2V 训练,可生成 102 帧、5 秒、540P 分辨率的视频。在图生视频权威基准测试 VBench-I2V 中,Step-Video-TI2V 达到 State-of-the-Art(SOTA)水平,综合表现位列榜首。

  Step-Video-TI2V 已与华为昇腾计算平台完成适配,用户可在阶跃 AI 的网页版、App 端及魔乐社区(Modelers)体验。

  根据阶跃星辰介绍,Step-Video-TI2V 具备运动幅度可控和镜头运动可控的特点。模型可平衡生成视频的动态性与稳定性,支持推拉、摇移、升降等电影级运镜效果。此外,模型具备特效生成能力,支持多种视频尺寸,尤其在动漫类任务中表现突出,适用于动画创作和短视频制作。

  据了解,这是阶跃星辰在一个月内开源的第三款 SOTA 级别多模态大模型。此前发布的 Step-Video-T2V(文生视频模型)和 Step-Audio(语音模型)均已被阿里云、火山引擎、天数智芯、LiblibAI 和 TCL 等生态厂商接入。(袁宁)