商汤发布首个“可控”人物视频生成大模型Vimi

  7 月 4 日,世界人工智能大会(WAIC 2024)在上海召开,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型 Vimi 亮相。据介绍,Vimi 仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。