1 月 20 日, Founder Park 发布了与生数科技 Vidu 产品负责人廖谦的对话内容。
在采访中,廖谦表示,他们内部有对于 AI 视频生成发展关键里程碑节点的推断,称为多模态大模型发展的「奇点时刻」,主要从生成速度、叙事能力、多模态能力三个维度来评判,根据不同实现程度,分为几个等级,类似于自动驾驶划分的六个等级,来判断目前多模态大模型发展程度和阶段。
他认为,未来多模态模型的终极形态是三个维度都达到我们定义的高标级别,到那时会催生出一种全新的内容平台,实时的、可交互的、纯粹个性化的。
此外,廖谦还表示,在多模态上,Vidu 目前还是单视频模态。今年会有融合音频模态的产品出来。
廖谦在采访中还提出,重视 AI Native,不如解决用户本质问题。他认为不管是不是 AI,关键在于解决用户使用场景的本质问题,这样企业才能存活下来,并且发展得更好。至于是不是用 AI,真没那么重要。