国思软件 - 揭秘快手可灵背后的「关键7人」

　　衡宇发自凹非寺

　　量子位公众号 QbitAI

　　国内风头最盛的 AI 视频团队是哪家？

　　毫无疑问，快手可灵。

　　发布一个月，体验用户超 30 万，生成 700+ 万条短视频，开放网页 Web 端。哪怕这样，可灵还是一号难求，想上手体验的急得嗷嗷的。

　　而比可灵本身更神秘、更令人好奇的，是缔造出这款中国版 Sora 的背后团队。

　　量子位全网搜索，根据公开资料，发现了可灵团队来自清华、中科大、港科大、浙大、港中文、上海交大、南京大学等的“关键七人”。

　　整合梳理后，与可灵团队强相关的关键七人阵容大体如下：

盖坤（于越）快手高级副总裁、快手主站业务和社区科学负责人；清华博士，第一批“阿里星”。
张迪：快手副总裁、快手大模型团队负责人。
万鹏飞：快手视觉生成与互动中心负责人；中国科学技术大学和香港科技大学校友。
王鑫涛：快手视觉生成与互动中心高级研究员，领导视觉内容生成，特别是视频生成方面的工作；浙江大学和香港中文大学 MMLab 校友，师从汤晓鸥。
Xin Tao：快手科技视觉生成组（又名可灵团队）高级研究员和技术负责人；上海交大和香港中文大学校友，师从贾佳亚。
Haotian Yang：快手可灵团队成员；南京大学校友。
Yuan Gao：快手可灵团队成员。

　　若有知情小伙伴愿意提供更多信息，帮助量子位进行更正或补充，请随时在后台与我们联系。

　　快手可灵背后的 ta 们

　　盖坤（于越）

　　盖坤，博士毕业于清华大学，研究方向是识别与智能系统。

　　现任快手高级副总裁、快手科技经营管理委员会成员、商业生态委员会成员，担任主站线业务负责人并兼任社区科学线业务负责人。

　　2011 年，盖坤以第一批“阿里星”的身份，加入阿里工作，花名靖世。

　　阿里星是阿里一直“暗藏”的顶尖校招技术人才项目，坊间传闻，每年能最终拿下阿里星 Offer 的不过寥寥数人（约占当年校招总数<0.3%）。

　　以及在外界的八卦中，最吸引人的还是“阿里星年薪上不封顶”这一条。

　　盖坤主要是在阿里妈妈做广告算法，负责竞争展示广告技术，以及其他跟 AI 相关的部分。

　　进入阿里工作后，盖坤提出了分片线性模型 MLR，极大地提高了 CTR 预估的准确性，被外界称为“算法天才”。

　　2016 年，他搭建出深度兴趣网络，以此对广告点击率进行预测。

　　2017 年，他又和团队推出能预测用户点击偏好的新模型“深层用户网络兴趣分布”，更精准地为用户推荐商品。

　　离职前，盖坤的最后 title 为阿里妈妈精准展示广告技术总监，职级 P10。

　　2020 年，盖坤悄然跳槽，加入快手。

　　他以“于越”这个花名亮相，担任高级副总裁，同时也是快手科技经营管理委员会和商业生态委员会的成员。

　　去年 1 月旬，快手发布原 CTO 陈定佳离职的公告，接任者为盖坤和另一高级副总于冰，分别承担此前 CTO 的相关管理职责，向 CEO 程一笑负责。

　　此后，盖坤一并担任主站线业务负责人并兼任社区科学线业务负责人。

　　今年 WAIC 上，可灵大模型的新版本新功能，就是由盖坤出席发布。

　　张迪

　　张迪，现任快手技术副总裁、快手多媒体与大模型部负责人。

　　他作为快手多媒体与大模型部负责人的任命发生在去年初。

　　彼时，快手启动 AI 新战略，于是作为技术副总裁的张迪披挂上阵，担任大模型研发团队负责人，聚焦大模型、视觉生成模型和多模态模型等方向。

　　今年 5 月，张迪和盖坤等参与的《Parrot: Enhancing Multi-Turn Instruction Following for Large Language Models》入选顶会 ACL2024。

　　万鹏飞

　　万鹏飞，本科毕业于中国科学技术大学 EEIS 系，后拿下香港科技大学博士。

　　其专注的技术方向包括图像/视频/3D AIGC、XR 与数字人、Mobile/Efficient AI 等。

　　现为快手视觉生成与互动中心负责人，快手可灵视频生成模型负责人，向张迪汇报。

　　在担任现有职务前，他长期担任快手Y-tech AI 技术中心负责人，牵头了快手数字人系列解决方案。

　　致力于通过计算机视觉、图形学、机器学习、人机交互等领域的交叉，为各业务线提供智能化的多模态内容创作和互动体验解决方案。

　　今年 1 月，他参与外界活动的 title 仍然是这个；但刚结束的 WAIC 上，他以可灵视频生成模型负责人身份亮相。

　　公开资料显示，在 2020 年加入快手前，万鹏飞曾任美图影像实验室 MTlab 负责人。

　　王鑫涛

　　王鑫涛，本科毕业于浙江大学，后在香港中文大学 MMLab（多媒体实验室）攻读博士学位，师从汤晓鸥。

　　Google Scholar 页面显示，王鑫涛的论文被引次数为 14406。

　　2020 年博士毕业后，王鑫涛的第一站来到了腾讯，做视觉生成（图像、视频、3D）相关的研究工作

　　具体来说，他分别在腾讯 AI 实验室和腾讯 ARC 实验室担任高级研究员。

　　5 月，王鑫涛在知乎发布文章，表示自己“最近来到了快手”，目前是快手科技 KwaiVGI 的高级研究员，部门隶属于快手多模型与 AIGC 部门。

　　现在，王鑫涛负责领导视觉内容生成，特别是视频生成方面的工作。

　　Xin Tao

　　Xin Tao，毕业于上海交通大学，后来又在香港中文大学计算机科学与工程系拿下博士学位，是港中文终身教授、IEEE 会士贾佳亚的学生。

　　现在是快手科技视觉生成组（即可灵团队）的高级研究员和技术负责人。

　　他的研究兴趣包括视觉修复和生成。

　　读博前，他先后在 Adobe 创意技术实验室、腾讯优图实验室当过研究实习生。

　　2018 年博士毕业后，他正式加入腾讯优图实验室，任高级研究员。

　　2020 年年底，Xin Tao 加入快手，在视频处理和分析组、Y-tech 混合现实团队都呆过一段时间，负责牵头实用视频编辑算法的研究和技术转让，以及用于直播的 2D 数字人综合系统。

　　加入可灵团队后，Xin Tao 专注于高效视频生成和编辑系统的研究和部署。

　　Haotian Yang

　　Haotian Yang，快手可灵团队成员。

　　毕业于南京大学，曾在 IEEE、AAAI 等顶会上发布论文。

　　2023 年前后，Haotian Yang 加入快手。

　　One More Thing

　　眼尖的小伙伴们应该已经发现了，还有一位叫 Yuan Gao 的同学没有进行详细介绍。

　　真相只有一个：

　　除合著论文外，暂时未能收集到 Yuan Gao 同学的更多信息。

　　要不大家老说呢，技术人才们总是喜欢蛰伏水下，默默搞个大新闻……

　　就挺遗憾的！

　　希望了解相关情况的朋友们来后台留言，量子位会一直关注 Yuan Gao 和可灵团队的新动态新进展，及时与大家共享学习。

　　另外，梳理过程中挂一漏万，如果有其它可灵团队同学的信息，欢迎大家补充~

　　参考链接：

　　[1]https://arxiv.org/abs/2406.04277

　　[2]https://scholar.google.com.hk/citations?user=FQgZpQoAAAAJ&hl=en

　　[3]https://scholar.google.com/citations?user=PXO4ygEAAAAJ&hl=zh-CN

　　[4]https://www.xtao.website/

　　[5]https://scholar.google.com/citations?user=LH71RGkAAAAJ&hl=en

　　— 完 —

揭秘快手可灵背后的「关键7人」

我们的产品

相关链接

关于我们

联系我们