90后阿里大模型大佬,离职创业

  文融中财经

  最新消息,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职。

  周畅原是通义实验室算法团队的核心技术骨干之一,此次属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云 CTO 周靖人。周畅为“通义千问”的大模型负责人。

  根据个人履历,周畅于 2012 年本科毕业于复旦计算机科学与技术专业,2017 年博士毕业于北京大学计算机软件与理论专业,而后加入阿里巴巴。他先后在达摩院任职算法专家,再到通义千问的大模型负责人。其专攻领域为深度学习、图挖掘和分布式计算,他在机器学习、数据挖掘、数据库领域国际顶级会议上发表 30 余篇文章。值得一提的是,根据多方媒体报道,周畅已确定要创业,剑指 AI。只不过具体方向尚未得知。有意思的是,目前网上有多位猎头传出的消息称,周畅此次创业已经获得多位投资人的青睐。这其中还包括阿里巴巴吴妈吴泳铭旗下的元璟资本。

  目前并没有关于周畅的具体信息,但根据其 2012 年本科毕业来推算,周畅大概为一名 90 后。

  这位与“通义大模型家族”的辉煌历程紧密相连的 90 后迎来转身时刻。或将从阿里巴巴集团 AI 技术瑰宝化身为 90 后 AI 创业大军中的一份子。后续的故事发展如何十分令人期待。

  阿里通义大模型的中流砥柱

  如今再翻看周畅的领英账号,发现上面仍显示其为阿里巴巴资深算法专家。

  根据资料显示,周畅于 2017 年 7 月加入了阿里巴巴,曾任达摩院智能计算实验室高级算法专家。在加入阿里期间,周畅的学术研究收获硕果累累,论文被各大顶会收录,谷歌学术被引 8000+。

  与此同时,周畅在达摩院期间在多个项目中发挥了重要作用,如研发超大规模商品图表征算法 APP、用户表征框架 ATRank、基于自监督对比学习的向量召回算法 CLRec 系列等。

  加入阿里巴巴后周畅还亲眼见证了阿里大模型的发展,并且是其发展过程中的重要推动者。

  2020-2021 年间,他带领团队设计并实现了超大规模的多模态预训练模型 M6,在参数数量和低碳训练模式上取得了突破。据阿里云当时介绍,M6 模型参数规模高达 1000 亿,是多模态预训练领域史上最大的模型。在阿里云关于 M6 模型发布的推送下,周畅曾留言称:"欢迎广大英才加入我们的团队继续这项工作!"

  从某种程度上来说,这款 M6 模型正是如今大众所熟悉的阿里通义大模型前身。

  到今年,国内 AI 行业已过萌芽期,基础大模型格局已经形成。像智谱 AI、Minimax、月之暗面、百川智能等创业公司涌现。腾讯、百度、字节跳动等大厂也纷纷入局,当然这其中自然少不了阿里巴巴。

  以周畅 M6 为前身的阿里通义大模型最早于 2023 年 4 月推出,并邀请用户测试体验。作为“阿里版 GPT”,通义千问具有多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。

  在“通义千问”面世 4 天后,张勇宣布,未来阿里巴巴旗下所有产品都将接入通义千问。此外阿里云还表示,将面向公众开放通义千问的能力,帮助企业打造专属大模型。

  到 2023 年底,ugging Face 最新发布的开源大模型排行榜上,“通义千问”(Qwen-72B)取得了令人瞩目的成绩,以 73.6 的综合得分在所有预训练模型中排名第一。通义千问的表现超越了 Llama 2-70B 以及众多商用闭源模型,一举成为业界最强的开源大模型。

  据悉,这个排行榜被公认为是大模型领域最具权威性的榜单,汇集了来自世界各地的上百个开源大模型,并通过六大评测维度进行综合评价,包括阅读理解、逻辑推理、数学计算、事实问答等。也就是在这份备受瞩目的排行榜上,阿里凸显了集团在人工智能领域的技术实力,也表明了中国科技企业在大模型研发方面的领先地位。

  2024 年 5 月 9 日,通义大模型发布一周年之际,阿里云正式发布通义千问 2.5,模型性能全面赶超 GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问 1100 亿参数开源模型在多个基准测评收获最佳成绩,超越 Llama-3-70B,成为全球开源领域最强大模型。

  在这个大模型群雄并起,互相内卷的时代里,阿里巴巴靠着通义千问交出了一份优异答卷。而在这份答卷的背后,毫无疑问周畅是重要的见证者与亲历者。

  2022 年时,中国电子学会公布“2021 中国电子学会科学技术奖”名单,其中浙江大学、达摩院、阿里云完成的“超大规模高性能图神经网络计算平台及其应用”获得科技进步一等奖,主要完成人里面就包括杨红霞、周靖人和周畅等。有意思的是,杨红霞早已于 2022 年离职并进行创业,而如今周畅也将离职进行下场创业。

  高产大牛下海 AI 创业

  相似的一幕正在国内 AI 界持续上演。2022 年 ChatGPT 的推出让 AIGC 爆火,吸引来无数优秀创业者瞄准此赛道进行创业。不少像周畅这样的大厂骨干选手被曝单飞创业,AI 界的创业热潮正在如火如荼地进行中。

  此前,融中财经采访了 AI 营销公司奥创光年。截至目前,该公司已经完成三轮融资,投资机构中包括万物资本、真格基金、凯辉基金、美图等。

  根据采访中,市场部 VP 任一总透露的消息,在 2023 年,奥创光年客户签约合同金额增幅超 300%,破亿元。同时,奥创光年已成功服务过如阿里巴巴、百事、欧莱雅和联合利华、庄臣等上百余家一线品牌集团及电商平台,众多客户仍处于年框合作或续约合作阶段,并不断扩大合作深度与规模。对于一家 AI 初创公司来说,这样的业绩实属不易。

  值得一提的是,奥创光年的两位创始人徐哲和杨海此前就是阿里巴巴的工作人员。二人在阿里巴巴相识,并先后离开阿里巴巴各奔前程,在不同的领域闯出了一片天地。对于一个打工人来讲,彼时他们二人已经站在了各自事业的顶峰上。

  之后的二人在调研了 100 家企业的一号位,发掘行业痛点,最后决定投身于 AI 创业,成立了现在的奥创光年。徐哲和杨海也成为了从大厂高管向 AI 创业者身份的完美转变。

  而像周畅、徐哲、杨海同类型的 AI 创业者还有很多。

  前不久的 7 月 16 日,百度研究院副院长,百度认知计算实验室主任李平离职,创立 Ai Infra 公司 vecml,并担任 CEO。据百度百科资料,李平 2007 年博士毕业于斯坦福大学,获得统计学博士学位,计算机科学硕士学位和电子工程硕士学位。博士毕业后,李平曾在康奈尔大学和罗格斯大学任教,并于 2013 年成为计算机系和统计系终身教授。2017 年底,李平以杰出科学家(T10)加入百度美研,成为百度研究院大数据实验室负责人。2018 年,李平晋升为 T11,大数据实验室改名为认知计算实验室。

  根据媒体报道,在百度期间,李平和团队在深度学习算法、知识图谱和信息抽取、基于图的近似近邻检索和最大内积检索、树模型、哈希算法和近似近邻检索(ANN)算法、机器学习基础理论与方法、推荐和 LTR 技术、自然语言,大数据,和数据挖掘等方向发表了多篇国际顶会论文,并同百度凤巢广告,Feed 流,搜索,百度知道,输入法,百度地图等多个团队展开深入合作,把研究成果应用于各项产品,产出显著效果,并能从实际问题中发展新的研究方向和课题。而他创立的公司 vecml 则是致力于下一代大模型应用,构建一个成本更低、更加安全、准确性更高的 AI 基础设施。

  同样是在前不久,被称作“AI 教母”李飞飞创立的 World Labs 也有新消息,已突破 10 亿美元估值,不到 4 个月成为新晋独角兽;还有前蚂蚁集团副总裁漆远,其创业方向也被揭秘,产学研并行创立大模型公司无限光年,被曝剑指“可信大模型”;辞去亚马逊首席科学家一职的李沐,创建了 Boson.ai,目前也已经推出了首个大模型成果。

  这样类似的消息不止是在国内发生,像国外的科技巨头如谷歌、微软、Open AI 都有内部工程师下海进行 AI 创业的消息传出。比如 Open AI 和特斯拉的 AI 部门主管卡帕西在近期官宣创业,创立了一家 AI 原生的新型学校 Eureka Labs。

  在当今快速发展的科技时代,人工智能 AI 已成为推动各行各业创新的关键力量。随着 AI 技术的成熟,市场对于 AI 专业人才的需求激增,这为高管们提供了一个展示自己才华和实现个人价值的平台。在大厂中,他们可能已经达到了打工人的巅峰,但创业可以为他们提供更大的舞台。

  而相比于无经历的直接创业者们,在大厂当高管的经历让他们无论是技术还是商业运营上都积累了一定经验,对于“路子”也有了一定的了解,这也让他们在创业的路上走的得心应手一些。

  随着这些大佬的纷纷加入,风云变幻的 AI 界也增添了一些新的可能。

  AI 产业新时代即将来临

  人工智能的热潮史无前例。前不久的中国互联网大会上,一组组亮眼数据得到公布。

  目前我国共 421 家国家级的智能制造示范工厂、万余家省级的数字化车间和智能工厂、超过 4500 家的人工智能企业……中国信息通信研究院公布的数据显示,在人工智能领域,2023 年我国人工智能产业应用进程持续推进,核心产业规模达到 5784 亿元。而在行业投融资方面,2023 中国 AI 行业已发生投融资事件 815 起,融资总额达 2631 亿元,融资金额比去年上升了 51%。

  正在持续爆火的人工智能也引发了业界专家们的下一步思考。过去的几十年里,人工智能技术已经从实验室的深奥理论走向了现实世界的广泛应用。这一转变不仅仅是技术的进步,更是商业模式、工作方式乃至生活方式的彻底革新。随着机器学习、深度学习等技术的成熟,见证了人工智能如何在医疗、金融、教育、制造业等多个行业中找到其价值的实际落地点。

  如今,人工智能正大步走向“应用”,即将催生新一轮的 AI 产业变革。

  此前,摩尔线程产学院执行院长及投融资部总经理罗文勇在融中 2024 新质生产力创新企业峰会上表示:“现在的 AI 成了最大的应用场景,就像 20 年前的移动互联网,可以赋能千行百业。”

  举例来说,实体经济是国家立身之本是众所周知的道理,其中制造业是实体经济的关键。此前国家多次发布政策强调提升制造业的发展质量,以创新驱动发展,加快人工智能等数字技术赋能,全面促进产业升级,催生新模式、新功能的诞生,实现制造业的快速增长。科技部等六部门发布《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,鼓励在制造等重点行业深入挖掘人工智能技术应用场景,促进智能经济高端高效发展;另一方面,《“十四五”智能制造发展规划》等政策强调,加强关键核心技术攻关,研发人工智能、5G、大数据、边缘计算等在工业领域的适用性技术,增强融合发展新动能。

  作为国内 AI 企业的龙头之一的商汤此前也提供了许多内部的例子。比如针对“老年人难以使用金融 APP”这一问题,商汤科技和上海银行联手开发了金融大模型,后端金融大模型学习了四千款大模型产品,针对老年人提的各种复杂问题做解答。前端交互做了 4K 超写实数字人,就像线下大堂经理、理财顾问一样,给老年人非常好的专业服务与聊天对话,获得市场好评。

  技术是推动社会创新的源泉,这是毋庸置疑的真理。极佳科技合伙人、工程副总裁毛继明也明确表示过:“人工智能作为一个技术,一定要完成应用场景落地,一定要为各行各业进行产业升级提供支撑才能发挥其应有的价值。同时,在 AI 技术与场景结合的过程中,领域数据与经验也会完成下沉,反哺 AI 技术底座,令其得到快速进化。技术与场景应用,两者会相互促进相互推动,产生飞轮效应,这也是企业拥有持续竞争力的重要手段之一。”

  AI 的发展进入新时代,同时以周畅为例的精英们集体涌入 AI 创业,他们又会在在新的发展逻辑下讲述出什么新故事呢?