(图片来源:钛媒体 AGI 编辑林志佳拍摄)
2025 开年,行业领先的 AI 科学家加入阿里巴巴。
2 月 6 日消息,钛媒体 AGI 获悉,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案。
另有消息称,内部系统显示,许主洪目前的身份是管理层,base 在新加坡,根据汇报线关系,他的职级应该是 P10 或者 P11。
公开信息显示,许主洪在 AI 工业界和学术界拥有超 20 年经验,2002 年清华大学本科毕业后,许主洪分别在 2004 年和 2006 年获得香港中文大学计算机科学与工程系的硕士学位和博士学位。
许主洪曾在新加坡南洋理工大学、新加坡管理大学担任教授,也曾担任全球最大企业 CRM 软件厂商 Salesforce 集团副总裁、亚洲研究院创始院长,目前是新加坡管理大学(SMU)信息系统学院的终身教职。他发表的 300 余篇 AI 顶级学术论文,引用量超过 5 万余次。其发表的多篇“多模态预训练”主题论文影响力很大,论文引用数位列当年全球前五,其提出的预训练策略有效降低成本,深刻影响了全球大模型研发。
2019 年,许主洪当选代表全球科学与工程技术领域顶尖成就的 IEEE Fellow(电气和电子工程师协会会士),并被斯坦福大学评选为“全球前1% 的人工智能科学家”。
2023 年,许主洪创立 AI 初创公司 HyperGAI,开发出先进的多模态端侧大语言模型,推出了前沿的图像和视频生成模型及产品,最新的用于边缘和移动设备的开源轻量级多模态模型 HPT 1.5 Edge,其性能超越了微软 Phi-3-Vision (4B) 模型,并在多个基准测试中达到 GPT-4V 性能。目前暂不清楚 HyperGAI 是否已经被阿里收购。
针对近期 DeepSeek 热潮,许主洪发文表示,DeepSeek-R1 非常热门,但 LLM+RL(大语言模型+强化学习)框架的想法并不完全新颖。
“2022 年,我的 Salesforce AI 团队是提出 LLM + RL 联合训练和推理框架的先驱之一,这比 OpenAI O1 和 DeepSeek-R1 的工作早了几年。我们发表了一篇名为 CodeRL 的 NeurIPS 论文,该论文在代码生成方面实现了开源 SOTA,使用不到 1B 代码的 LLM 模型(击败了 10 倍大的模型)。我们的想法是应用与 AlphaGo/AlphaZero 类似的原理和方法,以自学的方式训练和改进 LLM,但基础 LLM 模型的大小和性能不够强(ChatGPT 尚未发布)。”许主洪称。
实际上,近期,阿里巴巴 AI To C 业务大动作频频,业务布局消息不断,引入世界级顶尖人才,组建顶级 AI 算法研究和工程团队。
目前,阿里巴巴“少壮派”高管吴嘉担任阿里巴巴智能信息事业群总裁,淘天用户平台事业部与阿里妈妈事业部负责人,兼任淘天集团淘宝直播及内容事业部负责人。同时,阿里旗下 AI 应用“通义”并入阿里智能信息事业群,天猫精灵团队与夸克产品团队融合工作,探索 AI 眼镜等新硬件方向。
许主洪的加入,大大提升阿里巴巴 AI 应用C端产品在模型结合应用的端对端闭环能力上的跃迁。同时,阿里 AI To C 业务正在组建顶级 AI 算法研究和工程团队,吸引大量业内优秀人才加盟。
钛媒体 AGI 了解到,目前已经有多位微软亚洲研究院的 AI 科学家正在与阿里接触,有望近日对外公布加入信息。
当前在 DeepSeek 和字节的猛攻下,阿里正在对 AI To C 加码人才与资源投入,而且正在全面整合阿里内部 AI 资源,对阿里 AI To C 在多模态 Agents 以及商业化等方向进行深入探索,也为下一阶段构建面向用户的 AI 应用平台打开了想象空间。
(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)