衡宇发自凹非寺
量子位公众号 QbitAI
国内创业头部公司的“大模型五虎”格局,正在发生变化。
一家低调后发但又快速突进的公司,正在以更大势能来到台前。
阶跃星辰,总部位于上海的 AI 大模型公司,微软前全球副总裁姜大昕创办,在自研大模型、应用产品先后亮相后,正在获得更大的认可,垒起更大的雪球。
量子位获悉,在最新的投融资市场中,阶跃成为新宠儿,正在进行一轮估值 20 亿美元的新融资。
有意思的是,阿里巴巴再次出现在布局传闻中。
而在阶跃此前的几轮投资者名单中,可以看到启明、五源等一线 VC 的身影。
大模型五虎,是此前业内对国产大模型头部创业公司独角兽的阶段性代称,它们分别是智谱、月之暗面、零一万物、百川智能、MiniMax,共有五家。
现在,随着阶跃星辰强势崛起,这个统称或许要换个说法了。
今后的国产基座大模型创业场上,或许值得关注的不再只有五虎,而是六小强。
(有更好的称呼建议,欢迎评论区留言)
技术产品双线发力
阶跃星辰露面很晚。
2023 年就已经创立的它,直到今年 3 月底才正式对外亮相。
不过在迄今为止的 3 个月里,这家国产大模型创企在技术和产品方面,都在积极秀肌肉。
并且表明了自己通往 AGI 的长期路线:
单模态—多模态—多模态理解和生成的统一—世界模型—AGI。
Step 系列通用大模型
伴随阶跃星辰亮相的,还有该公司开发的三款大模型。
- Step-1 千亿参数语言大模型
- Step-1V 千亿参数多模态大模型
- Step-2 万亿参数 MoE 语言大模型
其中,千亿参数大模型 Step-1耗时 2 个月训练成功,综合性能超过 GPT-3.5。
再 2 个月后,也就是去年 11 月,千亿参数的多模态大模型 Step-1V又告成。Step-1V 大模型可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。
此外,它还能理解视频中的内容。
今年 3 月,阶跃星辰在国产初创大模型公司中,第一个公开了自家的万亿参数模型 Step-2,背后采用 MoE 技术。
两款 toC 产品
阶跃星辰至今公开的 toC 产品共两款,均对所有用户开放。
一款叫跃问,聊天类应用,定位个人效率助手。
能上传外部文档,有联网、信息检索能力,拥有多模态能力,可以在输出中进行图表总结。
目前可在网页端和 App 免费使用。
另一款叫冒泡鸭,是 AI 开放世界平台,提供海量智能体,主打一个休闲娱乐。
感兴趣的朋友可以自己去体验一下,这里不赘述了。
此外,量子位近期跟大家分享的大模型原生应用头号玩家之《我把大模型玩坏了》,也由阶跃星辰提供大模型技术支持。
△论企鹅的一万种画法
从微软系走出的创业团队
最后,我们再简单回顾一下阶跃星辰的主要带队人。
CEO姜大昕,同时也是团队算法负责人。
从纽约布法罗州纽约州立大学计算机科学博士毕业后,姜大昕先后任南洋理工大学担任助理教授,MSRA(微软亚研院)研究员。
2011 年开始,他转入微软亚洲互联网工程院(STCA)工作,在 2023 年 3 月升任为微软副总裁,同时兼任亚洲软件技术中心 WebXT S+D(网络体验、搜索和分销)集团总经理。
但人生处处是舞台。
微软副总裁姜大昕很快有了投身大模型创业的想法,并且说干就干。
阶跃星辰的数据负责人焦斌星,就是同姜大昕一起离开微软出来创业的。
焦斌星是中科大和 MSRA 联合培养博士,毕业后就成为了微软的一份子,后来成长为微软必应引擎核心搜索团队前负责人。
其日常工作,主要是利用数据挖掘和 NLP 算法优化索引和搜索质量。
公开资料显示,他还曾开发全球高质量站点的自动挖掘算法,并用于索引和排序。
朱亦博是核心团队的另外一位成员,他现任阶跃星辰系统负责人。
从美国加州大学圣芭芭拉分校毕业后,他加入微软,后又跳槽到字节跳动、Google,在大规模系统和万卡集群方面有很多实践经验。
可以说,阶跃星辰三位核心骨干的经历十分相似,就是第一阶段(博士期间)进行相关研究,第二阶段进入大厂在 AI 一线打拼。
更明显的是,他们都从微软走出,组成了一支微软系创业队伍。
就在不久前,微软资深首席研究员段楠也被曝光离开 MSRA,加入阶跃星辰。
更多有志之士的加入,不知能否让大模型六小强的你争我赶更加白热化?
最新消息,OpenAI 从昨日晚间起陆续给不少开发者发去邮件,表示:
将于 7 月 9 日起采取额外措施,停止来自不在其支持的国家、地区名单上的 API 使用。
还好咱有国产大模型能用……
大模型六小强,要继续加油鸭!