随着汽车进入“AI 驱动”的时代,不止各大品牌新车拼智能,出行平台也在布局面向智驾产业的“自动驾驶工具链”。
这是今年在广州车展中展示的一个特别现象。
上周举行的广州车展上,国内“Robotaxi 第一股”如祺出行发布了基于其自动驾驶运营优势和自动驾驶数据解决方案构建的“数据闭环飞轮”。
其中包括了众源地图技术路线,4D 标注工具及平台等方面的细节。
当大部分的出行平台还在路上“跑车”,如祺出行已经跑出了 Robotaxi、跑进了自动驾驶的深水区——数据驱动。
这是国内第一次有出行公司对外发布数据闭环解决方案。
为什么一个出行公司,要去打造自动驾驶的“数据闭环”?
低成本、高质量数据是自动驾驶竞争核心
自动驾驶中的数据闭环,是指算法研发由 case-driven 转向 data-driven 的核心步骤。
自动驾驶和数据闭环结合在一起成为一大解决方案,主要原因是自动驾驶的算法和模块是数据驱动的——自动驾驶工程已经被认可是一个解决数据分布“长尾问题”的任务,时而出现的 corner case(极端情况)是对数据驱动的算法模型进行升级的根源之一。其次,源源不断的数据需要有合理有效的方法去利用。
过去几年,自动驾驶数据闭环已从过去“从无到有”,发展到现在及未来“从有到精”。
在全球,不少车企、自动驾驶技术及人工智能公司,在针对智驾解决方案时,都有针对数据闭环的设计。比如:
Tesla
下图是 Tesla 的 Autopilot 数据引擎框架:确认模型误差、数据标注和清洗、模型训练和重新部署。
Waymo
相较于 Tesla,谷歌 Waymo 的数据闭环平台引入了数据挖掘、主动学习、自动标注等模块,但基本的框架相差无几。获得数据来源后,通过数据标注获得数据真值,其中涉及到数据筛选、挖掘和主动学习,模型优化完成测试后,进行发布或部署。
英伟达
英伟达在自动驾驶开发建立的机器学习平台 MAGLEV,是基于闭环的模型迭代:其中有 smart 的数据选择、数据标注、模型搜索、训练、评估、调试和部署。
如祺出行
如祺出行的数据闭环,则是“嵌入”在包括智驾流程内。基于出行服务运营的基础,数据闭环覆盖了智驾领域从数据采集、标注、存储、管理到应用全流程,包括众源地图解决方案、4D 标注工具等技术及解决方案,涉及环境感知、路线规划、行为决策、控制等各个领域,是智驾技术工具链的核心环节。
行业内普遍认为,完备的闭环模型需要大规模、高质量、多场景的数据,高算力、高效率、相对低成本的算法模型,趋向自动化的数据标注与处理水平,高速率、低成本的传输速率与存储模式,再加上合规性的要求,数据质量和规模直接影响到了车的智力水平。如何高效低成本的获得高质量的数据集成为了自动驾驶企业的核心竞争力。
出行平台凭什么做好“数据闭环”?
如祺出行正在切入的数据闭环,一个很重要的优势在于其作为出行平台、基于运营优势实现的“低成本及规模化数据”的优势,以及未来对于合规数据应用的预期。
假如技术路径及合规路径都“跑通”,基于高质量及低成本规模化数据优势,出行平台的自动驾驶数据解决方案将可能成为车企、自动驾驶技术公司的“必争之地”。
2024 广州车展上,如祺出行 CEO 蒋华称,出行平台切入数据闭环的重要优势是基于其运营优势实现的“低成本规模化数据”。
当全球自动驾驶技术公司发展挺过了上半场之后,发现在 L4 级自动驾驶商业化过程中,需要和车企合作,还要和出行服务平台合作。
当自动驾驶进入“端到端和大模型”时代,技术互补和生态合作正变得越发重要。通过比较地平线、如祺出行、文远知行、黑芝麻智能等近期上市的智驾科技公司招股书可见,除了像特斯拉的“单打独斗”模式外,自动驾驶在国内有了车企、出行平台及技术公司的生态“加持”,其商业化落地进程在全球具备领先竞争力。
其中,在出行平台方面,滴滴市占率为国内第一,如祺出行在大湾区用户渗透率超过 45%,它们都已有自动驾驶技术商业化落地场景及路测数据。更为重要的是,这些国内最早涉猎自动驾驶赛道的出行公司,已有了在 Robotaxi 商业化落地的经验和成果。
Robotaxi 是 L4 级别自动驾驶商业化落地的最好选择。由于端到端大模型的上车,自动驾驶技术正从规则驱动转向数据驱动。L4 Robotaxi 离不开数据闭环能力,数据与算力将成为企业新的核心竞争力和壁垒。
对于自动驾驶企业来说,要想在各种竞争中崭露头角,当下最重要的是提升规模化水平。
一方面,提升运营车辆的数量,尽快实现规模经济,有望早日实现盈亏平衡。车辆的采购成本、维修成本、运营管理成本等会随着规模扩大而降低,这对于业务的可持续发展至关重要。另一方面,规模化也有利于提升服务质量。Robotaxi 有赖于大量数据训练,更多的车辆和更长的运营总时长,意味着更多的数据来源,有利于提高自动驾驶的智能化水平,并且优化调度算法,进一步提高运营效率。
以如祺出行为例。根据公开信息,截至 2024 年 10 月,如祺接入运营的 Robotaxi 已超过 280 辆,自营 Robotaxi 车队规模超过 50 辆,服务已运营累计超过 30000 小时,覆盖 1800 余个站点,完成近 900000 公里安全运营里程。如祺也是目前 Robotaxi 唯一进驻南沙、前海、横琴等三个粤港澳重大合作平台提供服务的出行平台。
在如祺这套自动驾驶数据解决方案中,众源地图技术将地图更新的重心从传统的中心化绘制方式转移到了车辆感知的分布式上传,车辆在行驶过程中收集道路信息并上传至云端,在云端完成地图绘制,实现低成本、高实时性、轻量级、高度自动化。
同时,如祺众源地图技术还首次探索基于历史预测结果的在线矢量地图构建方案,能够高效利用历史信息解决遮挡问题,并提升检测精度。该项研究成果已被全球计算机视觉及机器学习领域知名学术会议 WACV 2025 直接接收,具体包括首次使用历史帧预测表征进行时序建模、首次提出双模式训练策略、将训练阶段的辅助一对多匹配机制优化为 group-wise 版本等。
而在数据标注方面,如祺出行称,已形成稳定、高效的生产能力,月标注产能在 50 万帧以上,其 4D 标注解决方案则是在传统 3D 静态标注的基础上增加了时间维度,通过云端大模型实现路面要素高度自动化标注,拥有目标跟踪标注、叠帧时序标注等一系列效率工具,较传统静态标注可以节省 60% 的人工标注成本。
相关分析指,全球 Robotaxi 服务有望在 2026 年左右实现商业化,中国预计将成为全球最大的 Robotaxi 服务市场,市场规模预计在 2025 年达到 2 亿美元,2030 年达到 390 亿美元,约占全球 Robotaxi 服务市场份额的一半以上。根据 《智能汽车行业专题报告》预测,自运营与聚合型模式或为 Robotaxi 中长期竞争力玩家。
谁在用这些出行平台的数据解决方案?
自动驾驶数据闭环驱动商业闭环已成为行业共识。
但一个有趣的现象是,同样是自动驾驶赛道上的科技公司,出行平台的“数据闭环”业务,对车企和自动驾驶技术公司来说似乎不是敌人,而是“朋友”。
翻阅如祺出行的主要股东结构发现,广汽集团、滴滴自动驾驶、文远知行、小马智行等是其主要股东。
对车企来说,自动驾驶能力将重新构筑车企竞争壁垒,数据和算力将成为核心竞争要素,头部车企或供应商能掌握更多更优的“数据”,以及更强更快的“算力”,而优秀的智驾能力有望加强销量转化。同时在开展安全、高效的 Robotaxi 业务时,车企需要出行平台“协助”打造数据闭环工具链,打造能够满足端到端大模型的自动驾驶工具链。
2024 年 6 月,广汽集团成为全国首批获准开展 L3 自动驾驶上路通行试点的车企之一,如祺出行作为该试点智能网联汽车使用主体,也是全国首批获准试点的出行科技平台。
小鹏汽车董事长何小鹏曾经提到,基于“端到端”大模型积累的原始数据,进而构建的闭环能力、体系能力,是真正决定一家车企能否在 AI 竞争淘汰赛中存活的关键。
此外行业内观点普遍认为,从特斯拉的路径看来,Robotaxi 的推出将有望加强 L4 自动驾驶的商业变现能力,反哺自动驾驶技术路线实现规模化的路测数据。
Momenta CEO 曹旭东此前在接受采访时曾表示,L4 Robotaxi 要实现 10 倍人类的安全性,要解决数百万个长尾问题,依靠规则控制很难实现这个目标,一定要数据驱动,数据驱动是可以自动化地解决绝大部分的问题。
“需要的数据量非常惊人,至少需要千亿公里的数据,家用车乘用车一年的里程大概一万公里,千亿公里需要一千万辆车跑一年的时间,才能够达到千亿公里的里程,而且这是实现规模化 L4 的必要条件。”曹旭东说。
关于未来在推进 Robotaxi 商业化路径,市场预期行业将逐步形成由“车企+自动驾驶企业+运营商”形成的三方合作模式——
自动驾驶企业提供 Robotaxi 的软硬件解决方案,OEM 负责整车的量产,而运营商则提供服务场景、高质量数据服务。
自动驾驶数据闭环方案将成为中国新能源汽车发展的标配,而孰优孰劣,市场销量将给出最终的评判。