再度跟风特斯拉,中国车企押注端到端

  来源丨创业邦(ID:ichuangyebang)

  作者丨潘磊

  编辑丨海腰

  图源丨 midjourney

  “今天 L4 公司都在痛苦地犹豫是否该转入端到端,我个人的建议是别犹豫,赶紧改,后面那个才是大家伙”。

  这是小鹏汽车董事长何小鹏,最近从美国考察游历一番后,对智驾进入“端到端时代”的最新判断。

  在大约两周前的小鹏汽车技术发布会上,何小鹏更是兴奋地宣布,2024 年就是智能驾驶的拐点。

  他认为,“大模型+端到端”已经把智驾能力进展从以前的按“年”计算,提升到按天计算。

  换句话说,这就是对智驾领域的一次洗牌,要么跟上,要么出局。

  何小鹏从特斯拉获得启发符合逻辑——事实上正是特斯拉 FSD 在去年率先搞出“端到端”技术方案,并把这个看上去晦涩难懂的术语变成了智驾圈的流行语。

  所谓“端到端”,就是把之前与自动驾驶有关的感知、决策和执行等相对分散的核心模块整合在一起,从传感器端输入信号开始,中间经历一个 AI 大模型,再到输出端发出信号控制车辆。

  这就及其考验那个能够搞定“感知决策执行一体化”的 AI 大模型的水平。

  作为一个“学习系统”,贯通感知决策执行的 AI 大模型,能够通过从传感器获得的原始数据中不断“学习”,并自动生成人们想要的那种结果输出。

  这被认为智能驾驶“拟人化”的开始。

  在特斯拉 FSD V12 版本之前,这种智驾系统拥有和其他同类系统差不多的通病——比如在复杂路况中,智驾系统突如其来的刹车会带来一种明显的“机械感”,从而让用户恐慌。

  但是到了引入端到端的 V12 版本后,这套系统看上去拥有了一些“博弈”能力,比如能够更加丝滑地应对加减速和转向控制。

  而在这之前,智驾系统每遇到一个场景,就需要工程师专门通过代码给出解决方案,然后才能搞定一个所谓的 Corner case。

  FSD V12 版本引入端到端后,相当于拥有了一定的自我学习能力,工程师无需再为无法预知、无法穷尽的 Corner case 逐个编写代码了,所以代码从 30 多万行缩减为仅有 3000 多行。

  何小鹏说,他相信 2025 年就将是完全自动驾驶的“ChatGPT 时刻”。

  中国车企早已开始跟风端到端

  “小鹏是全球唯二实现端到端大模型量产落地的车企”。

  在 7 月底的“小鹏汽车 AI 智驾技术发布会”上,何小鹏表示,“端到端大模型”让小鹏智驾技术进步实现了前所未有的加速。“每 2 天迭代一次版本”。

  此时距离小鹏汽车官宣智驾进入端到端时代仅 2 个月。

  但看上去,小鹏正在加速把智驾系统从“全国都能开”,进化成“全国都好用”,即不限城市、不限路线、不限路况。

  这是一个惊人的跃迁。

  因为在这之前,智驾系统的 PK,基本都是围绕“开城”来展开。

  “开城”的本质是,车企的智驾技术人员在目标城市完成场景数据收集和填充,然后“灌进”智驾系统,从而实现城市 NOA(领航辅助驾驶)。

  但这种高阶辅助驾驶上限很低,很难上升到 L3 或者更高级别。

  因为存在不少需要人类接管的场景,比如小区内部、收费站等。

  解决这类问题,就需要工程师根据特定场景写代码,从而解决所谓的 Corner case。

  显而易见,这种场景无穷无尽。

  何小鹏说,在这种规则下,智能驾驶再搞十年也看不到尽头。

  但引入端到端和大模型之后,这个瓶颈迎刃而解。

  小鹏为此调整了组织架构,以更加聚焦于端到端+大模型的组合。

  跟何小鹏的看法类似还有理想汽车董事长兼 CEO 李想。

  他在今年 6 月初的 2024 中国汽车重庆论坛上提出了一个问题,即人类开车为什么不涉及学习 Corner case?

  在他看来,如果不解决这个问题,那么自动驾驶团队每天干的活,就是靠人工去调试各种 Corner case,而且会发现你放的人越多,Corner case 就越多,距离实现真正的自动驾驶就越远。

  他给出的方案也是端到端加上 VLM 视觉语言模型,以及一个生成式世界模型组成的全新自动驾驶技术架构。

  李想表示,这是理想在过去一段时间内,最重要的一个技术突破。

  基于此,理想汽车将会在今年三季度向所有用户正式推送全国无图 NOA。

  他还相信,无监督的 L4 级自动驾驶至少 3 年内就能实现。

  理想也成立了“端到端自动驾驶”实体组织,据称整体规模超过 200 人。

  蔚来汽车也把感知和规控团队合并为大模型团队,探索用端到端和世界大模型实现高阶智能驾驶。

  梳理来看,这些变化都发生在今年年初特斯拉发布 FSD V12 版本之后,也意味着特斯拉率先引入的端到端大模型技术再次引领智驾新趋势。

  另外,华为在去年 9 月就发布了“盘古汽车大模型”,可在数字孪生空间生成复杂场景样本,让自动驾驶学习训练周期从 2 周以上缩短到 2 天内。

  再次陷入 Corner case 怪圈?

  特斯拉 FSD 的最新版本为中国车企提供了有关端到端和大模型的启示,实现自动驾驶的路径近在眼前。

  这让“摸着特斯拉的石头过河”,再次成为可能。

  但其中的问题在于,特斯拉究竟是如何做到这一点的,却是一个不传之秘。

  何小鹏坦承,大模型迭代过程中会出现“不稳定”现象。

  在 5 月份,他也提到了有关“端到端”的不确定性。

  他认为所有大模型上都有不确定因素,重要的是如何去构建你的控制器,就像控制刹车一样,构建针对黑盒的安全系统。

  看上去即便是端到端,也在进入一个更加复杂化,甚至是自我束缚的囚徒困境。

  这甚至已经从特斯拉 CEO 埃隆·马斯克处获得了证实。

  6 月中旬的特斯拉 2024 年年度股东大会上,马斯克承认 FSD 面临新的挑战。

  他称,改进一个模型可能解决一个问题,但同时可能引入一个新问题。

  看上去,这跟引入端到端之前的那种 Corner case 无法完全解决的情况很接近。

  而且随着人类接管的减少,评估模型性能的难度在增加。

  这是另一个悖论——接管减少表明性能优秀,但另一方面也表明随着模型变“大”,其更新也将会变慢,表现得不像一个能给自动驾驶带来颠覆性变革的路径。

  而最近公布的一个交通事故表明,特斯拉的一台车在开启 FSD 模式下撞死了一个摩托车手。

  就在 7 月底,Truist Securities 分析师威廉·斯坦因在体验特斯拉 FSD 时险些撞车。

  巧合的是,华为终端董事长、智能汽车解决方案 BU 董事长余承东近日也表示,FSD 上限挺高,但下限也很低。

  “华为工程师去测试(FSD),路上停着静止不动的白色货车或者绿色货车,都不减速直接撞过去了,可能识别成白云或者树木了”。

  这种情况被称为“AI 幻觉”,据称有 30% 的错误率。

  另外,前图森未来创始人,现 Bot.Auto 创始人侯晓迪近期也针对端到端,发表了一些不一样的观点。

  侯晓迪认为,端到端是一种新思路,但是否为最先进,目前尚无定论。

  同时,端到端的“技术黑盒”具有不可解释性,无法带来确定的安全感。

  基于此,端到端并非一个一头输入信息,另一头就能输出结果的“自动工厂”,还具有不确定性,不要过度神话。

  极越 CEO 夏一平则认为,现在还没有 100% 的端到端,都是营销噱头。

  端到端背后

  是包括算力在内的体系 PK

  根据马斯克的说法,预计今年年底将会在中国和欧洲落地 FSD。

  其实在这之前,有关 FSD 将会成为智驾领域“鲶鱼”的说法就已经层出不穷。

  但从中国主流车企对“端到端”的追随来看,FSD 已经开始对中国智驾的技术路线产生深远影响。

  这也再次验证了特斯拉的视觉方案更加接近“第一性原理”——正如李想所说,人类驾车就不涉及学习 Corner case 的问题。

  因为人眼就类似于传感器,大脑作为神经网络对接收到的信号进行推理判断后,做出反应并执行。

  车路云一体化,以及高精地图方案,也因此都有各自的短板。

  到目前为止,特斯拉还未使用激光雷达。

  对此余承东表示,特斯拉的优点在于车辆多、数据多,FSD 做的不错。

  但经过在美国和加拿大的测试对比后,他认为华为的体验略优一些。

  “特斯拉没用激光雷达,我们用了,弥补了感知能力”。

  目前华为备受关注的 ADS3.0 也是端到端“类人”智驾,采用的是 GOD 感知神经网络,以及 PDP (Prediction-Decision- Planning, 预测决策规控)决策规划网络,这被称为两段式端到端。

  跟特斯拉 FSD 输入传感器数据,直接输出路径规划的一个模型相比,华为的“两段式”端到端区分了感知和规控,更容易定位,从而增加了可解释性。

  但真正具有颠覆性的自动驾驶技术架构终局,就是生成式端到端大模型。

  这对于包括算力在内的基础设施来说,是一个极大的考验。

  对于特斯拉来说,逡巡多年才实现端到端多模块融合的背后,是其 DOJO 超算中心高达 35000 块英伟达 H100GPU 的算力资源。

  根据马斯克的说法,到今年年底特斯拉将拥有 8.5 万块英伟达 H100GPU 用于训练人工智能。

  换句话说,特斯拉 FSD 端到端的背后,是一个巨型体系在支撑。

  何小鹏表示,他已经在 AI 训练上投入了 35 亿费用。

  但作为对比,马斯克声称今年将花费 100 亿美元用于 AI 的训练和推理,光是向英伟达购买 AI 芯片就要花费 30--40 亿美元。

  他甚至表示,任何支出达不到每年 100 亿美元水平或者无法高效部署的公司,都无法在市场上竞争。

  按他的标准,没有任何一家中国车企能够跟特斯拉竞争。

  这很大程度上属于事实——中国车企甚至连 H100GPU 都无法买到。

  华为显然能够提供一些替代品,这也为未来的自动驾驶时代竞争提供了足够的悬念。