我们不是价格屠夫,我们拿出比较有诚意的价格,是因为更想卷品质、卷体验。此次还为首任车主提供整车终身质保,为开启智能辅助驾驶的用户赠送了300万保额的保险,就是为了让用户更好体验到我们的产品。
Q2:关于L2强标,ID. ERA 9X做了哪些准备?如何体现企业技术实力?
陶海龙(上汽大众汽车有限公司党委书记 总经理):国家在智能驾驶领域出台了多项强标,背后有其深刻原因。智能辅助驾驶是新事物,去年智能辅助驾驶出现多起安全事故,涉及到安全甚至生命这种高度,智能辅助驾驶会出台更多标准。甚至有车主和企业家在高速公路上完全脱手、甚至睡觉的视频,上半年行业还在讨论脱手率,强调零接管率或者无接管率、接管里程等一系列指标。

我始终强调,上汽大众把安全放在第一位,从不追求用这类例子宣传我们的智能辅助驾驶能力,我们希望给用户更多的可靠和安全。我们讲的是“人机共驾”,确保车辆的绝对安全。
到目前为止,无论是什么品牌都无法保证完全不需要人接管,但我们必须保证的是,在接管或者出现安全状况的情况下,要保证绝对的安全和人能够接管。大众在智能辅助驾驶安全方面始终走在国家标准前面,甚至我们很多标准参与了中汽中心和工信部的讨论。如果今年强标出台,会影响一定体验感,离手检测和提醒会更加频繁,本质上是从安全出发。此前行业内部分产品在这方面曾受到市场关注,法规一出,那些可以长时间脱手驾驶的竞品就不行了,大家会回归到一个公平的评价维度。
我们强调的是智能辅助驾驶的综合能力。我们与Momenta深度融合,结合产品能力和双方团队对汽车、对智能辅助驾驶的理解,做了大量协同开发,我们的产品一定处于智能辅助驾驶国内第一梯队。
曹旭东(Momenta CEO):目前搭载的R6系统,在国家强标测试中已取得非常好的成绩。R7是强化学习世界模型,万中无一的极限场景是怎么模拟出来的?这离不开与上汽大众团队的深度合作:除了每个月一次的极限场景,陶总团队每月都会找出一些魔鬼路线让我们做路测,冬测时还会专门寻找极限场景。还有一些冰雪的极限情况,虽然东北电车用户不多,但依旧要保障这部分用户的安全,比如东北冬季的团雾,南方很少见,但安全隐患很大。R7因为对物理世界的理解更深刻,处理这类场景时会更加安全。
Q3:R7强化学习世界模型的优势是什么?Momenta在L4自动驾驶方面准备到什么程度?
曹旭东:R7采用强化学习世界模型,兼具强化学习和世界模型的双重优势。世界模型通过对未来的预测,将物理世界规律压缩到模型中,对长尾的万中无一场景有更强的理解和预判能力,能做到更加安全。同时,世界模型还可以作为“练兵场”进行闭环强化学习,将各种极端场景进行千次万次演练,挑选出最优解并形成肌肉记忆,在真实极限场景下靠肌肉记忆做出最优驾驶行为。这就是R7物理AI上车非常大的优势。
在L4自动驾驶方面,R7将在今年年中更新到运营的Robotaxi上,在上海已获得无人Robotaxi运营牌照并开始小规模运营。R7上车后,Robotaxi会有更快发展。同时,将L4级别的R7用到量产车上,一定会让用户更加安全。
Q4:市场非常卷,合资企业承压很大。第一,与其他合资品牌相比,上汽大众的差异化竞争力在哪里?第二,在同类9系产品众多的情况下,大众9X凭什么让消费者选择?第三,有没有经过验证的、有效的营销打法?
陶海龙:昨天我看了很多竞品,9系产品很多。今天早上有人跟我说,外国同行反馈,很多展台的车型外观设计同质化严重,前盖、叶子板、车身侧面及立柱的尺寸处理高度相似,甚至换标后也难以区分——这说明很多产品缺乏差异化,高度同质化。我们的造型在市场上具有相对独特性,目前没有看到与我们相似的车型,符合"大气、稳重又不失前卫"的风格。
第二,差异化的技术能力。比如黄金增程系统,我们的宣传数据是真实的——无论是东北零下30度低温、吐鲁番高温,还是高原工况,所有数据都可以实地验证,媒体老师可以自己去体验。特别是在亏电状态下的加速性能、最高车速,以及亏电加速时的NVH表现,这都是我们绝对的差异化优势。
驾驶能力和操控方面,我经常带着开发团队做竞品对标。从内饰、外饰到底盘驾驶性能,都完整评价过。我们的发动机启动时,你根本不知道它已经启动了,以及自动驾驶指令执行时的“人车合一”感,这些就具有很大的差异性。
此外,生产制造工艺的一致性、强大的供应链整合能力和质量管理能力,这些都是大众要坚守的。在如此激烈的竞争环境下,这些是我们的护城河。
Q5:有车企提出直接跨越到L4,怎么看?R7与高线束激光雷达智驾能力的对比情况如何?R7上有没有做针对特定场景的专属优化小模型?在与大众合作过程中,安全标准与技术激进之间如何平衡,有没有可以分享的故事?
曹旭东:关于L3和L4,L2++和L3听起来差距不大,但实际上差距巨大;而L3和L4的差距反而没那么大。因为按照定义,L3和L4都是车承担责任。我们在设计L3系统时,并不是为了L3而设计L3,而是同时考虑L4和L3的整体系统,这个系统一定能通过软件快速升级到L4。一旦L3法规和用户习惯成熟,可能一到三年内,产品形态就会从L3升级到L4。以中国市场的速度和竞争烈度,一家升级后,所有玩家都会快速跟进。我们前瞻性布局L3,本质上就是布局L4。
另外一个,R7的传感器非常高的线数,这个肯定是有帮助的。但行业里越来越多逐渐形成一个共识,就是数据和算法这是最重要的,排第一梯队。唯有这两个因素是有可能把整个体验每年十倍的提升,可能提升一百倍一千倍,甚至更多,实现大幅度的超越,这是最重要的两个因素。当然支撑这两个最重要的因素,你的算力是需要达到必要条件的,随着模型的增大,算力也需要持续增加。若按重要性排序,算力处于第二梯队。第三档是传感器。现在传感器已经够用,举个例子,比如11个摄像头的覆盖度已经超过了人双眼,更高分辨率的相机和激光雷达,这是锦上添花的。毫无疑问,这是关于传感器的问题。
再后面回到您的问题,关于专属优化小模型。我们现在已经没有小模型了,全都变成大模型了。Momenta 2024年实现端到端,2025年实现强化学习的大模型,现在是强化学习的世界模型。今天发布会上看到惊艳的表现,比如苹果落地的场景,并不是识别这个箱子,再识别这个箱子里有几个苹果,苹果怎么滚落的。因为人开车的时候第一反应不是识别哪个苹果,就是整体的场景的理解和条件式的反应。所以我们强化学习世界模型在理解这个场景上,非常像人的理解和像人的预判。它结合预判,以及预判之后最优的响应。世界模型你可以认为是练兵场,强化学习你可以认为是教练,在练兵场反复练习以后形成最优行为的肌肉记忆,这是我们R7具备的能力。
首先,你要训练世界模型一定要海量的量产数据,不然的话这个有点像大语言模型,如果大语言模型只用专家数据,不可能学到所有互联网数字的知识。所以一定需要非常海量的量产数据,而且要有万中无一的长尾数据。这也是我们的优势,我们有百亿公里的数据,其中有一亿长尾黄金数据。但大模型需要对齐(Post-training),就是让它的驾驶行为和人的行为预期相匹配,这时候需要专家数据,有不同的驾驶风格。所以我们的强化学习世界模型未来会推出不同的驾驶风格,就是在Post-training有的专家有不同的驾驶风格,有的专家是礼宾司机型驾驶风格,而有的像运动型驾驶风格,未来也会推出这样的驾驶风格,有不同的专家调教不同的驾驶风格。

