大模型同时颠覆着自动驾驶底层技术,百度发现基于BEV的感知大模型正在以吞食天地的速度快速消灭过去多个零散组合式的小模型,带来理解、生成、推理、记忆等核心能力的突破,从而形成完整的一站式的大感知模型,让智驾超越经验系统,更聪明处理复杂场景,实现更广泛的时空覆盖——大模型正重构着智能汽车生态。
在百度智能汽车领域集团资深副总裁、智能驾驶事业群组总裁李震宇看来,大模型对智能汽车行业的重构主要体现在以下三个方面。
第一,语言大模型上车,人车交互方式会从“命令式”升级到“对话式”。第二,通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及。第三,未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。
近年来关于智能驾驶的讨论多聚焦在传感器、激光雷达、智能芯片等硬件配置上,这些也一度成为车型的销售噱头,但是消费端对这些智能硬件的感知并不强,正如百度智能驾驶事业群组智能汽车业务部总经理苏坦所言:“我们常常会感觉到有一些时代还没有到来。”