其中,数据是最关键的因素。算力和算法可以用技术手段去解决,只有数据,需要长时间积累才能获得。而关于数据,有一个问题已经形成了行业共识,就是如何获取高质量数据。
科大讯飞智能汽车副总经理李卫兵曾表示,目前判别式大模型的决策无论是基于场景还是规划,都是基于人类的先验意识,很难具有类人的自主进化,也就是说自主性较差。毫末智行的数据智能科学家贺翔也认为,想要收集到高精度可用数据是比较难的。
大模型的意义就在于能够通过大量的数据采集,实现车辆智驾的不断进化,不断完善,最终的意义是能达到“车人合一”的效果,即每辆车的智能驾驶习惯是跟随驾驶员的实际驾驶习惯衍生过来的。
这就出现了一个问题,能够解释为什么好的数据非常难采集。打个比方,如果需要智能驾驶能够达到代替人驾驶的效果,智能驾驶要基于基本的驾驶逻辑,先制定出一套安全的驾驶习惯,在这个基础上,再逐渐通过数据,自学习人类的驾驶习惯。但问题是,高质量的数据并不是每位驾驶员在驾驶中都能提供给车辆用以自学习的。比如在辅助驾驶过程中,遇到需要接管车辆的问题,每个人对车辆的操作意识都不一样,这就意味着如果驾驶者是个新手,很可能自己就会出现错误的驾驶判断,这样车辆收集到的驾驶指令也会是错误的,也就形成了一个低质量数据。所以大模型自学习的核心要求是需要人类能有高质量的驾驶习惯。