你的浏览器版本过低,可能导致网站不能正常访问!为了您能正常使用网站功能,请使用这些浏览器。
chrome
Firefox
当前位置:易车> 极越01引擎摘要> 摘要详情

极越01引擎

极越01引擎

摘要来自:《极越AI DAY 2024,让大模型在智能汽车上卷起来》

【易车摘要频道】下列精选内容摘自于《极越AI DAY 2024,让大模型在智能汽车上卷起来》的片段:

与此同时,王亮还表示:“基于大模型,百度打造了行业第一的智驾数据生产线、LLM赋能的自动驾驶数据索引,与此同时,通过生成式AI技术,百度也具备高效处理长尾数据的能力,这些都是推动端到端自动驾驶技术发展的重要数据引擎。”

关于智能驾驶地图,由于极越提出了“有百度地图的地方就能使用PPA”,所以对驾驶地图的覆盖率就很高。不过对于大部分自研智驾系统的车企来说,最大的问题是没有办法实现高精地图的全国覆盖,这也使得“开城率”始终无法大幅度提升。

但是百度作为既做自动驾驶又做地图的企业,它采用了百度地图LD地图(LD即车道级导航)来实现自动驾驶的普及。

而其原理同样是“大模型”技术,只是这次是利用自动驾驶视觉感知大模型生成自动驾驶原生地图,彻底重构了传统的地图生成模式——实现端到端地图生成新范式,突破了车道级地图规模化的瓶颈。

据百度副总裁尚国斌介绍,百度LD地图可看作是为自动驾驶而生,对传统高精地图的要素、精度等最小化的要求,保留最必需的要素和精度;同时,增加了经验图层、安全图层、实时图层等传统高精地图不具备的要素,让自动驾驶场景更安全。

这里面的数据是通过百度自己的地图采集车、智能网联汽车、路侧感知设备等等收集高质量的地图数据,然后利用大模型去检测、理解、追踪和建图,最终完成地图的生产。所以,百度现在基本上一天就可以完成一座城市的LD地图生成,现在已经完成了360座城市的覆盖。而且LD地图不仅仅是极越01的智驾可以用,实际上在手机端也能够看到百度LD地图的应用,这也意味着能够手机显示LD地图的城市就可以用极越PPA。

在语音交互层面,百度语音首席架构师贾磊展示百度最新的视频语音融合、多合一、端侧大模型,这可以让车机在任何网络环境下,都能快速响应用户交互需求并解答车辆相关操作的问题,给用户带来端侧完美的语音交互体验,而且这些都将在极越上升级。

车载端侧语音大模型SMILTA2-PTM是一个2B-20B参数量的模型,成为了业内首个解决语音识别大模型建模难题,可以很好地布置在车辆端侧。另外还有车载端侧文本大模型,可以更好地解决车相关问题本地直接响应;车书、车控、百科等车相关任务LLM-AGENT高度端侧运行,整个语音交互过程1秒内给出答案。

此外,贾磊还展示了可以将现在的多音区信号分离方案升级为多音区波束识别方案的新技术,同时还有视觉语音融合的多模态交互技术。后者相当于是将唇动信息和语音识别结合起来,这样可以在高噪音环境下更清晰识别、在开放环境时更好的实现免唤醒、保护隐私等等。

“视觉语音融合的多模态交互技术让复杂场景交互从错误率90%提升到正确率90%!”贾磊强调。

那么上面提到的百度AI大模型距离我们实际使用场景还远吗?

对此,极越CEO夏一平预告,极越V2.0版本即将发布,届时将升级全新的语音大模型、全国都能开的PPA智驾等重磅功能。而这些功能都是使用到了上面介绍的百度AI大模型,并且随着大模型的使用,极越提出的“每个月开新车”的OTA月月升级的诺言也将离落地越来越近。

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司    购车咨询:4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外