凤凰网汽车

凤凰网汽车>全媒体>正文

千挂科技叶璨：大模型深度赋能干线物流，端到端落地奇点将至丨GADS 2023

2024年01月11日 17:46:01

分享到：

来源：车东西

作者｜明成

编辑｜志豪

车东西1月10日消息，日前，2023全球自动驾驶峰会（GADS 2023）上，多位自动驾驶行业大咖都在演讲中提到了自动驾驶大模型，探讨了自动驾驶大模型的发展现状和应用前景。

在上午的主会场上，千挂科技联合创始人叶璨博士发表了题为《商用车智能驾驶的落地实践与技术新趋势》的主题演讲。他以自动驾驶卡车为切入点，介绍了干线物流场景下自动驾驶技术的最新实践进展，并分享千挂科技团队在BEV感知、前融合、视觉语言大模型、端到端自动驾驶等方向的最新进展。

叶璨博士提出，干线物流行业市场规模巨大，司机成本占比高且行业未来将面临卡车司机人数不足等问题。所以，干线物流行业智能化升级完成对人力的替代，这是刚需问题。

千挂科技瞄准跨经济圈之间的长途干线物流运输，他们希望通过自动驾驶技术大幅度降低司机的疲劳度，把单司机的日均驾驶里程从600公里提升到1000公里以上，这样能在长途作业中把两个司机减到一个司机，从而实现传统物流5倍以上的利润率。

为了实现这样的愿景，千挂科技进行了大量自动驾驶技术实践。叶璨博士介绍，感知技术方面，千挂科技通过多模态、多传感器的前融合，以及多帧的时序融合，基于一个感知大模型（One Model）完成各种感知相关的子任务，如障碍物识别（检测/分割）、路网元素识别等，从而实现对各种复杂路况的感知。通过硬件和算法确保感知距离达到300~500米。自动驾驶的障碍物预测则采用Scene-centric架构，对所有的agents统一建模，简化建模的流程，大幅提升训练和推理的效率。

此外，千挂科技还通过视觉语言模型和多模态预训练，让AD系统可以更好地识别长尾物体（异形车、遗撒物等），提高对驾驶场景的理解和泛化能力。

叶璨博士还提到，端到端已经成为智能驾驶领域一个新的技术趋势，千挂科技近期在端到端方向上进行了集中突破，于近期完成了第一代自研端到端算法AutraFlow的研发，并在北京周边的公开路段进行了上车测试。

至于为什么要做端到端，以及端到端技术对AD的意义，叶璨博士提到几点，“首先端到端算法能大幅提升数据利用的规模和效率，传统AD研发中，由于依赖工程师通过人工规则完成对数据的总结提炼，效率低，且泛化性差，只有通过算法实现对数据进行自动化总结，才能把成百上千倍的数据利用起来。第二，全面learning化，让模型取代规则，才能打破AD泛化性的瓶颈。第三，传统AD中，不同模块都在关注优化各自的代理指标，端到端技术能够实现多模块甚至全链路的联合优化。”

“千挂科技的目标是让端到端的算法能够实际上车跑起来，并在产品、业务当中用起来。” 叶璨博士在演讲最后说道。

千挂科技瞄准了干线物流这一自动驾驶应用前景广泛的市场，在感知预测和智驾大模型方面有了大量技术实践，更是推出了端到端的自动驾驶算法，可以说是走在了自动驾驶行业发展的最前线。在千挂科技的努力下，干线物流行业将迎来新变化，单司机日行千里或许将成为现实。

一、干线物流市场巨大自动驾驶应用前景广阔

在自动驾驶在物流市场应用前景方面，叶璨博士提到，目前干线物流行业涵盖700万台重卡，对应的市场规模达到4.6万亿，司机成本达到20%~30%。而且，现在干线物流行业司机数量正在减少，预计2030年卡车司机缺口可能达到10%以上。因此，干线物流行业里面，通过智能化升级完成对人力的部分替代是刚需问题。

孚能科技携手<a href= 江铃全球首款钠电池车型下线">

▲现场图片

基于这样的背景，千挂科技提出了他们的目标。叶璨博士表示，千挂科技瞄准跨经济圈之间的长途干线物流运输，比如北京到上海，上海到广州，这种路线的路程一般在1000公里以上，由两个司机轮替完成驾驶作业，而千挂的核心目标是在长途干线场景实现双驾变单驾。千挂科技希望通过自动驾驶技术大幅度降低司机的疲劳度，把司机日均驾驶里程从600公里提升到1000公里以上，让单个司机也可以完成驾驶作业。

叶璨博士提到，如果能够实现干线物流的双驾变单驾，未来可以实现传统物流5倍以上的利润。

在实践方面，叶璨博士提到，千挂科技的车辆已经在京沪线上实现单司机驾驶车辆往返，第一天北京到上海，第二天上海回北京，往返2400公里，全程高速无接管。

同时，千挂科技也在加速推进商业化落地，量产方面，千挂科技此前与东风柳汽签订了智能驾驶牵引车前装量产合作协议；此外，自2023年上半年起，千挂科技的车辆正式开启智能驾驶干线物流运输的常态化运营，跑通了以“北京—上海”及“武汉—广州”等多条核心高速干线线路，为顺丰等合作伙伴提供物流运输服务。

二、高速场景长尾问题涌现 大模型助力感知效率提升

除了市场和应用之外，叶璨博士在会上重点分享了千挂科技在自动驾驶技术上的努力和成果。

叶璨博士提到，高速场景难点来自于各类异形车、遗撒物，以及复杂路况（如施工区域、事故）等。这对自动驾驶的感知层面带来了很大的挑战。在技术上，千挂科技通过一个大模型完成了所有的感知任务。

在感知过程中，通过多传感器收集的点云和图像被输入到一个大模型中进行感知识别。多传感器数据，如点云、图像等，经过网络编码后获得相关特征，并通过模型实现空间融合和时序融合，获得时空融合的特征。基于时空融合的特征，下游可以完成各种感知相关的子任务，包括障碍物的检测和分割、路网元素识别（如车道线/可行驶区域）等。

孚能科技携手<a href= 江铃全球首款钠电池车型下线">

▲千挂科技远距离感知方案

在硬件层面，为了保证感知距离达到300-500米，千挂科技采用了远距离LiDAR和Camera进行前融合，300米以外则依靠纯视觉完成感知任务。

在障碍物预测方面，千挂科技采用了Scene-centric架构，通过特征编码和解码对障碍物的轨迹进行预测。相比传统架构，这种新的架构统一建模了所有的障碍物agents，简化了建模流程，提升了训练和推理效率。

三、大模型提高智驾泛化推理能力 端到端算法上车进行时

除了现有的感知方案之外，叶璨博士提到，大语言模型的本质是通过Transformer这种结构，把海量互联网数据压缩到大语言模型的参数中，因而大模型涵盖了互联网数据中所对应的通用知识，即world knowledge，这正是当前AD系统所缺乏的。这种通用知识能为自动驾驶系统带来两点核心能力，泛化和推理。其中，泛化是指通用物体识别能力，如对长尾物体的识别、以及对场景的高级别理解，推理能力则包括任务的拆解、规划能力。

在智驾大模型方面，千挂科技还研发了多模态预训练技术，目标是在互联网海量数据和通用知识的基础上，通过融合自动驾驶场景下的多模态数据，得到泛化性更强的特征，以提升对长尾物体的识别能力。具体讲，多模态预训练能实现文本、图像和点云等模态在特征空间层面的对齐，基于文本对齐的多模态特征，为下游的多种感知任务提供基础，如异形车、遗撒物的识别。

孚能科技携手<a href= 江铃全球首款钠电池车型下线">

▲智驾数据闭环

此外，叶璨博士还提到，大模型在千挂的数据闭环中起到核心作用。通过对路测数据进行挖掘，大模型可以帮助发现高价值的长尾数据，如异形车、遗撒物等。大模型的另一个作用是自动化标注，在千挂，95%以上的模型训练数据由大模型自动化标注得到。此外，通过对大模型进行压缩，并部署路测，可以收集更多路测数据，实现模型的进一步迭代和优化。

在端到端方向上，千挂科技取得了重要进展。叶璨博士指出，千挂科技研发的端到端算法AutraFlow，是一个完全Learning化的架构，整个系统可以看作是一个大的神经网络，在训练时可以实现多模块的联合优化。千挂科技的目标是让端到端的算法能够在车上跑起来，并在产品和业务当中用起来。目前千挂科技正在进行路测实践，这套端到端算法正在被搬到卡车上。

结语：自动驾驶助力干线物流行业降本增效

千挂科技不仅在干线物流市场上进行了大量自动驾驶实践，更在自动驾驶感知预测、大模型、端到端等方面有了大量技术研发储备和积累，可以说，在千挂科技的努力下，自动驾驶将更深度赋能干线物流行业，助力干线物流行业降本增效，为行业参与者带来更多的利润。