切换城市:北京
更多应用 |
官方:微博/微信
| 车展 | 专题 | 车商通 | 商用车

凤凰网汽车

凤凰网汽车>全媒体>正文

特斯拉AI Day:自动驾驶的“模拟训练”和马斯克的“醉翁之意”

2021年08月20日 18:12:01
分享到:
来源:汽车头条

和预期基本一致,这场延后近40分钟的特斯拉AI Day集中讲述了三部分内容:自动驾驶视觉路线、DOJO+D1芯片以及Tesla Bot人形机器人。

最后一点几乎与现阶段无关,依照特斯拉规划,Tesla Bot机器人原型机在2022年才能够推出,而如今便早早地把故事开头讲出来,似乎也迎合了有关“稳住投资人”的猜测。

视觉+算法,构建数据标签

相比“星球大战”的科幻,特斯拉有关自动驾驶视觉路线的矢量分析、贴标及模拟计算则更加贴近现实。此前,在自动驾驶感知路线的选择上,纯视觉与视觉雷达融合的两种方案,形成了特斯拉与其他车企的最大不同。

特斯拉的观念来看,“用眼睛开车”能够将硬件成本拉低,但随之而来的,则是通过大量人工智能的计算、分析手段去解决车辆行驶中的种种问题。雷达数据的缺失使软件处理难度呈几何倍上升。感知层面的硬件简化,带来的也将是感知系统升级和执行层的复杂计算。

尽管这是一种最贴近人类的解决方案,但不同的是,在摄像头的视角中,我们所感叹的大千世界,呈现出的只有各式各样的像素集合。因此,在判别方式上,摄像头需要分析像素间的联系,并通过贴标的方式,将其集合成便于后续驾驶决策的物体。

为了避免影像畸变、画幅呈现不足等多种问题,特斯拉从原有的2D图像标记升级为空间+时间的4D矢量标签。

目前,特斯拉车身装配有8枚摄像头,以每秒36帧的频率,1280*960分辨率12bit HDR图像的清晰标准,将周围物体整合并通过时间轨迹区分静态、动态及物体边界,并利用包括多头路线、相机校准、缓存、队列和优化等方法来简化神经网络计算。

无论是长度巨大的半挂卡车,还是边界被遮挡的街边路口,通过多角度图像呈现、数据分析、Transformer距离预测算法以及不同特征的叠加、覆盖,特斯拉建立起了庞大的街景标签,为后续计算提供良好的感知分析。

现阶段,特斯拉已针对10亿张不同图像和3亿张不同场景进行数据贴标,但对于完全无人驾驶来说,这些标签量还远远不够。

为了应对如此庞大的数据,特斯拉表示,公司目前拥有一支 1000 人的数据标签队伍,与工程师一起工作,打造了完全定制化的数据标签和分析架构。同时,伴随效率的不断升高,特斯拉已经实现对同一条路进行多次数据收集,抹去曾经红黄颜色组成的“边界框”,把环境场景拆分成点云,上传至云端,形成了接近于“高精地图”的实测环境场景。

D1芯片加入,促进自动驾驶“模拟训练”

自动驾驶更大的难题,在于如何应对极其复杂的路况。常态化的采集能够带来标签库的快速建立,可面对实际行驶过程中多变的气候环境、行人车辆动态,仅仅依靠工程师的路测还远远不够。“我们的数据标识来源自模拟图像,我们需要一些极端情况,人类路测工程师收集很难,因此采用不同的3D道路模拟场景收集相关数据。”

依靠短片记录驾驶场景,特斯拉每周能够获得1万段类似的恶劣环境短片,通过自动标签最终实现精准的距离感知。

此外,凭借Autopilot仿真测试,电脑能够精确标注、部署虚拟的车辆、行人,并倒入各类天气环境及不同场景,通过大规模的模拟训练,实现“计算机训练”自动驾驶的目的。

目前,经过特斯拉车内网络训练的图像共有3.71亿张,形成了4.8亿个标签。未来,除了人、车等动态物体,特斯拉还将检测静态物体、道路拓扑、更多车辆和行人以及强化学习,而这些上亿次的训练工程,则将在DOJO超级计算中心和D1 芯片的成功研发生产之下,得以顺利进行。

据了解,D1芯片采用了台积电7nm工艺,处理能力为 362 TFLOPs 。单一芯片内部带宽达到10TB/s,芯片外带宽也高达4TB/s 。

25个单体芯片能够拼装成为一个芯片组,直接在一个圆晶上光刻,使芯片群接口速度达到36 TB/s,处理能力高达 9 PFLOPs 。这也意味着,不仅全新芯片群的延迟率显著降低,计算能力也远超市场现有产品,甚至只需要几十个这样的芯片群,就能达到目前顶尖超算能力。

理论而言,120个D1芯片群组成服务器机柜,其算力将超过1.1 EFLOPS,是与行业内的其它产品相比,性能提升4倍,能效比提升1.3倍,空间缩小5倍。

毫秒级高效决策,驾驶感受趋紧平滑

反复的模拟训练和实际道路数据采集、系统训练,拓展了车辆决策层的计算、选择空间。特斯拉自动驾驶软件总监Ashok Elluswamy表示,特斯拉采用混合决策系统,首先让感知数据通过向量空间的粗搜索,然后经过连续优化,最后能够形成平滑的运动轨迹。

比如,经过一个包含左转、直行、超车等多种其他驾驶车辆的十字路口时,车辆拥有减速提早变线、加速推迟变线、停车等候让行等多种决策方式可供选择,但如何依据当前路况,选择更优的驾驶方案,则需要依赖coarse search(粗搜索)实现。

在1.5毫秒内,特斯拉可进行2500次变道时机搜索,并通过众多备选项得出相对的smooth trajectory(平滑轨迹),最终使车辆在兼顾舒适与安全的基础上及时采取变道措施。

在另一个案例中,车辆处在一个仅能满足“单车宽度”通过的狭窄路段“双向来车”的场景。首先,面对对向来车主动让行,特斯拉判断减速继续前行,而后对于再度出现的另一辆对向来车,特斯拉选择避让停车同时,对向车辆同样选择了停车避让,因此,特斯拉果断改变了驾驶决策,再次起步通过了这一路段。

这些特殊路段的行驶当中,特斯拉的决策、规划都更加倾向于实际人类驾驶,而最终目的,也是通过快速的路径选择、驾驶决策,在保障行驶速度的同时,为使用者提供更加安全、顺滑产品优化。

比较而言,特斯拉无论在感知还是决策层面,都与目前其他自动驾驶企业所呈现的产品拉开了一定距离,但回归感知路线的选择来看,缺乏高精地图、激光雷达等硬件设备,这样的神经计算网络优势能够持续多久,未来车辆驾驶能力能否真正实现对人类的超越,这些仍然是特斯拉将要解决的问题,也是其能否持续保持领先地位的关键。

当然,马斯克的关注点或许并不在此,身处特斯拉技术的高速成长期,如何“吸引人才”、“给予市场投资信心”,似乎才是此次AI Day最为关键的意义之所。

  • 凤凰网汽车公众号

    搜索:autoifeng

  •  官方微博

    @ 凤凰网汽车

  •  报价小程序

    搜索:风车价

网友评论
0人点赞
|
评论0
加载中...

大家都在看

趣图推荐