凤凰网汽车

凤凰网汽车>全媒体>正文

特斯拉AI Day：自动驾驶的“模拟训练”和马斯克的“醉翁之意”

2021年08月20日 18:12:01

分享到：

来源：汽车头条

和预期基本一致，这场延后近40分钟的特斯拉AI Day集中讲述了三部分内容：自动驾驶视觉路线、DOJO+D1芯片以及Tesla Bot人形机器人。

最后一点几乎与现阶段无关，依照特斯拉规划，Tesla Bot机器人原型机在2022年才能够推出，而如今便早早地把故事开头讲出来，似乎也迎合了有关“稳住投资人”的猜测。

视觉+算法，构建数据标签

相比“星球大战”的科幻，特斯拉有关自动驾驶视觉路线的矢量分析、贴标及模拟计算则更加贴近现实。此前，在自动驾驶感知路线的选择上，纯视觉与视觉雷达融合的两种方案，形成了特斯拉与其他车企的最大不同。

从特斯拉的观念来看，“用眼睛开车”能够将硬件成本拉低，但随之而来的，则是通过大量人工智能的计算、分析手段去解决车辆行驶中的种种问题。雷达数据的缺失使软件处理难度呈几何倍上升。感知层面的硬件简化，带来的也将是感知系统升级和执行层的复杂计算。

尽管这是一种最贴近人类的解决方案，但不同的是，在摄像头的视角中，我们所感叹的大千世界，呈现出的只有各式各样的像素集合。因此，在判别方式上，摄像头需要分析像素间的联系，并通过贴标的方式，将其集合成便于后续驾驶决策的物体。

为了避免影像畸变、画幅呈现不足等多种问题，特斯拉从原有的2D图像标记升级为空间+时间的4D矢量标签。

目前，特斯拉车身装配有8枚摄像头，以每秒36帧的频率，1280*960分辨率12bit HDR图像的清晰标准，将周围物体整合并通过时间轨迹区分静态、动态及物体边界，并利用包括多头路线、相机校准、缓存、队列和优化等方法来简化神经网络计算。

无论是长度巨大的半挂卡车，还是边界被遮挡的街边路口，通过多角度图像呈现、数据分析、Transformer距离预测算法以及不同特征的叠加、覆盖，特斯拉建立起了庞大的街景标签，为后续计算提供良好的感知分析。

现阶段，特斯拉已针对10亿张不同图像和3亿张不同场景进行数据贴标，但对于完全无人驾驶来说，这些标签量还远远不够。

为了应对如此庞大的数据，特斯拉表示，公司目前拥有一支 1000 人的数据标签队伍，与工程师一起工作，打造了完全定制化的数据标签和分析架构。同时，伴随效率的不断升高，特斯拉已经实现对同一条路进行多次数据收集，抹去曾经红黄颜色组成的“边界框”，把环境场景拆分成点云，上传至云端，形成了接近于“高精地图”的实测环境场景。

D1芯片加入，促进自动驾驶“模拟训练”

自动驾驶更大的难题，在于如何应对极其复杂的路况。常态化的采集能够带来标签库的快速建立，可面对实际行驶过程中多变的气候环境、行人车辆动态，仅仅依靠工程师的路测还远远不够。“我们的数据标识来源自模拟图像，我们需要一些极端情况，人类路测工程师收集很难，因此采用不同的3D道路模拟场景收集相关数据。”

依靠短片记录驾驶场景，特斯拉每周能够获得1万段类似的恶劣环境短片，通过自动标签最终实现精准的距离感知。

此外，凭借Autopilot仿真测试，电脑能够精确标注、部署虚拟的车辆、行人，并倒入各类天气环境及不同场景，通过大规模的模拟训练，实现“计算机训练”自动驾驶的目的。

目前，经过特斯拉车内网络训练的图像共有3.71亿张，形成了4.8亿个标签。未来，除了人、车等动态物体，特斯拉还将检测静态物体、道路拓扑、更多车辆和行人以及强化学习，而这些上亿次的训练工程，则将在DOJO超级计算中心和D1 芯片的成功研发生产之下，得以顺利进行。

据了解，D1芯片采用了台积电7nm工艺，处理能力为 362 TFLOPs 。单一芯片内部带宽达到10TB/s，芯片外带宽也高达4TB/s 。

25个单体芯片能够拼装成为一个芯片组，直接在一个圆晶上光刻，使芯片群接口速度达到36 TB/s，处理能力高达 9 PFLOPs 。这也意味着，不仅全新芯片群的延迟率显著降低，计算能力也远超市场现有产品，甚至只需要几十个这样的芯片群，就能达到目前顶尖超算能力。

理论而言，120个D1芯片群组成服务器机柜，其算力将超过1.1 EFLOPS，是与行业内的其它产品相比，性能提升4倍，能效比提升1.3倍，空间缩小5倍。

毫秒级高效决策，驾驶感受趋紧平滑

反复的模拟训练和实际道路数据采集、系统训练，拓展了车辆决策层的计算、选择空间。特斯拉自动驾驶软件总监Ashok Elluswamy表示，特斯拉采用混合决策系统，首先让感知数据通过向量空间的粗搜索，然后经过连续优化，最后能够形成平滑的运动轨迹。

比如，经过一个包含左转、直行、超车等多种其他驾驶车辆的十字路口时，车辆拥有减速提早变线、加速推迟变线、停车等候让行等多种决策方式可供选择，但如何依据当前路况，选择更优的驾驶方案，则需要依赖coarse search（粗搜索）实现。

在1.5毫秒内，特斯拉可进行2500次变道时机搜索，并通过众多备选项得出相对的smooth trajectory（平滑轨迹），最终使车辆在兼顾舒适与安全的基础上及时采取变道措施。

在另一个案例中，车辆处在一个仅能满足“单车宽度”通过的狭窄路段“双向来车”的场景。首先，面对对向来车主动让行，特斯拉判断减速继续前行，而后对于再度出现的另一辆对向来车，特斯拉选择避让停车同时，对向车辆同样选择了停车避让，因此，特斯拉果断改变了驾驶决策，再次起步通过了这一路段。

这些特殊路段的行驶当中，特斯拉的决策、规划都更加倾向于实际人类驾驶，而最终目的，也是通过快速的路径选择、驾驶决策，在保障行驶速度的同时，为使用者提供更加安全、顺滑产品优化。

比较而言，特斯拉无论在感知还是决策层面，都与目前其他自动驾驶企业所呈现的产品拉开了一定距离，但回归感知路线的选择来看，缺乏高精地图、激光雷达等硬件设备，这样的神经计算网络优势能够持续多久，未来车辆驾驶能力能否真正实现对人类的超越，这些仍然是特斯拉将要解决的问题，也是其能否持续保持领先地位的关键。

当然，马斯克的关注点或许并不在此，身处特斯拉技术的高速成长期，如何“吸引人才”、“给予市场投资信心”，似乎才是此次AI Day最为关键的意义之所。

凤凰网汽车公众号

搜索：autoifeng
官方微博

@ 凤凰网汽车
报价小程序

搜索：风车价

文章标签：

特斯拉芯片标签图像数据车辆物体 d1 马斯克场景

返回凤凰网汽车首页>>

网友评论

0人点赞

|

评论0条

登录并发表

加载中...

大家都在看

热点聚焦

趣图推荐

进入汽车首页>>