切换城市:北京
更多应用 |
官方:微博/微信
| 车展 | 专题 | 车商通 | 商用车

凤凰网汽车

凤凰网汽车>全媒体>正文

执着于纯视觉感知,特斯拉的底气是什么?

2021年03月11日 18:33:01
分享到:
来源:踢车帮

天下武功,唯快不破!

之前的讲堂我们提到,在自动驾驶的环境感知层面,新势力和传统厂商集体倒向了激光雷达,唯独特斯拉仍在坚持摄像头感知方案。

那么特斯拉坚持纯视觉感知的底气是什么呢?

★ 超前布局闭环学习

其实,特斯拉对自动驾驶有着自己的系统性框架性思考,早在2015年Autopilot面世前,就规划好了一整套数据采集与深度学习的循环模式,并且迫不及待地付诸行动。

2015年10月14日,在特斯拉召开的Tesla OS v7.0系统更新发布会上,马斯克宣布启用Autopilot辅助驾驶系统,这可以看作是特斯拉自动驾驶业务正式启动的标志。

该场发布会的另一则重要信息,是马斯克宣布,每一位Model S车主都是培训专家(expert trainer),特斯拉将通过系统收集各种路况下的行驶数据,训练Autopilot的算法,并通过整车OTA更新完善Autopilot系统。

仅仅一年后,特斯拉就推出了autopolit2.0和汽车行业历史上第一款搭载 8 颗摄像头的车型,前置三目,车身 4 颗,以及后置 1 颗,加上 1 个毫米波雷达和车身周围的超声波传感器。

在自动驾驶尚不成熟的2016年,如此激进地推出Autopilot 2.0和8摄像头车型,无他,只为更全面地收集数据。

截至2021年,特斯拉官网表示,由于每一辆特斯拉汽车都是联网的,特斯拉全球车队收集了超过 100 亿英里(约合 160 亿公里)的真实行驶数据(其中超过10亿英里(约合16亿公里)行驶里程使用了Autopilot自动辅助驾驶系统)。而对比之下,大众集团预计两年后才会有100万辆样车通过车联网向云系统提供数据。

那么,如此庞大的数据,要如何利用呢?

当行驶数据收集录入进云系统后,经过训练,特斯拉的AI神经网络将能够掌握简单场景的驾驶技巧,如沿着高速公路直线段行驶等,但这还远远不够,这时就轮到特斯拉的“影子模式(shadow mode)”登场了。

当我们操纵特斯拉汽车驾驶时,AI神经网络依然在车内运行着,时刻模拟着自主驾驶,影子模式会对比AI神经网络模拟输出的结果与驾驶员的实际操作,当神经网络的输出与驾驶员的真正操作相悖时,相关数据就会上传,特斯拉会利用影子模式的数据不断地优化自动驾驶算法,相当于在向人学习。

★ 自研芯片掌握主动

在搭建软件层面的机器学习闭环的同时,特斯拉也在着手硬件层面的布局。

特斯拉非常清楚 8 颗摄像头对算力的庞大需求,一颗强劲的芯片至关重要,而且芯片特性要适配于自动驾驶。同时,特斯拉也不会放任这么重要的命门握于他人之手,所以,自研芯片是必由之路。

2015 年 12 月,马斯克就亲自找到从AMD离职的芯片大神吉姆凯勒,说服其负责特斯拉自动驾驶芯片的研发。2019 年 4 月,搭载FSD自动驾驶芯片的Autopilot 3.0硬件便正式量产装车。对,就是在国产Model 3简配的那个硬件。

FSD芯片最大的特点就是,只有特斯拉一个客户。这会带来两点优势:

1.FSD芯片可以深刻理解特斯拉 Autopilot 的软件运行机理;

2.砍去通用芯片(如英伟达芯片)中与特斯拉软件无关的模块。

基于这两点优势,特斯拉的FSD芯片架构可以设计得十分精确合理,NPU(嵌入式神经网络处理器)占据了SoC中最大的物理面积。每一块 FSD 计算平台上都搭载了两块完全一致的芯片,每块芯片的算力为 72 Tops,而前代英伟达 Drive PX2 平台的算力为 8 - 10 Tops。与此同时,Drive PX2 的能耗为 57W,而特斯拉 NPU 的能耗为 15W。

Autopilot硬件工程副总裁Pete Bannon表示,他将近 40 年的芯片工程生涯里从未见过新一代芯片性能提升超过 3 倍的,而特斯拉提升了 20 倍(图像帧幅 从2.0版本的110 帧 到3.0版本的2300 帧)。

天下武功,唯快不破,尤其是互联网时代。特斯拉仅用3年就实现了从第一名员工入职到芯片量产装车的完整流程。而且自研的芯片在软硬打通、算法优化等方面都更具潜力,就像去年苹果推出的M1芯片。

★ 超级计算机Dojo是终极杀器?

规模宏大的数据是信息时代最宝贵的矿藏,但想要攫取到数据背后的宝藏,离不开先进的设备,对人工智能来说,这个工具就是超级计算机。

“Dojo”来自日语,意指用来冥想或者练习武术的道场,而特斯拉开发的超级计算机Dojo,就是其用来训练其自动驾驶人工智能的道场。

Dojo的浮点运算能力达到了Exaflops级别。这里简单说明下,浮点数,即FP32,指的是32位储存数字,计算机使用它进行计算。Exaflop指的是计算机每秒可以处理多少浮点运算,1 Exaflop意味着每秒百亿亿次(你没看错单位,每秒百亿亿次)。

特斯拉的Dojo强到什么地步呢?可以做个简单对比,目前世界上最强的超级计算机能够以0.415 Exaflop的速度运行,还未建成的、造价6亿美元、重达4.5万吨的超级计算机“Frontier”的算力为1.5 Exaflop。

Dojo的到来,第一个好处是使特斯拉的Autopilot处理4D视频数据(标注了时间坐标的3D视频数据)成为可能。

我们介绍过,自动驾驶的人工智能识别处理的都是2D图像数据,特斯拉的Autopilot也不例外,再进一步无非是标注了时间坐标的2.5D图像数据。

但是有了“Dojo”,特斯拉就有了应对2.5D到4D数据容量暴涨的底气,投入巨量资源重写Autopilot算法处理4D数据,实现从图像级处理到视频级处理的跃迁。

收集处理的数据变为拥有时间维度的视频信息,系统就能知道目标物的运动,对其行为进行预测,而且,系统处理目标物识别、分类以及场景的重构这类任务会更加轻松,很大程度上提高了系统对整体场景的理解。

Dojo带来另一个好处,是它可以和无监督学习进行配合。

算法的迭代优化离不开基于大数据的训练,但此前机器学习的算法训练主要是监督学习。监督学习,是指算法训练用到的数据需要先进行人工标注,如对图片上的机动车、非机动车、行人、红绿灯等用不同形状的框标注出来。

因为需要大量的人工标注,监督学习一直被揶揄为人工智能领域的“劳动密集型产业”。

无监督学习无需对数据集进行人工标注,系统可以自行根据样本间的统计规律对样本集进行分析和聚类。例如在没有任何标注提示的情况下,仅依据一定数量“狗”的图片特征,系统便可将“狗”的图片从不相关的图片群中区分出来。

有了Dojo和无监督学习的配合,特斯拉便能以极低的成本对数据进行自动标注和训练,实现算法性能的指数级提高。

★ 软硬一体化双轮驱动的商业模式

特斯拉的另一条护城河,是依托“自动驾驶和智能化”的新型商业模式。

不同于传统主机厂商仅依靠前端销售获利,特斯拉更像汽车行业的苹果公司。类似于苹果围绕iOS打造从芯片到系统、再到硬件设计的软硬一体化体系,特斯拉亦在Autopilot、电池和造车三个层面协调统一。

特斯拉正以整车销售为基础,通过“硬件降本+软件加成+Robotaxi共享出行”不断为其商业模式赋能,凭借平台服务加成,拓展盈利空间更广阔的软件业务。虽然特斯拉的整车售价在降,但单车毛利却仍有很大上升空间。

我们以最具想象空间的FSD为例。随着FSD的功能愈发完善,其价格也水涨船高,同时还开通了月度订阅服务模式。国信证券预测,2025年FSD会为特斯拉贡献119.84亿美元的收入,营收端占比提升至12%。

此外,后续内置的功能型软件的激活、娱乐导向的应用型软件变现、中长期订阅服务都有可能成为新增长点。

★ 结 语

无论是超前布局闭环学习,还是自研芯片打通软硬,亦或是招贤纳才开发超算Dojo,都体现了特斯拉对自动驾驶的狂热。

只是,激光雷达的量产开辟了另一条道路。特斯拉已经在视觉感知的方向上一路狂奔,没法拐弯了,但其他厂商却拥有更多的选择。

就在上周四,全球第一款法律许可的L3级自动驾驶量产车型——本田Legend已经在日本上市,配备5颗激光雷达,可在日本本土的部分路段使用L3级自动驾驶。至于高精地图,则是各地区本土车企对抗特斯拉的大杀器。

自动驾驶固然是美好的愿景,但这一定要建立在安全的基础上。早些年,特斯拉曾有过度夸大驾驶辅助功能的嫌疑,最近一段时间,“自动加速”的事故时有发生。所谓能力越大,责任越大,特斯拉既然在自动驾驶领域有着突出的实力,就更应该让消费者没有后顾之忧。

本文作者为踢车帮 逝水

  • 凤凰网汽车公众号

    搜索:autoifeng

  •  官方微博

    @ 凤凰网汽车

  •  报价小程序

    搜索:风车价

网友评论
0人点赞
|
评论0
加载中...

大家都在看

趣图推荐