切换城市:北京
更多应用 |
官方:微博/微信
| 车展 | 专题 | 车商通 | 商用车

凤凰网汽车

凤凰网汽车>全媒体>正文

毫末DriveGPT雪湖·海若,掀起一场自动驾驶的“工业革命"

2023年04月12日 11:07:03
分享到:
来源:AutoLab

就如同见证AlphaGo打败人类选手、ChatGPT开始爆红网络,接下来你将通过下面这段视频,见证全球首个自动驾驶生成式大模型DriveGPT雪湖·海若,首发落地车型新摩卡 DHT-PHEV的城市领航辅助驾驶体验:

DriveGPT雪湖·海若由毫末智行开发,4月11日正式发布,并对行业开放。

华为云、高通、英特尔、京东科技、字节跳动旗下的火山引擎、四维图新、魏牌新能源、北京交通大学计算机与信息技术学院等国内外知名的企业已经成为了首批客户。

视频中展示的新摩卡 DHT-PHEV的NOH城市领航辅助驾驶,便是应用到了雪湖·海若的部分能力。

毫末城市NOH,则是中国首个可大规模量产落地的,重感知,不依赖高精地图的城市领航辅助驾驶产品。

目前已经具备城市领航辅助驾驶能力的车型包括小鹏旗下的P7i、G9、P5(P版),还有华为ADS赋能的阿维塔11和极狐阿尔法S全新HI版。

毫末NOH和上述几款车型在功能上最大的差异在于,是否需要使用高精地图这根拐杖。

毫末NOH不需要高精地图,只需要定制的标精地图提供道路的拓扑结构,便能和小鹏、华为一样,让车辆自己按照导航路线行驶,驾驶员只需要盯着道路环境,但需要在系统提出接管要求或表现不佳的时候,及时手动驾驶即可。

这种人和AI打配合的人车共驾模式,将极大缓解驾驶过程的疲劳感,让开车出行更轻松舒适。

新摩卡 DHT-PHEV的NOH城市领航辅助驾驶,首批会在北京、保定、上海等城市开放给车主,计划2024年能开放到100个城市。现阶段而言,毫末NOH的这个落地速度,只有不依赖高精地图的重感知方案才能够实现。

除了魏牌摩卡DHT-PHEV,后续还会有多款车型搭载城市NOA功能,例如最近大火的魏牌蓝山DHT-PHEV。

智驾AIGC是不是搞噱头?

看到GPT、AIGC,可能会有人质疑毫末是不是在蹭ChatGPT的热点,搞噱头?

从我个人的观察来说,并不是。

毫末智行给我的感觉,一直是一家踏实务实的智能驾驶科技公司。

就如同它一开始便坚定选择重感知、轻地图,做不依赖高精地图的城市领航辅助驾驶产品。

这明明是一条投入更大,研发难度更大,市场和资本反馈最“不讨巧”的技术路线,但从泛化能力、落地能力等长远的指标来看,这又是一条最符合用户需求的路。

虽然小鹏、华为现阶段的方案都是基于城市级高精地图打造,但两家公司也都认为重感知、轻地图才是未来的发展方向,小鹏XNGP已经做了完整的重感知方案的落地计划。

此外,毫末每个季度都会做一次AI DAY,开诚布公地向行业和消费者展示自己阶段性的探索和成功,这其中甚至不乏一些探索,会在下一次AI DAY上又被自己推翻,告诉大家自己尝试过,但是发现效果并不好,接下来会探索另一个方向或者不断的改进,而这次DriveGPT其实相较于三个月前已经有了模型架构的升级和参数规模的极大升级。

智能驾驶作为一个全新的方向,这种试错式的探索是在所难免的,毫末是唯一一家将这些思考和探索过程都分享出来的智驾公司。

作为一个长期报道智能驾驶领域的记者,我也见证了这家以“毫末”命名的企业,始于毫末,通过不断地探索,开发出逐渐完整的模型训练、任务处理的数据闭环工具系统,把地基越打越稳。

所以这次发布的自动驾驶生成式大模型DriveGPT雪湖·海若,并不是一时的蹭热点,而是一场有备而来的顺势而为,将过往开发的工具,都集成在一个更大参数量的AI大模型中。

用AIGC搞自动驾驶靠谱么?

解释这个问题之前,我们先简单科普下什么是AIGC?

AIGC中文叫做生成式AI,近期大热的ChatGPT和Midjourney就是其中最出圈的代表。生成式的意思是给一个输入,然后让它求解下一个词出现的概率,然后循环下去,把生成的词又作为下一个词的输入,不断循环就能连成一连串的字符。

这个过程会引入基于人类反馈的强化学习(RLHF),AI生成了不同的结果,会由人来对不同的结果打分,告诉AI什么是好的,什么是不好的,这个结果会作为奖励机制的输入,来完成AI的强化学习,让AI不断探索,怎么做能是离效果更优的方向越来越近?

ChatGPT便是基于大家对它回答的反馈来进行调优,从而让系统的输出越来越符合我们的需求。这就像是养成式游戏里和NPC刷好感度,在智驾系统中,人类就是那个喜好有规则可循的NPC,而系统在玩那个如何让人类对自己提升好感度的游戏。

OpenAI已经验证了AIGC能在“聊天”这个游戏里,快把NPC的好感度刷满了,而毫末要做的事情,就是开了一局新的游戏,来验证AIGC是否能在“开车”这个游戏里,把NPC的好感度刷上去。

毫末智行技术副总裁艾锐认为,教会AI开车可能并不比教会AI说话要难,至少教会人开车,比教会人说话要简单一点。“小孩从出生到会说话至少要好几岁,但是一个人开车,在驾校练十几个小时差不多就够了”,艾锐的论证也有着很浓的第一性原理思维。

虽然我的认知里自动驾驶的难度会比NLP大很多,但想了想考英语6级和考C1驾照的难度对比,我似乎被说服了。

毫末DriveGPT雪湖·海若在方法论上和ChatGPT是相同的,只不过DriveGPT雪湖·海若比ChatGPT 多了一个步骤,那就是设计出一套新的语言,再把所有的真实道路驾驶数据,都“翻译”成这种统一的语言。

毫末称这套开车的语音叫做“Drive Language”。毫末很早就在研究将NLP领域的技术应用在自动驾驶上,大概是视觉人工智能领域里最懂自然语言人工智能的玩家,再加上毫末在transformer和BEV上的长期布局,它们比较巧思地从BEV感知上找到了灵感。

简单来说,就是先把整个驾驶场景都转化成一个BEV视角,可以理解为一个站在你的车顶上方大概10m处看到的交通环境俯瞰图。然后把这个俯瞰图画众多小格子,像素化,每个小格子就如同英文里的ABCD。每个网格里面会存在有物体或没有物体的情况,再用技术语言来描述每个格子的情况,就能表达出一帧的交通场景状态。

整个Drive Language实际上和特斯拉的占据网络有相似之处,但差异在于,毫末把这些技术创新地应用到了认知大模型训练的过程中。

和ChatGPT一样,雪湖·海若也应用到了RLHF。ChatGPT的人类反馈主要是为了让AI的文本输出符合人类的常识、需求、价值观,雪湖·海若同样也是如此,得教会一些人类在驾驶过程的规则,例如绝对不能撞车、绝对不能直接停在道路上、红灯停绿灯行、要走在相应的车道线内,还有更为微妙的跟车策略和车车博弈策略等。

除了这些简单的规则之外,毫末还准备了一些数据集来帮助AI建立哪些决策是好的,哪些决策是不好的,从而建立强化学习的奖励机制,让AI完成训练。

目前毫末已经将过往开发的多个大模型的能力整合到了雪湖·海若中,目前,雪湖·海若的参数规模已经达到1200亿,快接近GPT 3的模型规模,预训练阶段已经引入4000 万公里量产车驾驶数据。

随着新摩卡DHT-PHEV的交付,以及后续更多车型的交付上市,毫末将积攒更多高质量的数据(具备多视觉机位,可生成BEV),雪湖·海若也会被训练的更加“聪明”。

为了能执行如此大规模的模型训练,毫末此前已经发布了MANA OASIS超算中心,具备每秒67亿亿次的浮点运算,是目前国内最大的智能驾驶超算中心。

新摩卡DHT-PHEV的城市NOH功能就是基于雪湖·海若的能力开发出来的车端智驾系统,我体验下来,确实感受到系统在路径规划上更为灵活顺畅,不再会有高精地图方案的那种轨迹感。

城市NOH仅仅是打开了DriveGPT雪湖·海若的一扇门

把生成式大模型的思路运营到智能驾驶模型训练,城市NOH只是开了一扇小门而已,背后还会有非常多值得期待的新体验。

例如如果将语言人工智能的能力和智驾人工智能的能力连接在一起,智能驾驶就会变得更加聪明,例如我们现在的人机共驾策略是机器卡住了,人来操作车脱困。如果人的语言也能作为一个智驾信息的输入,整个交互的过程就会更轻松。

例如,当系统跟随一辆临停车停车后,人可以直接下指令“我需要你绕过去”,这个指令就会和感知的输入一样,帮助系统更好地做决策,最终执行出更符合驾驶员心理预期的规划控制。

除了智能驾驶之外,毫末还设想了一个“智能陪练”的场景,帮助刚学会驾照,但不太敢一个人上路的新手司机,用AI来教你如何在安全地行驶。这样的场景不光是帮助新手上路,也可以对于一些困难场景给出驾驶策略的推荐。

目前毫末已经开放了DriveGPT大模型的能力,例如现在已经可以应用在驾驶场景识别的在线标注,只需要输入画面,系统可以识别出车辆、行人、骑行等交通参与者,以及红绿灯等交通环境。毫末下个阶段还会开放3D检测、车道线、道路语义信息的理解和提取,以及输入视频,直接生成场景重建的仿真环境这种更高阶的能力。

这些能力能够极大降低整个自动驾驶开发成本,比如,毫末在4D Clips数据的自动化标注能力就将减少人工标注的占比,帮助智驾产品更快地实现大规模商业化落地。

ChatGPT 已经让我们看到了生成式大模型人工智能带来的无限可能,而这也只是一个开始而已,一个让AI有了人类思考逻辑的开始。

毫末DriveGPT雪湖·海若这类自动驾驶生成式大模型的出现,正在让AI具备和人一样的决策控制能力,它可以让机器按人类的偏好自由地动起来,AIGC得以从线上延展到线下,突破技术产业 的“次元壁”。

蒸汽机、内燃机和电力等新的驱动形式,将人类带入到了工业文明,显而易见的是,雪湖·海若和ChatGPT这类AIGC也将使人类的生产力水平迎来爆发式增长。

一场由生成式AI大模型掀起的“工业革命”正在袭来,给岁月以文明,我们终将迎接一个充满新奇与挑战的未来。

我知道你在看

  • 凤凰网汽车公众号

    搜索:autoifeng

  •  官方微博

    @ 凤凰网汽车

  •  报价小程序

    搜索:风车价

网友评论
0人点赞
|
评论0
加载中...

大家都在看

趣图推荐