陈勇:从AI大模型迈向通用人工智能 智算力成为创新力

陈勇:从AI大模型迈向通用人工智能 智算力成为创新力

凤凰网汽车讯 5月23日,由凤凰网汽车主办的“2024汤逊湖汽车创新大会”,在武汉江夏区盛大开幕。作为主题演讲嘉宾,吉利汽车研究院技术中心主任,副院长级 陈勇博士以《人工智能构建智能体验新引擎》为题,进行了内容分享。

吉利汽车研究院技术中心主任,副院长级 陈勇博士

在新一轮汽车产业变革潮流下,吉利汽车勇立潮头,迎来新一轮变革。极氪作为吉利旗下子品牌,最近也刷新了新能源汽车史上最快的上市纪录,再次见证了吉利汽车的非凡实力。

陈勇博士表示,从AI大模型迈向通用人工智能,智算力成为创新力。

以下为演讲全文:

尊敬的各位领导,各位嘉宾,非常高兴跟大家一起分享在人工智能领域的一些思考。

2021年吉利提出智能吉利2025战略,我们在思考,在电动化的时代,我们打好了基础,稳扎稳打,突破创新,在智能化时代如何做好引领,如何实现向上突破。作为人工智能核心要素应该要有算力,如何把算力、把数据、把智能化做好,今天借这个机会跟大家分享一下在人工智能领域的几点思考。

大体分三个维度:人工智能发展趋势、人工智能关键因素和我们的一些应用探讨。

人工智能给我们带来哪些变革?大模型时代,我们如何乘风破浪?人工智能对一个行业核心来讲应该是两个问题:一是内容的生产,从传统的PGC、UGC的生产方式变成AIGC的生产方式,原来PGC的生产方式相对来说质量是比较高的,但是内容相对来说是比较少的,生产速度比较慢。UGC各种短视频各种自媒体出来生产速度大幅度提升,但是质量参差不齐,AIGC弥补了这两种的不足,这是我们应该要思考的。二是它给我们带来全新的交互体验。从传统的触控式的GUI交互或者语音指令交互,打开空调、打开开关等等语音指令的响应到了完全自然语音的交互。原来是将就机器在交互,有了大模型之后,我们可以完全的说今天天气比较热,今天车里有点闷,它完全可以理解。从原来指令式的交互,变成了什么?变成了它会根据环境根据需求来响应,所以说不管从内容生产来讲,从交互方式来讲,都带来比较好的体验方式。和大家分享几个趋势。

一是如何让智算力变成创新力,如同让我们的大脑变成一个创新力,驱动汽车行业整个产品的发展,重构了人机交互法方式,从GUI、VUI到NUI交互,我们从触控交互,语音指令交互慢慢就会变少了,变成自然语言的交互。

二是多模态大模型会变成主流,原来我们在车里面更多交互是语音或者触控的交互方式,未来有语音、文本、图片、视频输出,我们对大模型的输入也是一样,可以有激光雷达、摄像头、毫米波雷达的感知信息,包括语音的输入、文本的输入,这样多模态的输入和多模态的输出,成了一个主流。

三是大模型将变成一个新的生产力和工具,不仅仅是一个技术,对产品赋能,更多可以赋能组织竞争力,从产品竞争力到组织竞争力的提升,是一个企业应该思考的。现在来讲,产品的可复制性很强,但是一个企业的组织竞争力复制很难,这是可以构建壁垒的。

四是大模型+机器人或者虚拟机器人是未来的主旋律,波士顿动力这样的机器人,原来更多强调什么?强调它的运动能力,而大模型恰恰弥补了它的大脑,让它具备了思考、决策、理解的能力,这样填补整个机器人的行业空白。

高质量的数据将加速大模型发展,人工智能的发展取决于什么?今天在座的任何一个人包括我在内,我们从小看书,我们看什么,我们受的教育是什么,就决定了我们认知的天花板。我们从小学什么看什么,这个文化体系就构建了我们整个知识的大脑,对于大模型对于人工智能也一样,高质量的数据从哪来,这是我们要思考要做的事情。

端云协同部署将成为一个趋势,我们如果把所有的大模型所有的人工智能全部部署在车端,显然不太现实,如果在云端很难满足要求,如何做轻量化,如何能实现车云协同。行业模型,通用模型、垂类模型将加剧融合。

第一,这里面给大家分享一个关键要素。人工智能大模型的发展:一是数据,合成数据将是未来整个大模型数据中非常关键的部分,大家都知道智能驾驶需要有大量的数据,包括大模型的涌现也需要大量的数据,数据从哪来,这是一个问题,模型的参数量在不断增加,源源不断的数据从哪来,这个数据能不能用合成数据,对于模型、算法来讲它不关心这个数据是谁给它的,它只关心这个数据质量好不好,能不能对它有帮助,这是人工智能需要思考的事情。所以做好智能化,应该先把数据做好,如何把数据构建起来?二是要有足够的数据量,如果从小看一本书,我们的能力也仅限一本书的能力。第一个是数据量,第二个是数据质量,我们整个数据质量好不好,如果数据质量不好,意味着我们整个文化不好整个体验不好,它的能力是比较受限的,我们从小看什么书,决定了我们未来变成什么样的人,所以数据的质量非常重要。三是我们有没有偏科,是语文好还是数学好还是物理好,在做智能驾驶过程中大家都知道,很多场景,需要大量的数据,有些场景中我们如何弥补,考虑数据分布的问题。四是数据完备性,这是构建人工智能很重要的一个基础,如何构建高质量的数据集决定了整个人工智能产品或者大模型涌现能力的天花板,这个训练的数据集从哪来?我们可以有真实数据,但是真实数据的产生和来源可能很难满足大模型的需求。因为大家都知道,从原来百亿级到千亿级甚至到万亿模型,从原来的语言模型到多模态模型,到垂类模型到端到端的模型,需要大量的数据,这些数据从哪来,能不能从合成数据来做,用虚拟环境构建大数据,构建高质量数据是非常必要的。

这是吉利做的一个思考,因为做智能驾驶,数据是训练算法的一个瓶颈,如果靠去采集数据,碰到冬天下雪、高速公路比较拥堵,这样的场景非常难找,我们当然可以去东北找,但是这个成本会增加,数据采集的周期和成本会也会增加。

但是大家都在探讨端到端的算法,这些算法和数据从哪来,基于这个,我们构建了一个智能驾驶数据合成平台AI-DRIVE,构建一个虚拟仿真平台,让我们数据在这个平台产生。这是目前利用AI生成数据,我们可以通过虚拟仿真提供数据,可以模拟真实的交通情况,可以模拟真实的天气,不管是白天也好晚上也好,不管是停车场也好,行车也好、泊车也好,都可以模拟,解决了数据质量采集周期成本比较高的问题。解决了大量场景很难采集的问题。真正通过这样的场景,通过真实数据和合成数据实现了数据自由,这样才能打造好的智能驾驶产品。

第二,原来交互的内容相对来说比较单一,让音响放一首歌,它说:“好的”,回复的词语和内容相对比较少。但是大模型不一样,它可以写诗可以讲故事可以跟你聊天,这个过程中什么东西重要?除了生成内容很重要之外,另外一个什么很重要?超写实情感TTS。沟通过程中,TTS的自然流畅度,甚至有情感的表现能力,你情绪好或者不好的时候它应该如何应对?大人和孩子跟它应该如何应对?这是大模型时代应该思考的,大模型有了高质量的生成内容, TTS也越来越重要了,因此我们开发了新一代语音合成大模型。

第三,算力平台的构建,如何构建车云协同或者是混合云的架构,吉利2022年构建全球车企里面首个云数智一体化超级云数据平台,那个时候我们在思考一个问题,大模型、大数据、人工智能,我们应该怎么构建?所以说我们构建了一个算力底座,构建了一个高速的数据网络,包括整个安全合规行业智算架构。有了这么一个底座之后,目前离线的数据训练、实时的数据服务、大数据服务、合成数据平台以及语音大模型等等都是在这个算力平台构建的。

第四,车云协同技术,芯片迭代发展越来越快,车上的需求也越来越多,车机跟手机还是有些不一样的,手机的迭代使用寿命和车机迭代使用寿命不一样,一辆车的生命周期比较长,如果它的生命周期比较长,生态又在持续发展,一旦车量产之后,芯片算力又相对比较固定了,如何满足这种要求,如何满足持续增长的需求,车云协同是非常好的一个方案,有了大模型之后也是一样的,人工智能如何利用大算力服务,如果我们有本地化的需求,实时要求比较高的,需要大模型来支撑的,可以实现云端部署,所以构建了一个车云协同一体化架构,让我们打破原来车端算力限制,实现云端生态内容的服务。

第五,多模态大模型开发应用。我们做了一个音乐大模型,我们在车上听歌的时候更多在听,其实每首音乐都有自己的寓意在里面,我们可以看到歌词甚至音乐MV,但是我们音乐不仅可以听,而且可以被看见,看起来显得非常有情绪价值,在我们银河E8实现量产搭载。整个人工智能我们是这么思考的,人工智能技术它的价值是怎么决定的?早期有学术价值,这些年人工智能技术应该更多思考用户的场景,用户的场景决定了我们的价值,如果我们大模型用来做智能座舱,可能值智能座舱的钱,如果大模型做代码生成,就值代码生成的钱。如何让应用场景变得更丰富,如何体现我们大模型的价值?第一个围绕TO C提升我们的产品竞争力,提升我们企业产品竞争力。大模型不仅仅是一种技术,更是一种工具,除了可以提升企业产品竞争力以外,还可以提升组织竞争力。其实汽车我觉得应该是已经达到具备具身智能的初级状态,它可移动,有感知,有记忆,有智慧,会执行,也有情感。

那么在整个智能汽车当中,未来整个情感交互、端到端智能驾驶、多端协同、AIGC内容生成,这将会成为一种新的常态,它的内容将越来越丰富。另外,整个智能化给汽车有了新的属性,有了新的定义。原来说汽车强调生产、制造、销售,但是有了智能化之后,它更多的是服务,如何让汽车后市场服务做的更好,围绕大数据和人工智能持续不断给用户提供服务,这是整车厂要思考和去做的事情,所以我们在整个大数据和人工智能领域,我们在思考、在布局整个智能化的模式和服务。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载