切换城市:北京
更多应用 |
官方:微博/微信
| 车展 | 专题 | 车商通 | 商用车

凤凰网汽车

凤凰网汽车>全媒体>正文

为什么我们不能跟车机好好聊天?

2018年12月20日 21:45:27
分享到:
来源:雅斯顿

原标题:为什么我们不能跟车机好好聊天?


雅斯顿原创文章 | 麦琪

电影《Her》里面的AI角色萨曼莎既理想又虚幻,这种完全接近人类自然沟通及思考的模式,正是人工智能的研究方向。

 

近日,福布斯公布了未来10年影响世界发展的多项技术,包括电池快充、5G网络、太阳能电池等,其中就提到了自然语言处理(Natural Language Processing,简称NLP)。当前无论是苹果Siri、谷歌Assistant,还是应用在汽车智能系统里的各种语音助手,都在朝着自然语言的方向努力。


 

汽车厂商普遍的做法是与科技公司合作,比如中国一些自主品牌选择与阿里、百度、思必驰等公司共同开发语音识别功能。虽然多年来用户感知的车载系统语音识别功能有了很大进步,但要实现自然语言交互还有很长一段距离。

1语音识别只是初级技能

要想实现电影《Her》里面萨曼莎的交流,简单来说只需要完成“语音识别、语义分析、信息搜索、语音合成”这四个环节,从目前大部分智能硬件的语音系统上,其实也能看到这四个操作环节的顺利执行。但为什么包括Siri在内的几乎所有语音助手,都难以实现真实语境的交流?



人类拥有语言交流的能力,这本身就是高度智能的体现。而由于人类语言拥有极为复杂的规律、组合与使用语境,因此人工智能要实现自然语言处理,需要依靠极为庞大的信息库和大量的信息运算。

 

当然,这些都不是最具挑战性的部分。以中国为例,在大量的方言体系之外,还有人们生活流动性带来的各种语言夹杂出现,而在发音差异之上,还有不同方言在语言表述规律上的差异。这无疑为自然语音处理带来成倍数的难度提升。另一个不可被忽视的是环境噪音对语音识别的干预。



目前在中国语音识别上做得比较好的是科大讯飞,截至今年可以实现全国23种方言的识别和翻译。方言识别的难点除了学习模型的建立,还包括对音素、声学相似性等方面的研究。许多地区方言存在发音相似、语义差别巨大的情况,这需要建模前对方言文化和语义进行广泛而深入的研究。

 

放到全球范围内,6000-10000种语言细化,使得人工智能中自然语言处理的实现极为困难,目前针对全球市场开发的Siri也只能实现数十种语言识别。如果放到单款产品生产规模更少、市场竞争更为激烈的汽车领域,针对全球开发的车载系统语音识别功能,就很难完全满足单个市场的人群需求。



2深度学习仍是一道难题

语音交互功能在最近几年实现了大范围推广,无论是移动设备还是汽车系统,这项功能的加入都让整个人机交互过程效率更高、体验更好。实际上,语音交互能够达到当前水平,也是科学界研究了60多年的成果。

 

人类的自然对话具有非常多的规律,学龄儿童的对话形式与成年人之间的也不尽相同,在信息交流的同时也具备情感分析。但对于人工智能来说,这样的处理过于高阶,目前大部分语音交互的模式都是首先要将自然语言处理的步骤简化,我们可以将其理解为一问一答。



系统通过识别语句中潜藏的问题,基于关键词进行相关信息搜索与筛选分析,最后输出答案。这种逻辑基本等同于当前我们从手机、车机上体验的交互模式。一直以来,自然语言处理都在采用深度学习这种方法,原理是让机器模拟人类的思维模式,这种人工神经网络由层叠信息层组成,类似人脑的机理,而在其中加入人类的知识体系,可以让机器不断学习、不断更新信息。

 

深度学习的办法看似理想,因为人类本身的自然语言交流也是需要不断学习。但对于人工智能来说,这种深度学习的局限性在于,它需要依赖大量数据,而这些数据本身并不统一、缺乏标准。



比如,在中英文语境里,都存在同音字,需要放在特定词汇和上下文里进行了解。又比如,目前语音交互领域主要收集的是生活相关的广泛用语及信息,但除此之外还有许多垂直领域的特定信息有待录入处理,这背后同样是一个庞大的知识库。

 

人类个体出于自身的工作生活圈层局限,可以不对其他领域进行了解;但对于面向广泛用户的人工智能,就需要尽可能地填补信息漏洞。从目前来看,深度学习这种模式正在不断提升语音识别的准确性,但它永远无法做到100%。


至于目前在语音交互上做得还算不错的Siri,是如何处理不同国家地区的语言问题?苹果为此加入了Geo-LM语言模型,这个模型被单独投放在全球多个地区,而这个系统与手机的定位捆绑在一起,当用户访问Siri,就会自动识别该用户的位置并使用这个地区的Geo-LM,有效提高Siri的准确性。

3汽车是否需要NLP

如果按照福布斯的预测,自然语音处理(NLP)成为未来10年改变人类生活的重要技术,那是否意味着,电影《Her》里面的萨曼莎将会成为现实?

 

且不论人工智能实现之后,可能带来的人类生活情感缺失,就汽车出行而言,我们到底需要什么程度的自然语言交互?



在汽车领域,语音识别是车载智能系统里面一个非常重要的功能,汽车厂商希望通过这项功能的优化,为用户带来更安全、更有效率的出行体验。从目前来看,车机的语音交互主要用于信息娱乐功能的需求下发、车辆相关功能的语音控制。

 

虽然不少车企都在宣传可以实现近乎自然对话的语音交互,但实际上它只是一种简单的问答模式,需要对特定词汇或指令进行识别,而信息反馈也极其有限,甚至还无法达到Siri的交流能力。



当前汽车领域的语音交互研发,更多的是提升用户体验、甚至为以后的自动驾驶作准备。但如果考虑到车辆的最根本属性——出行,那么对于汽车系统中的自然语音交互,也许并不需要到达自然交流甚至思考的程度,只需要做到语音识别的准确度提升,以满足相关指令的操作,这就足够了。

 

只不过,人类对未来人工智能的构想远不止这些,当未来自动驾驶普及,车辆成为了一个移动生活场景,也许每个用户都希望能有一个专属的“萨曼莎”陪伴左右。甚至,车企不满足于人类为主导的人机交互模式,在某些特殊场景,拥有超强学习能力的机器可以为人类作出一些即时提醒或建议。



从繁杂的物理按键到一句“你好,斑马”,不过短短数年,自然语言交互的发展虽然挑战重重,但已经逐渐渗透并且改变着我们的出行。萨曼莎的到来,希望不会很久。


图 | 来源于网络

 About Astoncar 

爱车,更多一点

雅斯顿 | 以消费者的目光探讨汽车,分享更多原创真实的汽车观点

 Contact us 

gao@astoncar.com 

  • 凤凰网汽车公众号

    搜索:autoifeng

  •  官方微博

    @ 凤凰网汽车

  •  报价小程序

    搜索:风车价

网友评论
0人点赞
|
评论0
加载中...

大家都在看

趣图推荐