chatgpt 语音识别 ChatGPT旋风如何“卷”到汽车行业?
文/福布斯中国
人气爆棚的,最近又把热度带到了汽车行业。
先是,百度即将内测的生成式对话产品“文心一言”的朋友圈不断扩大,吉利、长城、海马、集度、零跑、东风日产等新老车企纷纷宣布加入。
后有,长城汽车孵化的自动驾驶公司毫末智行宣称推出首个自动驾驶认知大模型,也就是自动驾驶领域的“”。
今天,百度发布了2022年年度财报。百度CEO李彦宏在内部信中指出,中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。百度计划将多项主流业务与文心一言整合。文心一言大模型将搭载到智舱系列产品。
容易理解的是,如果整合实现,百度的智能汽车将具备领先一代的人车交互体验。那么,毫末智行的又会如何撬动极为复杂的自动驾驶呢?它们又将如何影响汽车行业?
1. 智能语音:让人机交互更自然、更顺畅
在多家车企与百度文心一言宣布合作的新闻中chatgpt 语音识别,均提到了未来的应用场景和目标,就是提升AI交流对话、交互的体验。
2月14日,集度CEO夏一平宣布,集度汽车将融合百度文心一言的全面能力,打造针对智能汽车场景的大模型人工智能交互体验,支持汽车机器人实现自然交流的再进阶。他表示,可能带来的还是车内的交互效率的提升,能够让交互场景更加全面化。
对于合作的方式,百度和集度汽车方面均表示,目前还不清楚具体的方式,因为产品还没上线。
智能语音一直是人工智能重要的赛道,由自动语音识别 (ASR) 、自然语言处理 (NLP) 、语音合成 (TTS) 三大技术构成。而就是应用于NLP的大规模预训练语言模型,目的就是模仿人类的真实交流场景,以提升人机交互体验。
在汽车场景中,智能语音已成为智能座舱的重要交互方式。目前,百度、科大讯飞、云知声、思必驰、等智能语音赛道的AI企业早已切入智能汽车、智能座舱领域,以打造智能语音助理,提升语音交互能力。
虽然现在车载语音交互技术的识别率已经达到90%以上,但功能相对简单,例如语音导航、语音控制歌曲播放等,智能化或者“理解能力”仍是“软肋”。
根本原因在于,车内或公共空间容易被环境噪音及人声干扰chatgpt 语音识别,且每次交互前都需要唤醒,给AI识别带来了麻烦。站在AI的角度来说,每一次交互都面临“谁在对我说”“说的什么内容”和“所处的环境”等难题,因此难以实现近似人与人之间的自然交流。
为此,目前科大讯飞、思必驰等厂商都采用了语音、视觉等相结合的多模态交互技术,以解决复杂场景下的人机交互难题。
思必驰汽车事业部产品总监葛付江表示,从对话能力输出来看,具备情感化、高度拟人化的对话交互存在潜力,实现更接近真人逻辑性和情感化的表达效果。
而一旦融入车载语音识别场景,可以通过数据的人工标注和反馈,并结合大规模预训练语言模型进行深度学习,以便让AI具备更出色的语言理解和生成能力,从而避免干扰,也无需唤醒词,实现更顺畅、更自然的语言交互。
2. 自动驾驶:噱头大于实际
2月17日,毫末智行宣布,将其自动驾驶认知大模型(人驾自监督认知大模型)正式升级为“”,并称将于2023年4月公布重要进展。
毫末智行方面表示,采用的是大模型以及人类反馈强化学习 (RLHF) 技术。而在自动驾驶领域,该公司称,在国内最早将大模型引入到数据智能体系MANA当中。
众所周知,自动驾驶是一套复杂的解决方案,涉及计算、通信、网络、控制等多个层面,犹如一台会自动“奔跑”的计算机或机器人。
从技术层面来说,自动驾驶分为感知、决策和执行。毫末智行提出的所谓“认知”的概念,又将其智能化水平提升至一个新高度:拟人。
福布斯中国咨询了多家自动驾驶企业,得到的回复都是“不予置评”,而多位自动驾驶领域的专家则看法高度一致。
他们向福布斯中国表示,自动驾驶系统非常复杂,对于实时性要求相当高,而且牵涉到多种传感器等硬件,更有车规级限制。更重要的是,算力也是一个大问题。一位业内人士表示:“很难影响自动驾驶,主要还是应用在语音交互、智能推荐等方面。目前,智能驾驶行业内已经提出了‘千人千面’的定制化推荐产品,其基于大规模数据的训练和积累,以便建立不同类型驾驶员的模型,同时结合地图,为用户提供个性化的推荐。但量产的话,还有很长的路要走。”
归纳各方观点可见,其实与自动驾驶的技术路线并不一样,前者主要针对NLP技术和用户体验的提升,后者更多依靠的是传感器,对数据的收集和积累。所以,对汽车行业的影响,更多的还是语音交互、人机交互等层面。号称将用于自动驾驶,大概率是宣传的噱头。
毋庸置疑的是,相对于来说,自动驾驶背后的大模型更复杂,需要更多的数据积累和算力支撑。
3. 蹭热度还是炒冷饭?
自2022年底上线以来,火遍整个科技界,更向各个领域蔓延。
综上文所述,可以说,汽车行业就是一个典型例子,也是一个缩影。但归根到底,只是一个大规模预训练语言模型,应用方向是NLP。截至目前,它的应用就是借助数据的训练和学习,提升AI人机语言交互的体验chatgpt 语音识别,并非万能的AI“良药”。
无论如何,的火爆的背后,令人们对AI重拾信心,更加强了对大模型的重视程度。从中引出的是对数据、算力等底层核心要素的关注。
英伟达CEO黄仁勋认为:是人工智能领域的时刻,也是计算领域有史以来最伟大的技术之一。言下之意是,芯片厂商将成为火爆的最大赢家。
不过,一边倒叫好声的背后,难免有质疑声。目前仍然有各种问题,即便是微软、谷歌这样的巨头,相关产品也屡屡翻车。国产版究竟如何,还需静待上线后才能见分晓。
在此之前,就先别永无休止地“调戏”了,这只会让它“坏点子”更多!
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表本站的观点和立场和对其真实性负责。如需转载,请联系原作者。如果来源标注有误或侵犯了您的合法权益或者其他问题不想在本站发布,来信即删。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。