用于车辆环境的语音处理方法、装置、设备、介质和车辆制造方法及图纸

技术编号:33957926 阅读:20 留言:0更新日期:2022-06-29 23:57
本公开提供了一种用于车辆环境的语音处理方法、装置、设备、介质、产品和车辆,涉及智能交通领域,具体为语音识别、机器学习、自动驾驶、车联网等技术领域。用于车辆环境的语音处理方法包括:对待识别语音进行识别,得到识别结果和针对识别结果的识别概率;基于车辆行驶场景数据,调整识别概率,得到调整后的识别概率;基于调整后的识别概率,控制车辆基于识别结果执行操作。结果执行操作。结果执行操作。

【技术实现步骤摘要】
用于车辆环境的语音处理方法、装置、设备、介质和车辆


[0001]本公开涉及智能交通领域,具体为语音识别、机器学习、自动驾驶、车联网等
,更具体地,涉及一种用于车辆环境的语音处理方法、装置、电子设备、介质、程序产品和车辆。

技术介绍

[0002]随着车联网的智能化发展,车载语音系统在车辆上的应用越来越广泛。由于语音技术的局限和外部环境的影响,导致车载语音系统的语音识别效果不佳,存在车辆对语音进行误响应而影响驾驶安全的问题。

技术实现思路

[0003]本公开提供了一种用于车辆环境的语音处理方法、装置、电子设备、存储介质、程序产品和车辆。
[0004]根据本公开的一方面,提供了一种用于车辆环境的语音处理方法,包括:对待识别语音进行识别,得到识别结果和针对所述识别结果的识别概率;基于车辆行驶场景数据,调整所述识别概率,得到调整后的识别概率;基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作。
[0005]根据本公开的另一方面,提供了一种用于车辆环境的语音处理装置,包括:识别模块、调整模块以及控制模块。识别模块,用于对待识别语音进行识别,得到识别结果和针对所述识别结果的识别概率;调整模块,用于基于车辆行驶场景数据,调整所述识别概率,得到调整后的识别概率;控制模块,用于基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的用于车辆环境的语音处理方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的用于车辆环境的语音处理方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述用于车辆环境的语音处理方法的步骤。
[0009]根据本公开的另一方面,提供了一种车辆,包括上述的电子设备。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1示意性示出了用于车辆环境的语音处理的应用场景;
[0013]图2示意性示出了根据本公开一实施例的用于车辆环境的语音处理方法的流程图;
[0014]图3示意性示出了根据本公开一实施例的用于车辆环境的语音处理方法的原理图;
[0015]图4示意性示出了根据本公开另一实施例的用于车辆环境的语音处理方法的原理图;
[0016]图5示意性示出了根据本公开一实施例的用于车辆环境的语音处理装置的框图;以及
[0017]图6是用来实现本公开实施例的用于执行用于车辆环境的语音处理的电子设备的框图。
具体实施方式
[0018]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0019]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0020]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0021]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
[0022]图1示意性示出了用于车辆环境的语音处理的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0023]如图1所示,根据本公开实施例的应用场景100包括车辆110。
[0024]示例性地,车辆110例如包括自动驾驶车辆。车辆110包括电子设备111,电子设备111包括但不仅限于车载语音系统、智能音箱等。电子设备111具有语音处理的功能。
[0025]示例性地,用户可以通过语音和车辆进行交互,例如通过语音控制车辆执行操作。例如,电子设备111接收到待处理语音之后,对待处理语音进行识别得到识别结果,根据识别结果确定是否进行唤醒或执行相关操作。
[0026]示例性地,电子设备111通过对待处理语音进行识别,得到识别结果和针对识别结果的识别概率,识别结果例如包括唤醒词或命令语句。当识别概率大于预设值时,车辆可以响应于唤醒词进行唤醒或基于命语句执行相关操作。
[0027]然而,由于语音识别技术的局限性或外部环境的影响,存在识别概率准确性较低的问题,如果基于识别概率进行响应,则存在误响应的问题,进而影响体验。
[0028]有鉴于此,本公开的实施例提出了一种用于车辆环境的语音处理方法,以下参考图2~图4来描述根据本公开示例性实施方式的用于车辆环境的语音处理方法。
[0029]图2示意性示出了根据本公开一实施例的用于车辆环境的语音处理方法的流程图。
[0030]如图2所示,本公开实施例的用于车辆环境的语音处理方法200例如可以包括操作S210~操作S230。
[0031]在操作S210,对待识别语音进行识别,得到识别结果和针对识别结果的识别概率。
[0032]在操作S220,基于车辆行驶场景数据,调整识别概率,得到调整后的识别概率。
[0033]在操作S230,基于调整后的识别概率,控制车辆基于识别结果执行操作。
[0034]示例性地,待识别语音例如可以用于控制车辆执行相关操作,相关操作包括但不仅限于唤醒操作、执行命令操作。通过语音识别技术对待识别语音进行识别,得到识别结果和针对识别结果的识别概率。
[0035]在一些情况下,存在由于语音识别技术的局限性或外部环境造成识别概率的准确性较低的问题,使得识别概率难以表征用户的真实意图,如果直接基于识别概率控制车辆进行响应,存在误响应的情况。因此,本公开的实施例基于车辆行驶场景数据来调整识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于车辆环境的语音处理方法,包括:对待识别语音进行识别,得到识别结果和针对所述识别结果的识别概率;基于车辆行驶场景数据,调整所述识别概率,得到调整后的识别概率;以及基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作。2.根据权利要求1所述的方法,其中,所述基于车辆行驶场景数据,调整所述识别概率,得到调整后的识别概率包括:基于所述车辆行驶场景数据,确定所述车辆响应所述识别结果的期望值;以及基于所述期望值,调整所述识别概率,得到调整后的识别概率。3.根据权利要求2所述的方法,其中,所述基于所述期望值,调整所述识别概率,得到调整后的识别概率包括:响应于所述期望值大于等于预设阈值,增大所述识别概率;以及响应于所述期望值小于所述预设阈值,减小所述识别概率。4.根据权利要求2所述的方法,其中,所述基于所述期望值,调整所述识别概率,得到调整后的识别概率包括:基于所述识别概率确定响应等级;基于所述期望值确定期望等级;响应于所述期望等级高于等于预设期望等级,提高所述响应等级;以及响应于所述期望等级低于所述预设期望等级,并且所述响应等级低于所述预设响应等级,降低所述响应等级。5.根据权利要求2所述的方法,其中,所述基于所述车辆行驶场景数据,确定所述车辆响应所述识别结果的期望值包括:将所述车辆行驶场景数据输入机器学习模型中,输出所述期望值,其中,所述机器学习模型是通过以下方式得到的:获取车辆针对样本语音数据的响应结果,以及与所述样本语音数据相关联的样本行驶场景数据;将所述样本行驶场景数据输入所述机器学习模型,输出样本期望值;以及基于所述样本期望值和所述响应结果,调整所述机器学习模型的模型参数,得到经训练的机器学习模型。6.根据权利要求1所述的方法,其中,所述识别结果包括唤醒词;所述基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作包括:基于所述调整后的识别概率,控制所述车辆基于所述唤醒词确定是否唤醒。7.根据权利要求6所述的方法,其中,所述识别结果包括命令语句;所述基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作还包括:响应于所述车辆处于唤醒状态,基于所述调整后的识别概率,控制所述车辆基于所述命令语句确定是否执行操作。8.根据权利要求1

7中任意一项所述的方法,其中,所述车辆行驶场景数据包括以下至少一项:车辆运行状态数据、所述车辆所处的环境数据;其中,所述车辆运行状态数据包括以下至少一项:车辆的速度数据、车辆的启动状态数据;
其中,所述环境数据包括以下至少一项:时间数据、地点数据。9.一种用于车辆环境的语音处理装置,包括:识别模块,用于对待识别语音进行识别,得到识别结果和针对所述识别结果的识别概率;调整模块,用于基于车辆行驶场景数据,调整所述识别概率,得到调整后的识别概率;以及控制模块,用于基于所述调整后的识别概率,控制所述车辆基于识别结果执行操作。10.根据权利要求9所述...

【专利技术属性】
技术研发人员:张明哲王磊
申请(专利权)人:阿波罗智联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1