语音处理方法技术

技术编号:39808879 阅读:19 留言:0更新日期:2023-12-22 02:44
本公开提供了一种语音处理方法

【技术实现步骤摘要】
语音处理方法、装置及相关设备


[0001]本公开涉及语音
,尤其涉及一种语音处理方法

装置及相关设备


技术介绍

[0002]随着车辆智能化发展,语音功能在车辆座舱领域的重要性越来越高

目前,受限于车机终端的资源,车载语音功能的实现大部分是基于云端对语音信号进行语音处理,再把语音处理结果返回给车机终端

然而,由于车辆的移动属性,容易导致网络稳定性较差,进而导致语音处理的延迟时间较长,甚至无法使用语音功能


技术实现思路

[0003]本公开提供了一种语音处理方法

装置及相关设备

[0004]根据本公开的第一方面,提供了一种语音处理方法,应用于车机终端,包括:
[0005]获取目标语音信号;
[0006]通过所述车机终端的第一语音处理模块对所述目标语音信号进行语音处理,得到第一语音处理结果,并向第一云端服务器发送所述目标语音信号;
[0007]在所述第一语音处理结果满足第一条件的情况下,根据所述第一语音处理结果执行反馈操作

[0008]根据本公开的第二方面,提供了一种语音处理装置,包括:
[0009]获取模块,用于获取目标语音信号;
[0010]第一处理模块,用于通过所述车机终端的第一语音处理模块对所述目标语音信号进行语音处理,得到第一语音处理结果,并向第一云端服务器发送所述目标语音信号;
[0011]第一执行模块,用于在所述第一语音处理结果满足第一条件的情况下,根据所述第一语音处理结果执行反馈操作

[0012]根据本公开的第三方面,提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与至少一个处理器通信连接的存储器;其中,
[0015]存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面的方法

[0016]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面的方法

[0017]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现第一方面的方法

[0018]根据本公开的技术,在第一语音处理结果满足第一条件的情况下,可以直接基于第一语音处理结果执行反馈操作,而无需等待第一云端服务器返回的目标语音信号的语音处理结果,这样不仅可以提高语音服务的反馈速度,还可以使得语音服务不受限于网络,保证语音服务持续可用,进而提高语音服务的稳定性

[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围

本公开的其它特征将通过以下的说明书而变得容易理解

附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定

其中:
[0021]图1是本公开实施例提供的语音处理方法的流程图;
[0022]图2是本公开实施例可应用的一种语音识别系统架构的示意图;
[0023]图3是本公开实施例提供的语音处理装置的结构图之一;
[0024]图4是本公开实施例提供的语音处理装置的结构图之二;
[0025]图5是本公开实施例提供的语音处理装置的结构图之三;
[0026]图6是本公开实施例提供的语音处理装置的结构图之四;
[0027]图7是本公开实施例提供的语音处理装置的结构图之五;
[0028]图8是本公开实施例提供的语音处理装置的结构图之六;
[0029]图9是本公开实施例提供的电子设备的结构图

具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的

因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神

同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述

[0031]如图1所示,本公开实施例提供一种语音处理方法,应用于车机终端,包括如下步骤:
[0032]步骤
101
,获取目标语音信号

[0033]本实施例中,上述目标语音信号可以是接收的初始语音信号,也可以是初始语音信号经过预处理后的语音信号,例如,初始语音信号经过回声消除和降噪处理
(Echo Cancellation&Noise Reduction

ECNR)、
波束形成
(Beamforming)
和生源定位后的语音信号

[0034]步骤
102
,通过所述车机终端的第一语音处理模块对所述目标语音信号进行语音处理,得到第一语音处理结果,并向第一云端服务器发送所述目标语音信号

[0035]本实施例中,上述车机终端的第一语音处理模块可以包括语音识别
(Automatic Speech Recognition

ASR)
模块,或者可以包括
ASR
模块和自然语言理解
(Natural Language Understanding

NLU)
模块,或者可以包括
ASR
模块
、NLU
模块和对话管理
(Dialog Management

DM)
模块等

可以理解的是,上述
ASR
模块
、NLU
模块和
DM
模块可以是硬件形式的模块,也可以是软件形式的模块,例如,上述
ASR
模块为预先训练的
ASR
模型,上述
NLU
模块为预先训练的
NLU
模型

[0036]上述第一语音处理结果可以是
ASR
模块输出的语音识别结果,或者可以是
NLU
模块输出的自然语言理解结果,或者可以是
DM
模块输出的对话结果等

示例性的,车机终端可以基于车机终端的
ASR
模块对目标语音信号进行语音识别,得到语音识别结果,上述第一语音处理结果即为改语音识别结果;或者车机终端可以基于车机终端的
ASR
模块对目标语音信
号进行语音识别,得到语音识别结果,并通过车机终端的
NLU
模块对语音识别结果进行自然语言理解,得到自然语言理解结果,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语音处理方法,其特征在于,应用于车机终端,所述方法包括:获取目标语音信号;通过所述车机终端的第一语音处理模块对所述目标语音信号进行语音处理,得到第一语音处理结果,并向第一云端服务器发送所述目标语音信号;在所述第一语音处理结果满足第一条件的情况下,根据所述第一语音处理结果执行反馈操作
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述第一语音处理结果不满足所述第一条件的情况下,从所述第一云端服务器接收所述目标语音信号的第二语音处理结果,并根据所述第二语音处理结果执行反馈操作
。3.
根据权利要求1所述的方法,其特征在于,所述通过所述车机终端的第一语音处理模块对所述目标语音信号进行语音处理,得到第一语音处理结果之后,所述方法还包括如下至少一项:在所述第一语音处理结果为语音识别结果的情况下,若所述第一语音处理结果包括目标关键词,则确定所述第一语音处理结果满足所述第一条件;在所述第一语音处理结果为自然语言理解结果的情况下,若所述第一语音处理结果与目标意图项匹配,则确定所述第一语音处理结果满足所述第一条件
。4.
根据权利要求3所述的方法,其特征在于,所述若所述第一语音处理结果包括目标关键词,则确定所述第一语音处理结果满足所述第一条件,包括:若所述第一语音处理结果包括目标关键词,且所述第一语音处理结果对应的评价分值大于预设分值,则确定所述第一语音处理结果满足所述第一条件;所述若所述第一语音处理结果与目标意图项匹配,则确定所述第一语音处理结果满足所述第一条件,包括:若所述第一语音处理结果与目标意图项匹配,且所述第一语音处理结果对应的评价分值大于预设分值,则确定所述第一语音处理结果满足所述第一条件
。5.
根据权利要求3所述的方法,其特征在于,所述方法还包括:在接收到针对参数项配置的第一输入的情况下,显示
N
个参数项,其中,所述参数项包括关键词或意图项,
N
为正整数;接收针对所述
N
个参数项中的
M
个参数项的选择输入,
M
为小于或等于
N
的正整数;将所述
M
个参数项确定为目标参数项,其中,所述目标参数项包括所述目标关键词或所述目标意图项
。6.
根据权利要求1‑5任一项所述的方法,其特征在于,所述第一语音处理结果为自然语言理解结果;所述根据所述第一语音处理结果执行反馈操作,包括:在根据所述第一语音处理结果确定需要获取第一内容服务数据的情况下,若所述车机终端存储的内容服务数据中存在所述第一内容服务数据,则从所述车机终端存储的内容服务数据获取所述第一内容服务数据,并输出所述第一内容服务数据;若所述车机终端存储的内容服务数据中不存在所述第一内容服务数据,则从第二云端服务器获取所述第一内容服务数据,输出所述第一内容服务数据,并在所述车机终端存储所述第一内容服务数据

7.
...

【专利技术属性】
技术研发人员:闫新
申请(专利权)人:上海集度汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1