语音识别方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:37436270 阅读:9 留言:0更新日期:2023-05-06 09:08
本申请公开了一种语音识别方法、装置、存储介质和计算机设备。方法包括:获取待识别的语音信息;将语音信息输入语音识别模型,得到语音信息对应的识别文本,以及识别文本与语音信息的置信度;比对识别文本和识别文本对应的预设意图文本,确定识别文本与预设意图文本的第一相似度;根据置信度和第一相似度,确定语音信息的目标文本。本申请的方法,结合ASR识别和意图预测,基于联合优化的方式使两个不同的任务优化目标一致,提升语音识别的准确率,避免仅依赖于ASR识别中产生错误识别的文本对意图识别造成干扰,保障了后续意图识别的准确度,为后续应答机制提供可靠的数据支撑。为后续应答机制提供可靠的数据支撑。为后续应答机制提供可靠的数据支撑。

【技术实现步骤摘要】
语音识别方法、装置、存储介质和计算机设备


[0001]本申请涉及语音识别
,尤其是涉及到一种语音识别方法、装置、存储介质和计算机设备。

技术介绍

[0002]相关技术中,客服机器人采用语音识别(AutomaticSpeech Recognition,ASR)技术先识别客户的说话内容,并转写为对应文本,然后通过自然语言处理(NaturalLanguage Processing,NLP)技术基于转写文本识别预定义的客户意图,并在意图识别基础上建立客服问答机制。但在此方法中,客户意图识别的准确度直接受语音识别精度的影响,若语音识别系统鲁棒性较差,如受背景噪音或者口音影响导致识别精度降低,相应的意图识别的准确率也会降低,进而影响整个智能客服的交互质量。

技术实现思路

[0003]有鉴于此,本申请提供了一种语音识别方法、装置、存储介质和计算机设备,通过意图识别结果和文本识别结果加权后的得分引入语音转换的二次解码,采用两个不同任务联合优化的方式提升语音识别的准确率。
[0004]根据本申请的一个方面,提供了一种语音识别方法,包括:获取待识别的语音信息;将语音信息输入语音识别模型,得到语音信息对应的识别文本,以及识别文本与语音信息的置信度;比对识别文本和识别文本对应的预设意图文本,确定识别文本与预设意图文本的第一相似度;根据置信度和第一相似度,确定语音信息的目标文本。
[0005]可选地,根据置信度和第一相似度,确定语音信息的目标文本,具体包括:确定预设意图文本中第一相似度大于或等于第一预设相似度的第一意图文本;对置信度和第一意图文本的第一相似度进行加权处理,确定识别文本的目标评分;按照目标评分对识别文本进行排序,得到文本列表;将文本列表中位于首位的识别文本确定为目标文本。
[0006]可选地,语音识别方法还包括:将语音信息的声学特征和识别文本输入语音信息所属业务场景的意图识别模型,得到至少一个预设意图文本,其中,所述声学特征包括以下至少一种:语速、音色、停顿、语调、声纹。
[0007]可选地,语音识别方法还包括:获取文本样本和文本样本对应的语音样本;确定文本样本的语义标签和意图标签,语义标签为文本样本的文本语义特征;
根据文本样本、语音样本的声学特征和语义标签,对预设模型进行预训练,得到语义模型;根据文本样本、语音样本的声学特征和意图标签,对语义模型进行训练,得到意图识别模型。
[0008]可选地,语音识别方法还包括:若语音信息所属业务场景为预设场景,则根据目标文本匹配语音信息的第一应答信息;输出第一应答信息。
[0009]可选地,语音识别方法还包括:若目标文本满足人工接入条件,或根据目标文本未匹配出第一应答信息,则获取处于空闲状态的客服端;将目标文本发送至客服端;输出客服端反馈的第二应答信息。
[0010]可选地,根据目标文本匹配语音信息的第一应答信息,包括:将语音信息的声学特征输入情绪识别模型,得到语音信息对应用户的情绪信息,其中,声学特征包括以下至少一种:语速、音色、停顿、语调、声纹;获取情绪信息对应的知识库,知识库包括第二意图文本和第二意图文本对应的预设应答信息;比对目标文本和第二意图文本,确定目标文本和第二意图文本之间的第二相似度;将第二相似度大于第二预设相似度的第二意图文本对应的预设应答信息确定为第一应答信息。
[0011]根据本申请的另一方面,提供了一种语音识别装置,包括:获取模块,用于获取待识别的语音信息;第一识别模块,用于将语音信息输入语音识别模型,得到语音信息对应的识别文本,以及识别文本与语音信息的置信度;确定模块,用于比对识别文本和识别文本对应的预设意图文本,确定识别文本与预设意图文本的第一相似度;以及,根据置信度和第一相似度,确定语音信息的目标文本。
[0012]可选地,确定模块,具体用于确定预设意图文本中第一相似度大于或等于第一预设相似度的第一意图文本;语音识别装置还包括:处理模块,用于对置信度和第一意图文本的第一相似度进行加权处理,确定识别文本的目标评分;排序模块,用于按照目标评分对识别文本进行排序,得到文本列表;确定模块,具体用于将文本列表中位于首位的识别文本确定为目标文本。
[0013]可选地,语音识别装置还包括:第二识别模块,用于将语音信息的声学特征和识别文本输入语音信息所属业务场景的意图识别模型,得到至少一个预设意图文本。
[0014]可选地,语音识别装置还包括:
训练模块,用于获取文本样本和文本样本对应的语音样本;确定文本样本的语义标签和意图标签,语义标签为文本样本的文本语义特征;根据文本样本、语音样本的声学特征和语义标签,对预设模型进行预训练,得到语义模型;根据文本样本、语音样本的声学特征和意图标签,对语义模型进行训练,得到意图识别模型。
[0015]可选地,语音识别装置还包括:应答模块,用于若语音信息所属业务场景为预设场景,则根据目标文本匹配语音信息的第一应答信息;以及,输出第一应答信息。
[0016]可选地,应答模块,还用于若目标文本满足人工接入条件,或根据目标文本未匹配出第一应答信息,则获取处于空闲状态的客服端;语音识别装置还包括:通信模块,用于将目标文本发送至客服端;应答模块,还用于输出客服端反馈的第二应答信息。
[0017]可选地,语音识别装置还包括:情绪识别模块,用于将语音信息的声学特征输入情绪识别模型,得到语音信息对应用户的情绪信息,其中,声学特征包括以下至少一种:语速、音色、停顿、语调、声纹;应答模块,具体用于获取情绪信息对应的知识库,知识库包括第二意图文本和第二意图文本对应的预设应答信息;以及,比对目标文本和第二意图文本,确定目标文本和第二意图文本之间的第二相似度;以及,将第二相似度大于第二预设相似度的第二意图文本对应的预设应答信息确定为第一应答信息。
[0018]根据本申请再一个方面,提供了可读存储介质,其上存储有程序或指令,程序或指令被处理器执行时实现上述语音识别方法的步骤。
[0019]根据本申请又一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,处理器执行程序时实现上述语音识别方法的步骤。
[0020]借由上述技术方案,当获取到待识别的语音信息后,先利用语音识别模型识别语音信息对应的至少一个识别文本,每个识别文本携带有其与语音信息的置信度。通过比对每个识别文本和通过识别文本确定的预设意图文本,确定识别文本与预设意图文本之间的第一相似度。根据置信度和第一相似度计算每个识别文本的评分,并利用该评分得出语音信息的目标文本。从而结合ASR识别和意图预测,基于联合优化的方式使两个不同的任务优化目标一致,避免仅依赖于ASR识别中产生错误识别的文本对意图识别造成干扰,保障了意图识别的准确度,为后续应答机制提供可靠的数据支撑。
[0021]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取待识别的语音信息;将所述语音信息输入语音识别模型,得到所述语音信息对应的识别文本,以及所述识别文本与所述语音信息的置信度;比对所述识别文本和所述识别文本对应的预设意图文本,确定所述识别文本与所述预设意图文本的第一相似度;根据所述置信度和所述第一相似度,确定所述语音信息的目标文本。2.根据权利要求1所述的语音识别方法,其特征在于,所述根据所述置信度和所述第一相似度,确定所述语音信息的目标文本,具体包括:确定所述预设意图文本中所述第一相似度大于或等于第一预设相似度的第一意图文本;对所述置信度和所述第一意图文本的第一相似度进行加权处理,确定所述识别文本的目标评分;按照所述目标评分对所述识别文本进行排序,得到文本列表;将所述文本列表中位于首位的所述识别文本确定为所述目标文本。3.根据权利要求1所述的语音识别方法,其特征在于,所述方法还包括:将所述语音信息的声学特征和所述识别文本输入所述语音信息所属业务场景的意图识别模型,得到至少一个所述预设意图文本,其中,所述声学特征包括以下至少一种:语速、音色、停顿、语调、声纹。4.根据权利要求3所述的语音识别方法,其特征在于,所述方法还包括:获取文本样本和所述文本样本对应的语音样本;确定所述文本样本的语义标签和意图标签,所述语义标签为所述文本样本的文本语义特征;根据所述文本样本、所述语音样本的声学特征和所述语义标签,对预设模型进行预训练,得到语义模型;根据所述文本样本、所述语音样本的声学特征和所述意图标签,对所述语义模型进行训练,得到所述意图识别模型。5.根据权利要求1至4中任一项所述的语音识别方法,其特征在于,所述方法还包括:若所述语音信息所属业务场景为预设场景,则根据所述目标文本匹配所述语音信息的第一应答信...

【专利技术属性】
技术研发人员:郭立钊王福钋沈鹏黄明星张航飞范野曹富康辛逸男胡尧周晓波
申请(专利权)人:北京水滴科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1