语音识别方法、装置、存储介质和计算机设备制造方法及图纸

技术编号：37436270 阅读：9 留言：0更新日期：2023-05-06 09:08

本申请公开了一种语音识别方法、装置、存储介质和计算机设备。方法包括：获取待识别的语音信息；将语音信息输入语音识别模型，得到语音信息对应的识别文本，以及识别文本与语音信息的置信度；比对识别文本和识别文本对应的预设意图文本，确定识别文本与预设意图文本的第一相似度；根据置信度和第一相似度，确定语音信息的目标文本。本申请的方法，结合ASR识别和意图预测，基于联合优化的方式使两个不同的任务优化目标一致，提升语音识别的准确率，避免仅依赖于ASR识别中产生错误识别的文本对意图识别造成干扰，保障了后续意图识别的准确度，为后续应答机制提供可靠的数据支撑。为后续应答机制提供可靠的数据支撑。为后续应答机制提供可靠的数据支撑。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、存储介质和计算机设备

[0001]本申请涉及语音识别
，尤其是涉及到一种语音识别方法、装置、存储介质和计算机设备。

技术介绍

[0002]相关技术中，客服机器人采用语音识别（AutomaticSpeech Recognition，ASR）技术先识别客户的说话内容，并转写为对应文本，然后通过自然语言处理（NaturalLanguage Processing，NLP）技术基于转写文本识别预定义的客户意图，并在意图识别基础上建立客服问答机制。但在此方法中，客户意图识别的准确度直接受语音识别精度的影响，若语音识别系统鲁棒性较差，如受背景噪音或者口音影响导致识别精度降低，相应的意图识别的准确率也会降低，进而影响整个智能客服的交互质量。

技术实现思路

[0003]有鉴于此，本申请提供了一种语音识别方法、装置、存储介质和计算机设备，通过意图识别结果和文本识别结果加权后的得分引入语音转换的二次解码，采用两个不同任务联合优化的方式提升语音识别的准确率。
[0004]根据本申请的一个方面，提供了一种语音识别方法，包括：获取待识别的语音信息；将语音信息输入语音识别模型，得到语音信息对应的识别文本，以及识别文本与语音信息的置信度；比对识别文本和识别文本对应的预设意图文本，确定识别文本与预设意图文本的第一相似度；根据置信度和第一相似度，确定语音信息的目标文本。
[0005]可选地，根据置信度和第一相似度，确定语音信息的目标文本，具体包括：确定预设意图文本中第一相似度大于或等于第一预设相...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：获取待识别的语音信息；将所述语音信息输入语音识别模型，得到所述语音信息对应的识别文本，以及所述识别文本与所述语音信息的置信度；比对所述识别文本和所述识别文本对应的预设意图文本，确定所述识别文本与所述预设意图文本的第一相似度；根据所述置信度和所述第一相似度，确定所述语音信息的目标文本。2.根据权利要求1所述的语音识别方法，其特征在于，所述根据所述置信度和所述第一相似度，确定所述语音信息的目标文本，具体包括：确定所述预设意图文本中所述第一相似度大于或等于第一预设相似度的第一意图文本；对所述置信度和所述第一意图文本的第一相似度进行加权处理，确定所述识别文本的目标评分；按照所述目标评分对所述识别文本进行排序，得到文本列表；将所述文本列表中位于首位的所述识别文本确定为所述目标文本。3.根据权利要求1所述的语音识别方法，其特征在于，所述方法还包括：将所述语音信息的声学特征和所述识别文本输入所述语音信息所属业务场景的意图识别模型，得到至少一个所述预设意图文本，其中，所述声学特征包括以下至少一种：语速、音色、停顿、语调、声纹。4.根据权利要求3所述的语音识别方法，其特征在于，所述方法还包括：获取文本样本和所述文本样本对应的语音样本；确定所述文本样本的语义标签和意图标签，所述语义标签为所述文本样本的文本语义特征；根据所述文本样本、所述语音样本的声学特征和所述语义标签，对预设模型进行预训练，得到语义模型；根据所述文本样本、所述语音样本的声学特征和所述意图标签，对所述语义模型进行训练，得到所述意图识别模型。5.根据权利要求1至4中任一项所述的语音识别方法，其特征在于，所述方法还包括：若所述语音信息所属业务场景为预设场景，则根据所述目标文本匹配所述语音信息的第一应答信...

【专利技术属性】
技术研发人员：郭立钊，王福钋，沈鹏，黄明星，张航飞，范野，曹富康，辛逸男，胡尧，周晓波，
申请(专利权)人：北京水滴科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人