语音识别模型训练方法及装置、计算机可读存储介质制造方法及图纸

技术编号：34769978 阅读：16 留言：0更新日期：2022-08-31 19:29

本申请公开了一种语音识别模型训练方法及装置、计算机可读存储介质，本申请提供的方案包括：获取用户对目标语音识别模型输出的语音识别的反馈信息，所述反馈信息包括语音识别的错误文本及错误文本对应的正确文本；获取错误文本对应的语音的说话人语音特征；基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签；基于更新训练样本和对应的标签，对所述目标语音识别模型进行更新训练。对所述目标语音识别模型进行更新训练。对所述目标语音识别模型进行更新训练。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别模型训练方法及装置、计算机可读存储介质

[0001]本申请涉及语音识别
，尤其涉及一种语音识别模型训练方法及装置、计算机可读存储介质。

技术介绍

[0002]语音识别是将语音转换成文本的技术，良好的语音识别模型需要成千上万小时的语料进行训练。现有语音识别系统是一旦进入系统后就不再更改，如果更新的话，目前有以下几种主流方法：1、根据识别性能购买数据，交由数据公司进行定制，或者直接购买现有的成品数据库；2、人工对识别性能不好的数据进行重新标注后重新加入模型训练。
[0003]上述方式得到的数据，无论是语音时长还是数量都是有限的，并且整个流程很长，造成很高的时间成本和价格成本，且语音识别模型的识别精度改善有限。

技术实现思路

[0004]本申请实施例的目的是提供一种语音识别模型训练方法及装置、计算机可读存储介质，用以解决现有语音识别模型训练存在的问题。
[0005]为了解决上述技术问题，本说明书是这样实现的：
[0006]第一方面，提供了一种语音识别模型训练方法，包括：
[0007]获取用户对目标语音识别模型输出的语音识别的反馈信息，所述反馈信息包括语音识别的错误文本及错误文本对应的正确文本；
[0008]获取错误文本对应的语音的说话人语音特征；
[0009]基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签；
[0010]基于更新训练样本和对应的标签，对所述目标语音识别模型进行更新训练...

【技术保护点】

【技术特征摘要】
1.一种语音识别模型训练方法，其特征在于，包括：获取用户对目标语音识别模型输出的语音识别的反馈信息，所述反馈信息包括语音识别的错误文本及错误文本对应的正确文本；获取错误文本对应的语音的说话人语音特征；基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签；基于更新训练样本和对应的标签，对所述目标语音识别模型进行更新训练。2.如权利要求1所述的方法，其特征在于，基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签，包括：计算错误文本对应的正确文本的困惑度；筛选出困惑度超出预设困惑度阈值的第一正确文本和第一正确文本对应的第一错误文本；基于第一正确文本与第一错误文本对应的语音的说话人语音特征的任意搭配组合进行语音合成，生成更新训练样本；基于第一正确文本，确定更新训练样本对应的标签。3.如权利要求1所述的方法，其特征在于，还包括：从目标网络上爬取热词；将所述热词与所述目标语音识别模型的训练样本库进行匹配；在匹配不成功的情况下，确定所述热词为新词；基于错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签，包括：基于新词、错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签。4.如权利要求3所述的方法，其特征在于，基于新词、错误文本、错误文本对应的正确文本、错误文本对应的语音的说话人语音特征，确定更新训练样本和对应的标签，包括：计算错误文本对应的正确文本的困惑度；筛选出困惑度超出预设困惑度阈值的第一正确文本和第一正确文本对应的第一错误文本；基于第一正确文本、新词对应的文本分别与第一错误文本对应的语音的说话人语音特征的任意搭配组合进行语音合成，生成更新训练样本；基于第一正确文本或新词的文本，确定更新训练样本对应的标签。5.如权利要求...

【专利技术属性】
技术研发人员：胡洪涛，徐景成，朱耀磷，彭成高，刘莹，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人