基于元学习的自适应语音识别方法、装置、设备及介质制造方法及图纸

技术编号：27841363 阅读：28 留言：0更新日期：2021-03-30 12:28

本申请公开了一种基于元学习的自适应语音识别方法、装置、设备及介质，涉及人工智能技术领域，可以解决目前在对语音识别模型进行说话人自适应调节时，需要人工预先根据不同说话人类型进行调整准则的设计，设计过程繁琐、工作量较大，并且无法涵盖所有参数调整情况，进而导致语音识别效果不佳的问题。其中方法包括：利用预处理后的样本语音数据训练语音识别模型以及元学习适应模型；基于所述元学习适应模型，将所述语音识别模型的初始模型参数调整为与目标语音类型匹配的目标模型参数；利用配置有所述目标模型参数的语音识别模型识别所述目标语音类型下的目标语音。本申请适用于对语音的自适应识别。语音的自适应识别。语音的自适应识别。

全部详细技术资料下载

【技术实现步骤摘要】
基于元学习的自适应语音识别方法、装置、设备及介质

[0001]本申请涉及人工智能
，尤其涉及到一种基于元学习的自适应语音识别方法、装置、设备及介质。

技术介绍

[0002]随着深度学习的发展，自动语音识别系统取得了显著的效果，并被用于日常生活的各种场景。目前最广泛使用的语音识别应用是智能助理，用户可以通过语音自然地与机器进行交流，协助工作。然而智能助理服务面向的多数场景是单一用户，其语音识别针对的是单一说话人。此时自动语音识别系统的性能可以通过调整声学模型参数来补偿训练和测试条件之间的不匹配，从而来改善识别的效果。这种针对未知说话人调整已有参数的方法被称为说话人自适应方法。
[0003]有效的说话人自适应方法依赖于选择合适的声学模型参数和合适的参数更新规则，以避免在较少的训练数据上的过拟合。为了依据不同说话人进行声学模型参数的有效调整，目前主要采用人工设计调整准则(如设计调整步骤数，学习率等)的方式来进行。然而这种调整方式需要人工预先根据不同说话人类型进行调整准则的设计，设计过程繁琐，且工作量较大，并且无法涵盖所有参数调整情况，进而容易导致语音识别效果不佳。

技术实现思路

[0004]有鉴于此，本申请提供了一种基于元学习的自适应语音识别方法、装置、设备及介质，主要解决目前在对语音识别模型进行说话人自适应调节时，需要人工预先根据不同说话人类型进行调整准则的设计，设计过程繁琐、工作量较大，并且无法涵盖所有参数调整情况，进而导致语音识别效果不佳的问题。
[0005]根据本申请的一个方面...

【技术保护点】

【技术特征摘要】
1.一种基于元学习的自适应语音识别方法，其特征在于，包括：利用预处理后的样本语音数据训练语音识别模型以及元学习适应模型；基于所述元学习适应模型，将所述语音识别模型的初始模型参数调整为与目标语音类型匹配的目标模型参数；利用配置有所述目标模型参数的语音识别模型识别所述目标语音类型下的目标语音。2.根据权利要求1所述的方法，其特征在于，所述利用预处理后的样本语音数据训练语音识别模型以及元学习适应模型，具体包括：对样本语音数据进行预处理，并标记所述样本语音数据对应的第一语音特征以及第一文本特征，所述预处理至少包括预加重处理、分帧处理、加窗处理；基于所述第一语音特征和所述第一文本特征训练符合第一训练标准的语音识别模型；利用所述样本语音数据以及所述语音识别模型，训练符合第二训练标准的元学习适应模型。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一语音特征和所述第一文本特征训练符合第一训练标准的语音识别模型，具体包括：将所述第一语音特征输入所述语音识别模型，获取文本输出结果；依据所述文本输出结果与所述第一文本特征计算第一损失函数；若确定所述第一损失函数小于第一预设阈值，则判定所述语音识别模型符合第一训练标准；所述利用所述样本语音数据以及所述语音识别模型，训练符合第二训练标准的元学习适应模型，具体包括：将所述样本语音数据划分为预设数量个数据块，并提取各个所述数据块的第二语音特征和第二文本特征；依据所述第二语音特征、所述第二文本特征以及所述语音识别模型，训练符合第二训练标准的元学习适应模型。4.根据权利要求3所述的方法，其特征在于，所述依据所述第二语音特征、所述第二文本特征以及所述语音识别模型，训练符合第二训练标准的元学习适应模型，具体包括：提取所述语音识别模型的初始模型参数；若判定当前数据块为划分的第一个数据块，则依据所述初始模型参数以及当前数据块的第二语音特征和第二文本特征，计算所述元学习适应模型在第一个数据块中的损失值、损失梯度以及新模型参数；若判定当前数据块非所述第一个数据块，则依据前一数据块的新模型参数和当前数据块的第二语音特征和第二文本特征，计算所述元学习适应模型在当前数据块中的损失值、损失梯度以及新模型参数；若判定所有数据块均完成训练，则利用各个数据块计算得到的损失值、...

【专利技术属性】
技术研发人员：罗剑，王健宗，程宁，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人