System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于语音识别模型的模型训练方法和装置制造方法及图纸_技高网

用于语音识别模型的模型训练方法和装置制造方法及图纸

技术编号:42375197 阅读:21 留言:0更新日期:2024-08-16 14:59
公开了一种用于语音识别模型的模型训练方法和装置。该模型训练方法包括:基于第一训练数据集对基于特定领域热词的原始语音识别模型进行预训练,以生成基于特定领域热词的预训练语音识别模型;对与预训练语音识别模型相对应的旁路矩阵参数进行初始化并对预训练语音识别模型进行微调,以生成与预训练语音识别模型相对应的旁路矩阵;基于旁路矩阵和第二训练数据集对多个待筛选训练数据集进行筛选,以生成用于旁路矩阵的经筛选训练数据集;以及基于经筛选训练数据集对旁路矩阵进行训练,以生成经训练旁路矩阵,其中,预训练语音识别模型和经训练旁路矩阵构成基于特定领域热词的经训练语音识别模型的至少一部分。

【技术实现步骤摘要】

本专利技术涉及计算机领域,尤其涉及一种用于语音识别模型的模型训练方法和装置


技术介绍

1、针对用于语音识别模型的训练数据的数据筛选对语音识别模型的训练效果非常关键,尤其是在医学、金融等特定领域。特定领域的语音数据与一般领域的语音数据有很大差异,通常具有特殊的词汇、术语、和语法结构等。仅使用一般领域的语音数据进行训练的语音识别模型通常对特定领域的语音数据的识别能力较差。但是,利用特定领域的语音数据对语音识别模型进行训练面临以下几个挑战:

2、1)语音数据标注困难:特定领域的语音数据通常需要专业人员进行标注,而这些专业人员可能难以获取或者昂贵。此外,标注过程中可能存在一些主观因素,导致标注结果的不一致性。

3、2)多样性语音样本获取难度大:特定领域的语音数据可能存在多样性,例如,不同的口音、语速、语调等。获取多样性语音样本可能需要耗费大量的时间和资源。

4、3)语音数据质量不高:特定领域的语音数据可能存在噪音、干扰等问题,导致数据质量较低。低质量的数据会影响语音识别模型的训练效果,并且可能导致语音识别模型在实际应用中的性能下降。


技术实现思路

1、根据本专利技术实施例的用于语音识别模型的模型训练方法,包括:基于第一训练数据集对基于特定领域热词的原始语音识别模型进行预训练,以生成基于特定领域热词的预训练语音识别模型,其中,第一训练数据集包括与特定领域热词相对应的第一多个语音-文本数据对;对与预训练语音识别模型相对应的旁路矩阵参数进行初始化并对预训练语音识别模型进行微调,以生成与预训练语音识别模型相对应的旁路矩阵;基于旁路矩阵和第二训练数据集对多个待筛选训练数据集进行筛选,以生成用于旁路矩阵的经筛选训练数据集,其中,第二训练数据集包括与特定领域热词相对应的第二多个语音-文本数据对;以及基于经筛选训练数据集对旁路矩阵进行训练,以生成经训练旁路矩阵,其中,预训练语音识别模型和经训练旁路矩阵构成基于特定领域热词的经训练语音识别模型的至少一部分。

2、根据本专利技术实施例的用于语音识别模型的模型训练装置,包括:存储器,被配置为存储计算机可执行指令;处理器,耦合到存储器,其中,这些计算机可执行指令在被处理器执行时,使得处理器执行以上所述的模型训练方法。

本文档来自技高网...

【技术保护点】

1.一种用于语音识别模型的模型训练方法,包括:

2.根据权利要求1所述的模型训练方法,其中,使用低秩自适应方法对所述预训练语音识别模型进行微调。

3.根据权利要求1所述的模型训练方法,其中,将所述旁路矩阵参数中的降维矩阵参数初始化为高斯分布的随机数,并将所述旁路矩阵参数中的升维矩阵参数初始化为零。

4.根据权利要求1所述的模型训练方法,其中,基于所述旁路矩阵和所述第二训练数据集对所述多个待筛选训练数据集进行筛选的处理包括:

5.根据权利要求4所述的模型训练方法,其中,使用梯度相似性搜索算法,选择所述多个待筛选训练数据集中的、其数据梯度与所述第二训练数据集的数据梯度的相似性度量高于相似性度量阈值的一个或多个待筛选训练数据集组成所述经筛选训练数据集。

6.根据权利要求5所述的模型训练方法,其中,基于所述旁路矩阵和所述第二训练数据集对所述多个待筛选训练数据集进行筛选的处理还包括:

7.根据权利要求6所述的模型训练方法,其中,对于所述多个待筛选训练数据集中的每个待筛选训练数据集的数据梯度的低秩表示,通过将所述第二训练数据集的数据梯度与该待筛选训练数据集的数据梯度的低秩表示进行内积计算来计算所述第二训练数据集的数据梯度与该待筛选训练数据集的数据梯度的低秩表示之间的相似性度量。

8.一种用于语音识别模型的模型训练装置,包括:

9.一种计算机可读存储介质,其上存储有计算机可执行指令,其中,所述计算机可执行指令在被处理器执行时,使得所述处理器执行权利要求1至7中任一项所述的模型训练方法。

10.一种计算机程序产品,包括计算机可执行指令,其中,所述计算机可执行指令在被处理器执行时,使得所述处理器执行权利要求1至7中任一项所述的模型训练方法。

...

【技术特征摘要】

1.一种用于语音识别模型的模型训练方法,包括:

2.根据权利要求1所述的模型训练方法,其中,使用低秩自适应方法对所述预训练语音识别模型进行微调。

3.根据权利要求1所述的模型训练方法,其中,将所述旁路矩阵参数中的降维矩阵参数初始化为高斯分布的随机数,并将所述旁路矩阵参数中的升维矩阵参数初始化为零。

4.根据权利要求1所述的模型训练方法,其中,基于所述旁路矩阵和所述第二训练数据集对所述多个待筛选训练数据集进行筛选的处理包括:

5.根据权利要求4所述的模型训练方法,其中,使用梯度相似性搜索算法,选择所述多个待筛选训练数据集中的、其数据梯度与所述第二训练数据集的数据梯度的相似性度量高于相似性度量阈值的一个或多个待筛选训练数据集组成所述经筛选训练数据集。

6.根据权利要求5所述的模型训练方法,其中,基于所述旁路矩阵和...

【专利技术属性】
技术研发人员:邓博文陈文轩
申请(专利权)人:广州昂宝电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1