训练机器学习模型的方法、装置和计算机可读存储介质制造方法及图纸

技术编号：44527985 阅读：0 留言：0更新日期：2025-03-07 13:18

本公开提供一种训练机器学习模型的方法。在所述方法中，根据多个权重从第一训练集中抽样，以在第一迭代中训练机器学习模型。第一训练集包括对应于多个权重的多个级别。此外，在第一迭代后利用验证集评估机器学习模型按多个级别的多个第一效能；根据这些第一效能更新每个级别对应的权重；以及根据更新后的这些权重重新从第一训练集中抽样，以在第一迭代之后的第二迭代中训练机器学习模型。此外，使用上述方法的装置和计算机可读存储介质亦被提出。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及一种机器学习技术，特别涉及一种动态调整训练集的训练机器学习模型的方法、装置和计算机可读存储介质。

技术介绍

1、在语音情绪辨识(speech emotion recognition,ser)的领域中，噪音是一项重大的挑战。噪音可以混淆系统，导致辨识准确度降低。在现实世界中，要实现可靠且准确的语音情绪辨识系统，必须要有能力处理各种充满噪音的环境。

2、当前的技术主要有两种解决策略。第一种策略是先进行噪音清除，接着在干净的语音数据上进行辨识；第二种策略则是直接在含有噪音的语音数据上进行训练，尝试让系统模型在含有噪音下仍能对语音情绪进行准确辨识。

3、近年来，数据增强(data augmentation)技术被广泛用于语音情绪辨识领域，以增强模型对噪音的鲁棒性。这些增强方法通常会预定义好训练数据中的噪音级别，接着根据这些预定义的级别进行静态训练。

4、然而，静态的训练方式需要对不同噪音级别在模型训练的重要性有事前的理解，才能够合理分配不同噪音级别的权重。然而，由于诸如应用环境、训练数据分布等太多的因素都可能对重要性产生影响，因此这样的事前知识不太可能获得，导致静态的训练方式会使模型在某些噪音级别上的表现不佳，进而影响系统总体的性能。

技术实现思路

1、有鉴于此，本公开提出一种训练机器学习模型的方法、装置和电脑程序产品，能够在训练过程中动态地调整训练集，以提升机器学习模型的准确度。

2、本公开的第一个方面提出了一种训练机器学习模型的

3、在第一方面的一些实施例中，所述方法更包括在第二迭代后利用验证集评估机器学习模型按每个级别的第二效能；以及根据每个第二效能更新每个级别对应的权重。

4、在第一方面的一些实施例中，更新后的每个级别对应的权重与机器学习模型在每些级别的第一效能呈负相关。

5、在第一方面的一些实施例中，每一个权重皆不低于预设极小值。

6、在第一方面的一些实施例中，所述方法更包括将杂讯数据混合至无杂讯训练集，以生成第一训练集。

7、在第一方面的一些实施例中，根据多个权重从第一训练集中抽样，以在第一迭代中训练机器学习模型包括：根据多个权重分别在第一训练集的多个级别中抽样，以得到第一样本训练集；合并第一样本训练集以及无杂讯训练集，以生成第二训练集；以及利用第二训练集在第一迭代中训练机器学习模型。

8、在第一方面的一些实施例中，第一训练集包括有序数据集。

9、在第一方面的一些实施例中，所述方法更包括根据失真度指标，将第一训练集分为多个级别。

10、在第一方面的一些实施例中，机器学习模型包括语音辨识模型。

11、在第一方面的一些实施例中，根据失真度指标，将第一训练集分为多个级别包括根据语音质量感知评估(perceptual evaluation of speech quality，pesq)、短时客观可理解度(short-time objective intelligibility，stoi)以及频率加权信号到噪声比段落(frequency-weighted signal-to-noise ratio segmental，fwsnrseq)的至少其中之一，将第一训练集分为多个级别。

12、本公开的第二方面提出了一种电子装置，包括记忆体以及处理器。记忆体用以储存至少一个指令。处理器耦接于记忆体。当处理器执行所述至少一指令时，电子装置用以执行上述的计算机实施方法。

13、本公开的第三个方面提出了一种存储有程序的计算机可读存储介质，此程序包括指令，此指令在由电子装置的一个或者多个处理器执行时，致使电子装置执行上述的计算机实施方法。

本文档来自技高网...

【技术保护点】

1.一种训练机器学习模型的计算机实施方法，其特征在于，包括：

2.如权利要求1所述的计算机实施方法，其特征在于，还包括：

3.如权利要求1所述的计算机实施方法，其特征在于，更新后的所述多个级别对应的所述多个权重与所述机器学习模型在所述多个级别的所述多个第一效能呈负相关。

4.如权利要求3所述的计算机实施方法，其特征在于，所述多个权重中的每一者不低于预设极小值。

5.如权利要求1所述的计算机实施方法，其特征在于，更包括：

6.如权利要求5所述的计算机实施方法，其特征在于，根据所述多个权重从所述第一训练集中抽样，以在所述第一迭代中训练所述机器学习模型包括：

7.如权利要求1所述的计算机实施方法，其特征在于，所述第一训练集包括有序数据集。

8.如权利要求1所述的计算机实施方法，其特征在于，还包括：

9.如权利要求8所述的计算机实施方法，其特征在于，所述机器学习模型包括语音识别模型。

10.如权利要求9所述的计算机实施方法，其特征在于，根据所述失真度指标，将所述第一训练集分为所述多个级别包括：

11.一种电子装置，其特征在于，包括：

12.一种存储有程序的计算机可读存储介质，所述程序包括指令，其特征在于，所述指令在由电子装置的一个或者多个处理器执行时，致使所述电子装置执行如权利要求1至10中任一项所述的计算机实施方法。

...

【技术特征摘要】

1.一种训练机器学习模型的计算机实施方法，其特征在于，包括：

2.如权利要求1所述的计算机实施方法，其特征在于，还包括：

4.如权利要求3所述的计算机实施方法，其特征在于，所述多个权重中的每一者不低于预设极小值。

5.如权利要求1所述的计算机实施方法，其特征在于，更包括：

6.如权利要求5所述的计算机实施方法，其特征在于，根据所述多个权重从所述第一训练集中抽样，以在所述第一迭代中训练所述机器学习模型包括：

【专利技术属性】
技术研发人员：李祈均，吴亚泽，
申请(专利权)人：李祈均，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人