机器学习模型的训练方法、装置、电子设备及介质制造方法及图纸

技术编号：41985266 阅读：19 留言：0更新日期：2024-07-12 12:14

本申请提供了机器学习模型的训练方法、装置、电子设备及介质，模型训练方法包括，取第一样本和与所述第一样本进行标注得到的第一标注集合；利用所述第一样本和所述第一标注集合训练第一模型以得到训练好的第一模型；获取第二样本；将所述第二样本输入至所述训练好的第一模型，得到所述第二样本的第二标注集合；根据所述第一样本、所述第一标注集合、所述第二样本和所述第二标注集合训练第二模型；其中，所述第一模型的参数多于所述第二模型的参数。该方法可以降低模型标注成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，特别涉及一种机器学习模型的训练方法、装置、电子设备及介质。

技术介绍

1、通常，神经网络模型的性能精度和神经网络中参数的数量、以及训练数据的精细程度呈现正相关的关系。提升神经网络中参数的数量和提高训练数据的精密程度都可以对神经网络精度带来正向的效果。

2、在相关技术中，通常采用人工标注的方法对模型的样本进行标注。这种方法的成本较高，特别是在需要标注数据的量较大的情况下。

技术实现思路

1、本申请提供了一种机器学习模型的训练方法、装置、电子设备及介质，可以降低机器学习模型的标注成本。

2、本申请的第一方面公开了一种机器学习模型的训练方法，用于电子设备，获取第一样本和与所述第一样本进行标注得到的第一标注集合；利用所述第一样本和所述第一标注集合训练第一模型以得到训练好的第一模型；获取第二样本；将所述第二样本输入至所述训练好的第一模型，得到所述第二样本的第二标注集合；根据所述第一样本、所述第一标注集合、所述第二样本和所述第二标注集合训练第二模型；其中，所述第一模型的参数多于所述第二模型的参数。

3、在上述第一方面的一种可能的实现中，利用所述第一样本和所述第一标注集合训练第一模型以得到训练好的第一模型还包括得到第一特征集合,将所述第二样本输入至所述训练好的第一模型得到第二标注集合还包括得到第二特征集合，所述方法还包括，基于所述第一特征集合和所述第二特征集合训练所述第二模型。

4、在上述第一方面的一种可能的实现中，将所述第

5、在上述第一方面的一种可能的实现中，所述第一特征集合或第二特征集合对应于所述第一模型的总深度上的1/4、2/4，3/4层特征的并集。

6、在上述第一方面的一种可能的实现中，所述第一标注集合对应于所述第一样本中特定区域。

7、在上述第一方面的一种可能的实现中，所述第一模型的参数和所述第二模型的参数差异大于十倍。

8、本申请的第二方面公开了一种机器学习模型的训练装置，所述装置包括：第一获取模块，用于获取第一样本和与所述第一样本进行标注得到的第一标注集合；第二获取模块，用于获取第二样本；第一训练模块，用于利用所述第一样本和所述第一标注集合训练第一模型以得到训练好的第一模型；第三获取模块，用于将所述第二样本输入至所述训练好的第一模型，得到所述第二样本的第二标注集合；第二训练模块，根据所述第一样本、所述第一标注集合、所述第二样本和所述第二标注集合训练第二模型，其中，所述第一模型的参数多于所述第二模型的参数。

9、本申请的第三方面公开了一种电子设备，所述设备包括存储有计算机可执行指令的存储器和处理器；当所述指令被所述处理器执行时，使得所述设备实施根据本申请第一方面的方法。

10、本申请的第四方面公开了一种计算机可读介质，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现本申请第一方面的方法。

11、本申请的第五方面公开了一种计算机程序产品，所述计算机程序被处理器执行时实现本申请第一方面的方法。

12、本申请提供的机器学习模型的训练方法、装置、电子设备及介质，利用经过标注的第一样本来训练参数量较大的第一模型，再利用训练好的第一模型对未标准的第二样本进行预测。使用第一样本及其标注数据、第二样本及其标注数据来训练参数量较少的第二模型。本申请能够利用大模型对数据进行预标注，节省人力成本。另外，利用大模型提升小模型的训练数据的精密程度和数据量，从而提升小模型的精度。

本文档来自技高网...

【技术保护点】

1.一种机器学习模型的训练方法，应用于电子设备，其特征在于，所述方法包括，

2.根据权利要求1所述的机器学习模型的训练方法，其特征在于，利用所述第一样本和所述第一标注集合训练第一模型以得到训练好的第一模型还包括得到第一特征集合,

3.根据权利要求2所述的机器学习模型的训练方法，其特征在于，将所述第二样本输入至所述训练好的第一模型得到第二标注集合和第二特征集合包括，

4.根据权利要求2所述的机器学习模型的训练方法，其特征在于，所述第一特征集合或第二特征集合对应于所述第一模型的总深度上的1/4、2/4，3/4层特征的并集。

5.根据权利要求1所述的机器学习模型的训练方法，其特征在于，所述第一标注集合对应于所述第一样本中特定区域。

6.根据权利要求1所述的机器学习模型的训练方法，其特征在于，所述第一模型的参数和所述第二模型的参数差异大于十倍。

7.一种机器学习模型的训练装置，其特征在于，所述装置包括：

8.一种电子设备，其特征在于，所述设备包括存储有计算机可执行指令的存储器和处理器；当所述指令被所述处理

9.一种计算机可读介质，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现权利要求1至6中任一项所述的方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的方法。

...

【技术特征摘要】

1.一种机器学习模型的训练方法，应用于电子设备，其特征在于，所述方法包括，

3.根据权利要求2所述的机器学习模型的训练方法，其特征在于，将所述第二样本输入至所述训练好的第一模型得到第二标注集合和第二特征集合包括，

5.根据权利要求1所述的机器学习模型的训练方法，其特征在于，所述第一标注集合对应于所述第一样本中特定区域。

【专利技术属性】
技术研发人员：王奇勋，
申请(专利权)人：行吟信息科技武汉有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人