模型训练用标签数据的校正方法、装置、设备及介质制造方法及图纸

技术编号：34737160 阅读：42 留言：0更新日期：2022-08-31 18:28

本发明专利技术涉及数据处理技术领域，尤其涉及一种模型训练用标签数据的校正方法、装置、设备及介质。该方法获取实时标签表和离线标签数据，在检测到类型为可实时化类型且当前时间点达到预设时间点时，计算离线标签数据与实时标签表中每个实时标签数据的相似度，若最大相似度满足预设校正条件，校正对应实时标签数据，得到校正标签数据并更新实时标签表采用离线标签数据对实时标签数据进行校正，在保证实时标签数据时效性的同时，提高了实时标签数据的准确性。准确性。准确性。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练用标签数据的校正方法、装置、设备及介质

[0001]本专利技术涉及数据处理
，尤其涉及一种模型训练用标签数据的校正方法、装置、设备及介质。

技术介绍

[0002]目前，随着大数据技术和人工智能技术的发展，模型标签数据可分为实时标签数据和离线标签数据，离线标签数据通常是指T+1时效的标签数据，即第T天采集的标签数据需要在T+1天才能应用，采用模型标签数据为人工智能模型动态地提供标签参数，可有效提高人工智能模型的准确率。
[0003]然而，采用离线标签数据虽然能够确保模型的准确性，但其时效为T+1时效，时效较长，会导致用户体验较差。而采用实时标签数据时效性高，但在数据量较大时，会出现实时标签数据丢失或者不可用的情况，准确性较低。因此，如何在标签数据时效性较高的情况下，提高标签数据的准确性成为了亟需解决的问题。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供了一种模型训练用标签数据的校正方法、装置、设备及介质，以解决标签数据时效性较高的情况下，标签数据的准确性较低的问题。
[0005]第一方面，本专利技术实施例提供一种模型训练用标签数据的校正方法，所述校正方法包括：
[0006]获取实时标签表和离线标签数据，所述实时标签表包括至少一个实时标签数据；
[0007]检测所述离线标签数据的类型，在检测到所述类型为可实时化类型时，判断当前时间点是否达到预设时间点；
[0008]若所述当前时间点达到所述预设时间点，则计算所述离线标签数据与所述实时标签表中...

【技术保护点】

【技术特征摘要】
1.一种模型训练用标签数据的校正方法，其特征在于，所述方法包括：获取实时标签表和离线标签数据，所述实时标签表包括至少一个实时标签数据；检测所述离线标签数据的类型，在检测到所述类型为可实时化类型时，判断当前时间点是否达到预设时间点；若所述当前时间点达到所述预设时间点，则计算所述离线标签数据与所述实时标签表中的每个实时标签数据的相似度，并检测最大相似度是否满足预设校正条件；若所述最大相似度满足所述预设校正条件，则根据所述离线标签数据校正对应最大相似度的实时标签数据，得到校正标签数据，并采用所述校正标签数据更新所述实时标签表。2.根据权利要求1所述的校正方法，其特征在于，所述实时标签数据对应于实时时间戳；在所述当前时间点达到所述预设时间点之后，还包括：将所述离线标签数据配置为预设时间戳；检测所述实时标签表中的每个实时标签数据对应的实时时间戳是否小于所述预设时间戳；相应地，所述计算所述离线标签数据与所述实时标签表中的每个实时标签数据的相似度包括：确定对应实时时间戳小于所述预设时间戳的实时标签数据为目标标签数据；计算所述离线标签数据与所述实时标签表中的每个目标标签数据的相似度。3.根据权利要求2所述的校正方法，其特征在于，所述采用所述校正标签数据更新所述实时标签表包括：将所述校正标签数据配置为预设时间戳；根据所述预设时间戳，采用所述校正标签数据更新所述实时标签表。4.根据权利要求1所述的校正方法，其特征在于，所述根据所述离线标签数据校正对应最大相似度的实时标签数据，得到校正标签数据包括：将所述对应最大相似度的实时标签数据和所述离线标签数据输入训练好的校正模型中的编码器提取特征，得到中间表征；对所述中间表征进行高斯采样，将采样结果输入训练好的校正模型中的解码器进行重构，确定重构结果为所述校正标签数据。5.根据权利要求4所述的校正方法，其特征在于，以离线样本数据和实时样本数据作为所述校正模型训练的训练样本，以校正损失函数作为校正模型训练的损失函数；所述校正模型的训练过程包括：将所述离线样本数据和所述实时样本数据输入所述编码器进行特征提取，得到样本表征；对所述样本表征进行高斯采样，得到样本采样结果，并将所述样本采样结果输入所述解码器进行重构，得到校正样本数据；根据校正样本数据、所述实时样本数据和所述离线样本数据计算所述校正损失函数，以所述...

【专利技术属性】
技术研发人员：李培林，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人