模型训练方法、信息分类方法、装置、设备与程序产品制造方法及图纸

技术编号：42810982 阅读：0 留言：0更新日期：2024-09-24 20:52

本公开提供了一种模型训练方法、信息分类方法、装置、电子设备及计算机程序产品，涉及计算机技术领域。该方法包括：获取初始数据集，基于多个初始分类标签对初始数据集进行聚类处理，得到多标签分类数据集；确定多标签分类数据集对应的混淆变量与工具变量，确定混淆变量与工具变量之间的变量映射关系；基于变量映射关系构建初始因果表征模型的因果表征损失函数，初始因果表征模型用于表征干预变量与结果变量之间的关联关系；基于多标签分类数据集与因果表征损失函数，对初始因果表征模型进行训练，得到因果表征模型。本公开可以基于聚类结果指导模型训练，提升模型的泛化能力，并且基于工具变量可以消除由于未观测混淆变量带来的内生性问题。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其涉及一种模型训练方法、信息分类方法、模型训练装置、信息分类装置、电子设备与计算机程序产品。

技术介绍

1、近年来，短视频已成为社交媒体的主流趋势，并迅速成为信息传播、电商、教育等应用的重要载体。在短视频服务中，为了提升视频资源分发的有效性，内容提供商通常为用户分配尽可能多的资源来直接提升其网络服务质量(quality ofservice，qos)。然而，随着用户请求的迅速增多以及视频码率的不断增长，如何在有限资源成本下实现视频内容的合理分发是一项亟待解决的问题。在相关方案中，工业界的常用做法是基于ab实验数据，对分发至不同用户的视频质量进行个性化的调整，尽可能采用有效的资源成本制定合理的资源分发策略。

技术实现思路

1、本公开提供一种模型训练方法、信息分类方法、装置、电子设备与计算机程序产品，以至少解决相关技术中无法应对观测数据中存在的选择性偏差问题、内生性问题和分布漂移问题。本公开的技术方案如下：

2、根据本公开实施例的第一方面，提供一种模型训练方法，包括：获取初始数据集，基于多个初始分类标签对所述初始数据集进行聚类处理，得到多标签分类数据集，所述初始数据集为混淆变量、干预变量与结果变量之间存在关联关系的数据集；确定所述多标签分类数据集对应的混淆变量与工具变量，确定所述混淆变量与所述工具变量之间的变量映射关系，所述变量映射关系用于反映所述工具变量对所述结果变量的影响；基于所述变量映射关系构建初始因果表征模型的因果表征损失函数，所述初始因果表征模型

3、在本公开的一种示例性实施例中，所述基于多个初始分类标签对所述初始数据集进行聚类处理，得到多标签分类数据集，包括：获取预设场景下的多个源域数据，所述源域数据是基于不同数据源获取到的原始数据；对所述多个源域数据进行特征工程处理，得到所述初始数据集；确定所述初始数据集对应的多个初始分类标签；根据所述多个初始分类标签对所述初始数据集进行聚类处理，得到所述多标签分类数据集。

4、在本公开的一种示例性实施例中，所述根据所述多个初始分类标签对所述初始数据集进行聚类处理，得到所述多标签分类数据集，包括：基于所述多个初始分类标签，分别训练各所述初始分类标签对应的回归模型；对多个所述回归模型进行迭代处理，得到各所述回归模型的错误分类结果；根据所述错误分类结果对所述多个初始分类标签进行更新，直至更新后的初始分类标签对应的标签更新数据量小于预设数量阈值，得到数据分类标签；基于所述数据分类标签确定所述多标签分类数据集。

5、在本公开的一种示例性实施例中，所述确定所述混淆变量与所述工具变量之间的变量映射关系，包括：基于预设场景下的结果变量确定所述多标签分类数据集对应的混淆变量；根据所述混淆变量确定所述工具变量，所述工具变量是与干预变量相关且与混淆变量无关的变量；基于所述混淆变量与所述工具变量，构建初始回归网络模型，并确定所述初始回归网络模型对应的回归模型损失函数；基于所述回归模型损失函数对所述初始回归网络模型进行训练，得到回归网络模型；根据所述回归网络模型，确定所述变量映射关系。

6、在本公开的一种示例性实施例中，所述基于所述变量映射关系构建初始因果表征模型的因果表征损失函数，包括：获取预先构建的初始因果表征模型，构建所述初始因果表征模型对应的第一项损失函数；基于所述变量映射关系，构建所述初始因果表征模型对应的第二项损失函数；基于所述第一项损失函数与所述第二项损失函数，构建所述因果表征损失函数。

7、在本公开的一种示例性实施例中，所述构建所述初始因果表征模型对应的第一项损失函数，包括：对多个所述混淆变量进行表征学习处理，得到各所述混淆变量对应的混淆变量表征值，确定各所述混淆变量表征值的预测输出结果；确定所述混淆变量与所述工具变量之间的变量分布比例；确定模型输出目标值，基于多个所述预测输出结果、所述变量分布比例与所述模型输出目标值，构建所述第一项损失函数。

8、在本公开的一种示例性实施例中，所述基于所述变量映射关系，构建所述初始因果表征模型对应的第二项损失函数，包括：获取所述混淆变量对应的混淆变量表征值；根据所述变量映射关系与所述混淆变量表征值之间的积分概率度量距离，构建所述第二项损失函数。

9、根据本公开实施例的第二方面，提供一种信息分类方法，包括：获取资源数据与预先训练的因果表征模型，所述因果表征模型是采用模型训练方法训练得到；由所述因果表征模型对所述资源数据进行分类处理，基于得到的分类结果确定目标用户群体，所述目标用户群体为用户体验敏感度处于指定敏感度阈值区间的用户群体；向所述目标用户群体下发目标资源数据，所述目标资源数据满足指定参数阈值。

10、根据本公开实施例的第三方面，提供一种模型训练装置，包括：数据集确定模块，用于获取初始数据集，基于多个初始分类标签对所述初始数据集进行聚类处理，得到多标签分类数据集，所述初始数据集为混淆变量、干预变量与结果变量之间存在关联关系的数据集；变量映射确定模块，用于确定所述多标签分类数据集对应的混淆变量与工具变量，确定所述混淆变量与所述工具变量之间的变量映射关系，所述变量映射关系用于反映所述工具变量对所述结果变量的影响；损失函数构建模块，用于基于所述变量映射关系构建初始因果表征模型的因果表征损失函数，所述初始因果表征模型用于表征所述干预变量与所述结果变量之间的关联关系；模型训练模块，用于基于所述多标签分类数据集与所述因果表征损失函数，对所述初始因果表征模型进行训练，得到因果表征模型。

11、在本公开的一种示例性实施例中，所述数据集确定模块包括数据集确定单元，用于：获取预设场景下的多个源域数据，所述源域数据是基于不同数据源获取到的原始数据；对所述多个源域数据进行特征工程处理，得到所述初始数据集；确定所述初始数据集对应的多个初始分类标签；根据所述多个初始分类标签对所述初始数据集进行聚类处理，得到所述多标签分类数据集。

12、在本公开的一种示例性实施例中，所述数据集确定单元包括数据聚类子单元，用于：基于所述多个初始分类标签，分别训练各所述初始分类标签对应的回归模型；对多个所述回归模型进行迭代处理，得到各所述回归模型的错误分类结果；根据所述错误分类结果对所述多个初始分类标签进行更新，直至更新后的初始分类标签对应的标签更新数据量小于预设数量阈值，得到数据分类标签；基于所述数据分类标签确定所述多标签分类数据集。

13、在本公开的一种示例性实施例中，所述变量映射确定模块包括变量映射确定单元，用于：基于预设场景下的结果变量确定所述多标签分类数据集对应的混淆变量；根据所述混淆变量确定所述工具变量，所述工具变量是与干预变量相关且与混淆变量无关的变量；基于所述混淆变量与所述工具变量，构建初始回归网络模型，并确定所述初始回归网络模型对应的回归模型损失函数；基于所述回本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于多个初始分类标签对所述初始数据集进行聚类处理，得到多标签分类数据集，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述多个初始分类标签对所述初始数据集进行聚类处理，得到所述多标签分类数据集，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述混淆变量与所述工具变量之间的变量映射关系，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述变量映射关系构建初始因果表征模型的因果表征损失函数，包括：

6.根据权利要求5所述的方法，其特征在于，所述构建所述初始因果表征模型对应的第一项损失函数，包括：

7.根据权利要求5所述的方法，其特征在于，所述基于所述变量映射关系，构建所述初始因果表征模型对应的第二项损失函数，包括：

8.一种信息分类方法，其特征在于，包括：

9.一种模型训练装置，其特征在于，包括：

10.一种信息分类装置，其特征在于，包括：

12.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的模型训练方法，或实现如权利要求8所述的信息分类方法。

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于多个初始分类标签对所述初始数据集进行聚类处理，得到多标签分类数据集，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述多个初始分类标签对所述初始数据集进行聚类处理，得到所述多标签分类数据集，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述混淆变量与所述工具变量之间的变量映射关系，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述变量映射关系构建初始因果表征模型的因果表征损失函数，包括：

6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员：刘文洋，马茗，王智，郭君健，陈彬，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人