模型构建优化方法、设备、存储介质及程序产品技术

技术编号：35077773 阅读：13 留言：0更新日期：2022-09-28 11:44

本发明专利技术公开了一种模型构建优化方法、设备、存储介质及程序产品，方法包括：将第一样本数据输入至第一编码器编码得到第一编码特征；获取第二参与方设备将第二样本数据输入至第二编码器编码得到的第二编码特征；将第一编码特征和第二编码特征融合后输入至解码器得到重构样本数据；基于重构样本数据与第一样本数据之间的误差更新第一编码器以及计算中间结果，将中间结果发送给第二参与方设备更新第二编码器，根据更新后的第一编码器和第二编码器进行纵向联邦学习得到目标模型。本发明专利技术实现了利用无标签数据进行模型预训练，以使得无标签数据能够用于参与纵向联邦学习，进而能够帮助提高纵向联邦学习得到的模型的预测准确度。提高纵向联邦学习得到的模型的预测准确度。提高纵向联邦学习得到的模型的预测准确度。

全部详细技术资料下载

【技术实现步骤摘要】
模型构建优化方法、设备、存储介质及程序产品

[0001]本专利技术涉及人工智能
，尤其涉及一种模型构建优化方法、设备、存储介质及程序产品。

技术介绍

[0002]纵向联邦学习用于解决金融领域多方联合构建业务模型的数据孤岛问题。纵向联邦学习的应用场景是各参与方用户重叠多，而特征重叠少的情况，不同参与方拥有用户的不同领域/不同角度的信息。一个典型场景是，各方通过用户匹配发现重叠的用户比例较高，然而各方拥有的相应的标签比例较低，因此可以实际用于训练的样本较少，如何能够利用无标签的数据是一个具有重要实际意义的问题。

技术实现思路

[0003]本专利技术的主要目的在于提供一种模型构建优化方法、设备、存储介质及程序产品，旨在提出一种纵向联邦学习场景中采用无标签数据进行模型预训练的方法，以使得无标签数据能够用于参与纵向联邦学习，进而能够帮助提高纵向联邦学习得到的模型的预测准确度。
[0004]为实现上述目的，本专利技术提供一种模型构建优化方法，所述方法应用于参与纵向联邦学习的第一参与方设备，所述第一参与方设备部署第一编码器和解码器，参与纵向联邦学习的第二参与方设备部署第二编码器，所述方法包括以下步骤：
[0005]将第一样本数据输入至所述第一编码器进行编码得到第一编码特征；
[0006]获取第二编码特征，其中，所述第二编码特征由所述第二参与方设备将第二样本数据输入至所述第二编码器进行编码得到的；
[0007]将所述第一编码特征和所述第二编码特征进行融合后输入至所述解码器进行解码...

【技术保护点】

【技术特征摘要】
1.一种模型构建优化方法，其特征在于，所述方法应用于参与纵向联邦学习的第一参与方设备，所述第一参与方设备部署第一编码器和解码器，参与纵向联邦学习的第二参与方设备部署第二编码器，所述方法包括以下步骤：将第一样本数据输入至所述第一编码器进行编码得到第一编码特征；获取第二编码特征，其中，所述第二编码特征由所述第二参与方设备将第二样本数据输入至所述第二编码器进行编码得到的；将所述第一编码特征和所述第二编码特征进行融合后输入至所述解码器进行解码得到重构样本数据；基于所述重构样本数据与所述第一样本数据之间的误差更新所述第一编码器以及计算得到用于更新所述第二编码器的中间结果，将所述中间结果发送给所述第二参与方设备以供所述第二参与方设备更新所述第二编码器；在对所述第一编码器和所述第二编码器进行至少一轮迭代更新后，基于更新后的所述第一编码器和所述第二编码器与所述第二参与方设备进行纵向联邦学习得到目标模型。2.如权利要求1所述的模型构建优化方法，其特征在于，所述将第一样本数据输入至所述第一编码器进行编码得到第一编码特征的步骤包括：对第一样本数据中的部分数据进行变换，将经过变换后的第一样本数据输入至所述第一编码器进行编码得到第一编码特征。3.如权利要求2所述的模型构建优化方法，其特征在于，所述重构样本数据为针对所述第一样本数据中被变换的部分数据的重构数据，所述基于所述重构样本数据与所述第一样本数据之间的误差更新所述第一编码器以及计算得到用于更新所述第二编码器的中间结果的步骤包括：计算表征所述重构样本数据与所述第一样本数据中被变换的部分数据之间误差的自损失函数；计算所述自损失函数相对于所述第一编码器中参数的第一梯度值，以及计算所述自损失函数相对于所述第二编码特征的第二梯度值；根据所述第一梯度值更新所述第一编码器中的参数以更新所述第一编码器；将所述第二梯度值作为用于更新所述第二编码器的中间结果。4.如权利要求2所述的模型构建优化方法，其特征在于，所述对第一样本数据中的部分数据进行变换的步骤包括：当所述第一样本数据包括多个属性值时，将所述第一样本数据中的部分属性值变换为预设值或添加随机噪声；当所述第一样本数据为图像数据时，将所述图像数据中的部分像素点的像素值变换为预设像素值；当所述第一样本数据为文本数据时，将所述文本数据中的部分词语变换为预设词语。5.如权利要求1所述的模型构建优化方法，其特征在于，所述第一参与方设备中还部署投影模型，所述将所述第一编码特征和所述第二编码特征进行融合后输入至所述解码器进行解码得到重构样本数据的步骤包括：将所述第一编码特征和所述第二...

【专利技术属性】
技术研发人员：何元钦，康焱，骆家焕，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人