System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及数据处理,尤其涉及一种特征补齐模型训练方法、特征补齐模型训练装置、计算机可读存储介质、电子设备以及计算机程序产品。
技术介绍
1、在人物画像刻画的过程中或者机器学习模型的训练过程中,若是某些特征存在缺失元素,则需要对缺失元素进行补齐。而相关技术中,一般是获取缺失元素的统计值(例如众值,均值等)来进行补齐。
2、然而,通过相关技术提供的特征补齐方案所确定的补齐特征,存在准确度有待提高的问题。
3、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本说明书的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本说明书的目的在于提供一种特征补齐模型训练方法、特征补齐模型训练装置、计算机可读存储介质、电子设备以及计算机程序产品,至少在一定程度上有利于提升补齐特征的准确度。
2、本说明书的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本说明书的实践而习得。
3、根据本说明书的一个方面,提供一种特征补齐模型训练方法,该方法包括:确定正类样本,以及确定负类样本;固定对抗生成器的生成器的第一参数不变,通过上述正类样本和上述负类样本,训练上述对抗生成器的判别器;固定上述对抗生成器的判别器的第二参数不变,通过上述负类样本,训练上述对抗生成器的生成器;将训练后的对抗生成器确定为特征补齐模型。
4、根据本说明书的另一个方面,提供一种特征补齐模型训练装置,该装置包括:
5
6、判别器训练模块,用于固定对抗生成器的生成器的第一参数不变,通过上述正类样本和上述负类样本,训练上述对抗生成器的判别器;
7、生成器训练模块,用于固定上述对抗生成器的判别器的第二参数不变,通过上述负类样本,训练上述对抗生成器的生成器;
8、模型训练模块,用于将训练后的对抗生成器确定为特征补齐模型。
9、根据本说明书的再一个方面,提供一种特征补齐模型,该模型包括:生成器以及隐向量处理模块。
10、其中,上述生成器,用于接收目标特征,上述目标特征中包含一个或多个待补齐元素,上述目标特征所包含的多个元素用于反映属于同一用户的多个属性;上述生成器,还用于对上述目标特征进行处理得到目标对应的目标隐向量,其中,上述特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的,上述目标隐向量包含目标连续子特征和目标离散子特征;以及,隐向量处理模块,用于根据上述目标连续子特征确定和上述目标离散子特征,确定上述目标特征的补齐特征。
11、根据本说明书的另一个方面,提供一种电子设备,包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述实施例中的特征补齐方法。
12、根据本说明书的一个方面,提供一种计算机可读存储介质,上述计算机可读存储介质中存储有指令,当上述指令在计算机或处理器上运行时,使得上述计算机或处理器执行如上述实施例中的特征补齐方法。
13、根据本说明书的另一个方面,提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或处理器执行如上述实施例中的特征补齐方法。
14、本说明书的实施例所提供的特征补齐模型训练方法及装置、介质、设备及产品,具备以下技术效果:
15、本说明书示例性的实施例提供的方案基于训练后的机器学习模型(即,基于特征补齐模型)实现的,且该特征补齐模型的生成器的损失函数为基于样本用户特征的显示分布建模确定的。具体地,将关于同一用户的目标特征输入至上述特征补齐模型,其中,上述目标特征中包含一个或多个待补齐元素。经该特征补齐模型的生成器处理后输出与目标特征对应的目标隐向量,其中,该目标隐向量包含目标连续子特征和目标离散子特征。进一步地,根据目标连续子特征确定和目标离散子特征,确定上述目标特征的补齐特征。相较于相关技术中使用统计值的方式来进行特征补齐,通过本说明书实施例提供的特征补齐方案所补齐的特征具有较高的准确度。
16、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
本文档来自技高网...【技术保护点】
1.一种特征补齐模型训练方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中,所述确定正类样本,包括:
3.根据权利要求1所述的方法,其中,所述确定负类样本,包括:
4.根据权利要求3所述的方法,其中,所述第j生成特征包括:第j离散特征部分和第j连续特征部分;
5.根据权利要求1至4中任意一项所述的方法,其中,所述通过所述正类样本和所述负类样本,训练所述对抗生成器的判别器,包括:
6.根据权利要求4所述的方法,其中,所述通过所述负类样本,训练所述对抗生成器的生成器,包括:
7.根据权利要求1所述的方法,其中,所述将训练后的对抗生成器确定为特征补齐模型之后,所述方法还包括:
8.根据权利要求7所述的方法,其中,所述补齐特征经所述特征补齐模型的判别器处理之后,所得到的所述判别器的输出值大于预设值,所述预设值的取值大于0.5且小于1。
9.根据权利要求7所述的方法,其中,所述根据所述目标连续子特征和所述目标离散子特征,确定所述目标特征的补齐特征,包括:
10.根据权利要
11.根据权利要求1-8任一项所述的方法,其中,所述特征补齐模型,包括:
12.一种特征补齐模型训练装置,其中,所述装置包括:
13.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1至11中任意一项所述的特征补齐模型训练方法。
14.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1至11中任意一项所述的特征补齐模型训练方法。
15.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1至11中任意一项所述的特征补齐模型训练方法。
...【技术特征摘要】
1.一种特征补齐模型训练方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中,所述确定正类样本,包括:
3.根据权利要求1所述的方法,其中,所述确定负类样本,包括:
4.根据权利要求3所述的方法,其中,所述第j生成特征包括:第j离散特征部分和第j连续特征部分;
5.根据权利要求1至4中任意一项所述的方法,其中,所述通过所述正类样本和所述负类样本,训练所述对抗生成器的判别器,包括:
6.根据权利要求4所述的方法,其中,所述通过所述负类样本,训练所述对抗生成器的生成器,包括:
7.根据权利要求1所述的方法,其中,所述将训练后的对抗生成器确定为特征补齐模型之后,所述方法还包括:
8.根据权利要求7所述的方法,其中,所述补齐特征经所述特征补齐模型的判别器处理之后,所得到的所述判别器的输出值大于预设值,所述预设值的取值大于0.5且小于1。
9.根据权利要求7所述的方法,其中,所述根据所述目标连续子特征和所述目标...
【专利技术属性】
技术研发人员:谢世明,陈鸿,吴军,曾多,元野,沈僮,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。