【技术实现步骤摘要】
一种模型生成方法、装置以及用于模型生成的装置
[0001]本专利技术涉及网络
,尤其涉及一种模型生成方法、装置以及用于模型生成的装置。
技术介绍
[0002]在模型训练过程中,训练数据对于模型训练的训练效果起到至关重要的作用。
[0003]现有方式中,在训练模型时,往往是利用单一数据源的数据直接训练获取模型。这种方式中,获取到的模型的处理效果往往较差。
技术实现思路
[0004]本专利技术实施例提供一种模型生成方法、装置以及用于模型生成的装置,可以解决训练获取到的模型的处理效果往往较差的问题。
[0005]为了解决上述问题,本专利技术实施例公开了一种模型生成方法,应用于密文计算方,所述方法包括:接收模型需求方发送的模型生成请求;响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;向所述模型需求方返回所述密文的目标模型。
[0006]另 ...
【技术保护点】
【技术特征摘要】
1.一种模型生成方法,其特征在于,应用于密文计算方,所述方法包括:接收模型需求方发送的模型生成请求;响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;向所述模型需求方返回所述密文的目标模型。2.根据权利要求1所述的方法,其特征在于,所述用户标签用于表征所述样本用户是否违约;所述基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型,包括:根据所述训练数据矩阵以及m*n
bins
维的用户标签矩阵,计算各预设维度的用户特征所对应的各分组内的违约用户数以及未违约用户数;所述用户标签矩阵中的行元素为所述训练数据矩阵中对应行元素所对应的样本用户的用户标签;根据所述违约用户数以及所述未违约用户数,计算各所述用户特征对应的权重值;所述权重值用于表征所述用户特征对所述目标模型的输出值的影响程度;根据各所述用户特征对应的权重值,对预设的逻辑回归模型进行训练,以获取密文的所述目标模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述训练数据矩阵以及m*n
bins
维的用户标签矩阵,计算各预设维度的用户特征所对应的各分组内的违约用户数以及未违约用户数,包括:对于所述训练数据矩阵中的一个m*n
bins
维的矩阵分部,计算所述矩阵分部的转置矩阵与所述用户标签矩阵的乘积,得到第一结果矩阵;所述矩阵分部包含的元素基于一个所述预设维度的用户特征对应的分组编号编码得到;将所述第一结果矩阵中各行元素之和,确定为所述行对应的分组内的第一数量;对于任一所述分组,将所述样本用户的总数量与所述分组内的第一数量的差值,确定为第二数量;所述第一数量为所述未违约用户数时,所述第二数量为所述违约用户数;所述第一数量为所述违约用户数时,所述第二数量为所述未违约用户数。4.根据权利要求3所述的方法,其特征在于,所述根据各所述用户特征对应的权重值,对预设的逻辑回归模型进行训练,以获取密文的所述目标模型,包括:对于任一所述矩阵分部,计算所述矩阵分部与目标权重值组成的权重列矩阵的乘积,得到第二结果矩阵;所述目标权重值是所述矩阵分部对应的预设维度的用户特征所对应的权重值;将各个矩阵分部的第二结果矩阵进行组合,得到目标数据矩阵;基于所述目标数据矩阵对所述逻辑回归模型进行训练,以获取密文的目标模型。5.根据权利要求1至4任一所述的方法,其特征在于,所述目标模型为信用评分卡模型;所述方法还包括:
接收预测需求方发送的预测请求;所述预测请求中包括待预测用户的相关数据;响应于所述预测请求,根据所述待预测用户的相关数据以及所述信用评分卡模型,确定所述待预测用户对应的信用评分;向所述预测需求方返回所述信用评分。6.根据权利要求1至4任一所述的方法,其特征在于,所述密文计算方的部分计算节点部署于所述数据提供方和/或所述模型需求方;所述部分计算节点用于对部分密文训练数据进行处理。7.根据权利要求1所述的方法,其特征在于,所述对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵,包括:对所述用户特征进行数据分组,以确定所述用户特征对应的分组编号;将所述用户特征对应的分组编号编码为编号向量;所述编号向量的维数为n
bins
;将各个所述样本用户的用户特征对应的编号向量分别作为行元素,以组成所述训练数据矩阵。8.一种模型生成装置,其特征在于,应用于密文计算方,所述装置包括:第一接收模块,用于接收模型需求方发送的模型生成请求;获取模块,用于响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;向量化模块,用于对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。