当前位置: 首页 > 专利查询>贾晓丰高嵩专利>正文

一种模型生成方法、装置以及用于模型生成的装置制造方法及图纸

技术编号:29024404 阅读:18 留言:0更新日期:2021-06-26 05:25
本发明专利技术实施例提供一种模型生成方法、装置以及用于模型生成的装置。该方法中,响应于模型需求方发送的模型生成请求,获取至少两个数据提供方提供的包括样本用户的预设维度下的用户特征以及样本用户的用户标签的密文训练数据。对于任一预设维度的用户特征,对用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵。基于训练数据矩阵以及用户标签,训练获取密文的目标模型,密文计算方对密文的处理方式与密文训练数据的加密方式相匹配,向模型需求方返回密文的目标模型。这样,通过使用多种数据来源的密文训练数据进行训练,一定程度上可以确保模型训练的效果,以及确保以多个数据提供方提供的多种训练数据进行训练时的数据安全。进行训练时的数据安全。进行训练时的数据安全。

【技术实现步骤摘要】
一种模型生成方法、装置以及用于模型生成的装置


[0001]本专利技术涉及网络
,尤其涉及一种模型生成方法、装置以及用于模型生成的装置。

技术介绍

[0002]在模型训练过程中,训练数据对于模型训练的训练效果起到至关重要的作用。
[0003]现有方式中,在训练模型时,往往是利用单一数据源的数据直接训练获取模型。这种方式中,获取到的模型的处理效果往往较差。

技术实现思路

[0004]本专利技术实施例提供一种模型生成方法、装置以及用于模型生成的装置,可以解决训练获取到的模型的处理效果往往较差的问题。
[0005]为了解决上述问题,本专利技术实施例公开了一种模型生成方法,应用于密文计算方,所述方法包括:接收模型需求方发送的模型生成请求;响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;向所述模型需求方返回所述密文的目标模型。
[0006]另一方面,本专利技术实施例公开了一种模型生成装置,应用于密文计算方,所述装置包括:第一接收模块,用于接收模型需求方发送的模型生成请求;获取模块,用于响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;向量化模块,用于对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;训练模块,用于基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标
模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;第一返回模块,用于向所述模型需求方返回所述密文的目标模型。
[0007]再一方面,本专利技术实施例公开了一种用于模型生成的装置,包括有存储器,以及一个或者一个以上程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收模型需求方发送的模型生成请求;响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;向所述模型需求方返回所述密文的目标模型。
[0008]又一方面,本专利技术实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的模型生成方法。
[0009]本专利技术实施例包括以下优点:本专利技术实施例的模型生成方法中,响应于模型需求方发送的模型生成请求,会获取至少两个数据提供方提供的密文训练数据,密文训练数据包括样本用户的预设维度下的用户特征以及样本用户的用户标签。对于任一预设维度的用户特征,对用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵。不同分组编号对应不同分组,不同分组表征不同的特征范围;训练数据矩阵的行数为样本用户的总数量m,训练数据矩阵的列数为预设维度的总数量n与用户特征对应的分组的总数量n
bins
之间的乘积。接着,基于训练数据矩阵以及用户标签,训练获取密文的目标模型,密文计算方对密文的处理方式与密文训练数据的加密方式相匹配,最后,向模型需求方返回密文的目标模型。这样,通过使用多种数据来源的密文训练数据进行训练,一定程度上可以确保模型训练的效果,以及确保以多个数据提供方提供的多种训练数据进行训练时的数据安全。
附图说明
[0010]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本专利技术的一种模型生成方法实施例的步骤流程图;图2是本专利技术实施例提供的一种系统流程示意图;图3是本专利技术的一种模型生成装置实施例的结构框图;图4是本专利技术的一种用于模型生成的装置800的框图;及图5是本专利技术的一些实施例中服务器的结构示意图。
具体实施方式
[0012]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0013]方法实施例参照图1,示出了本专利技术的一种模型生成方法实施例的步骤流程图,应用于密文计算方,所述方法包括如下步骤:步骤101、接收模型需求方发送的模型生成请求。
[0014]步骤102、响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签。
[0015]步骤103、对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积。
[0016]步骤104、基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配。
[0017]步骤105、向所述模型需求方返回所述密文的目标模型。
[0018]其中,密文计算方可以是用于进行密文计算的平台,密文计算方可以为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型生成方法,其特征在于,应用于密文计算方,所述方法包括:接收模型需求方发送的模型生成请求;响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征不同的特征范围;所述训练数据矩阵的行数为所述样本用户的总数量m,所述训练数据矩阵的列数为所述预设维度的总数量n与所述用户特征对应的分组的总数量n
bins
之间的乘积;基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型;所述密文计算方对密文的处理方式与所述密文训练数据的加密方式相匹配;向所述模型需求方返回所述密文的目标模型。2.根据权利要求1所述的方法,其特征在于,所述用户标签用于表征所述样本用户是否违约;所述基于所述训练数据矩阵以及所述用户标签,训练获取密文的目标模型,包括:根据所述训练数据矩阵以及m*n
bins
维的用户标签矩阵,计算各预设维度的用户特征所对应的各分组内的违约用户数以及未违约用户数;所述用户标签矩阵中的行元素为所述训练数据矩阵中对应行元素所对应的样本用户的用户标签;根据所述违约用户数以及所述未违约用户数,计算各所述用户特征对应的权重值;所述权重值用于表征所述用户特征对所述目标模型的输出值的影响程度;根据各所述用户特征对应的权重值,对预设的逻辑回归模型进行训练,以获取密文的所述目标模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述训练数据矩阵以及m*n
bins
维的用户标签矩阵,计算各预设维度的用户特征所对应的各分组内的违约用户数以及未违约用户数,包括:对于所述训练数据矩阵中的一个m*n
bins
维的矩阵分部,计算所述矩阵分部的转置矩阵与所述用户标签矩阵的乘积,得到第一结果矩阵;所述矩阵分部包含的元素基于一个所述预设维度的用户特征对应的分组编号编码得到;将所述第一结果矩阵中各行元素之和,确定为所述行对应的分组内的第一数量;对于任一所述分组,将所述样本用户的总数量与所述分组内的第一数量的差值,确定为第二数量;所述第一数量为所述未违约用户数时,所述第二数量为所述违约用户数;所述第一数量为所述违约用户数时,所述第二数量为所述未违约用户数。4.根据权利要求3所述的方法,其特征在于,所述根据各所述用户特征对应的权重值,对预设的逻辑回归模型进行训练,以获取密文的所述目标模型,包括:对于任一所述矩阵分部,计算所述矩阵分部与目标权重值组成的权重列矩阵的乘积,得到第二结果矩阵;所述目标权重值是所述矩阵分部对应的预设维度的用户特征所对应的权重值;将各个矩阵分部的第二结果矩阵进行组合,得到目标数据矩阵;基于所述目标数据矩阵对所述逻辑回归模型进行训练,以获取密文的目标模型。5.根据权利要求1至4任一所述的方法,其特征在于,所述目标模型为信用评分卡模型;所述方法还包括:
接收预测需求方发送的预测请求;所述预测请求中包括待预测用户的相关数据;响应于所述预测请求,根据所述待预测用户的相关数据以及所述信用评分卡模型,确定所述待预测用户对应的信用评分;向所述预测需求方返回所述信用评分。6.根据权利要求1至4任一所述的方法,其特征在于,所述密文计算方的部分计算节点部署于所述数据提供方和/或所述模型需求方;所述部分计算节点用于对部分密文训练数据进行处理。7.根据权利要求1所述的方法,其特征在于,所述对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵,包括:对所述用户特征进行数据分组,以确定所述用户特征对应的分组编号;将所述用户特征对应的分组编号编码为编号向量;所述编号向量的维数为n
bins
;将各个所述样本用户的用户特征对应的编号向量分别作为行元素,以组成所述训练数据矩阵。8.一种模型生成装置,其特征在于,应用于密文计算方,所述装置包括:第一接收模块,用于接收模型需求方发送的模型生成请求;获取模块,用于响应于所述模型生成请求,获取至少两个数据提供方提供的密文训练数据;所述密文训练数据包括样本用户的预设维度下的用户特征以及所述样本用户的用户标签;向量化模块,用于对于任一预设维度的所述用户特征,对所述用户特征所属分组的分组编号进行向量编码,以获取向量化的训练数据矩阵;不同分组编号对应不同分组,不同分组表征...

【专利技术属性】
技术研发人员:陈智隆王国赛贾晓丰高嵩
申请(专利权)人:贾晓丰高嵩
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1