System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于区块链金融数据处理,具体涉及一种基于区块链和生成对抗网络的联合风控方法及系统。
技术介绍
1、如今,数据作为数字经济时代最为核心的生产要素,在社会生产、生活中体现的巨大价值已经不言而喻。随着数据收集、存储和处理成本的大幅下降和计算能力的大幅提升,全球数据以“井喷式”的速度生产。如何确保各类数据流通的安全合法性是包括政府、金融机构、数据供应商、公民个人等数据流通参与主体最为关心的话题。以银行为代表的金融企业与外部数据源(如电商企业等互联网公司)进行联合风控的数据合作中,外部数据源为银行提供更加精细的用户画像,提升了对银行用户的风控建模的表现。但随着隐私保护要求的提高和相关法律法规的出台,借助外部数据源的联合风控存在很大的隐私泄露问题。因此,如何在不泄露隐私的情况下实现多方数据融合以支撑业务更好地进行,成了金融行业必须面临的课题。
2、生成对抗网络学习原始数据的分布,并生成与这些原始数据相似的虚拟数据,生成的虚拟数据与原始数据有相同的统计特征,但每个虚拟数据与所有原始数据都不同。一个生成的虚拟数据不直接与任何个人相连,因此,利用生成对抗网络来生成数据,既满足了隐私保障,也能满足模型训练对数据规模的需求。区块链是一种由多方共同维护,使用密码学保证传输和访问安全,能够实现数据一致存储、难以篡改、防止抵赖的记账技术。区块链为隐私保护提供了两方面重要的支持:可信第三方以及抵抗作弊,这两点使得区块链在隐私保护中必不可少。
技术实现思路
1、本专利技术基于上述背景和现有技
2、一种基于区块链和生成对抗网络的联合风控方法,包括如下步骤:
3、在可信执行环境下获取本地数据,并对所述本地数据进行数据预处理,得到初始数据;
4、基于所述初始数据和随机数据训练生成对抗网络模型,通过生成对抗网络模型得到虚拟数据,其中,基于本地差分隐私算法对生成对抗网络模型的中间参数进行调整与监控,所述随机数据由随机函数生成;
5、区块链节点获取所述虚拟数据,并基于所述虚拟数据训练逻辑斯蒂模型,将训练好的逻辑斯蒂模型发送给所有区块链节点;
6、从区块链节点获取所述逻辑斯蒂模型,基于所述逻辑斯蒂模型对待测本地数据进行预测判断是否存在违约行为。
7、作为一种可实施方式,所述本地数据包括银行本地数据、电商企业本地数据和互联网公司本地数据,银行的本地数据至少包括:第一用户id、月收入、月支出及是否违约,其中,是否违约用0/1表示,0表示没有违约,1表示违约;电商企业本地数据至少包括:第二用户id、消费档次、购物深度、商品价格及商品购买数量;互联网公司本地数据至少包括:第三用户id、职业、出生地、工作地、城市层级、借贷软件安装量及投资软件安装量。
8、作为一种可实施方式,所述数据预处理包括以下步骤:数据预处理包括缺失值填充或者异常值处理中的一种或两种;
9、所述缺失值填充包括:
10、基于本地数据的分布情况,对缺失值进行填充,若本地数据均匀分布,则采用均值填补缺失值,若本地数据存在倾斜分布,则采用中位数填补缺失值;
11、所述异常值处理包括:基于平均值对本地数据出现的分布异常的离群点数据进行替换。
12、作为一种可实施方式,所述所述初始数据和随机数据训练生成对抗网络模型,通过生成对抗网络模型得到虚拟数据,包括以下步骤:
13、所述生成对抗网络模型包括生成器和判别器,初始化生成器和判别器,其中,所述生成器包括反卷积层和relu激活函数,所述判别器包括卷积层、leakyrelu激活函数及反向传播误差梯度函数;
14、所述反卷积层将输入转换为预设维度,基于relu激活函数生成虚拟数据;
15、所述卷积层将虚拟数据与初始数据转换到相应的指定维度,所属leakyrelu激活函数输出判断结果,基于所述判断结果判断输入数据为本地数据或虚拟数据;
16、基于所述反向传播误差梯度对所述relu激活函数进行更新进而生成新虚拟数据,将所述新虚拟数据作为新输入数据,对判别器进行训练,直至判别器的损失函数收敛,其中,收敛条件为计算虚拟数据与本地数据的wasserstein距离达到最小值。
17、作为一种可实施方式,所述基于本地差分隐私算法对生成对抗网络模型的中间参数进行调整与监控,包括以下步骤:
18、采用拉普拉斯机制为所述生成对抗网络模型的中间参数添加噪声,得到加噪声中间参数;
19、迭代训练生成对抗网络模型且产生隐私预算,并基于所述加噪声中间参数对生成对抗网络模型进行更新,直到迭代累积的隐私预算之和超过预设预算,则迭代终止,其中,所有加噪声中间参数保留在本地可信执行环境中。
20、作为一种可实施方式,所述区块链节点获取虚拟数据,使用所有区块链节点的虚拟数据联合训练逻辑斯蒂模型,将逻辑斯蒂模型发送给所有区块链节点,包括以下步骤:
21、区块链节点获取虚拟数据,对所述虚拟数据进行预处理,得到所有区块链节点的所有虚拟数据,其中,所述数据预处理包括规范化操作和去重操作;
22、将所有虚拟数据输入至逻辑斯蒂模型,所述逻辑斯蒂模型基于线性回归运算和sigmoid函数将所有虚拟数据映射为[0,1]区间中的一个概率值,若概率值大于0.5,表示输入的用户存在违约行为,否则,表示输入的用户不存在违约行为;
23、对逻辑斯蒂模型进行迭代,直到全局损失函数收敛或达到预设精度,并将逻辑斯蒂模型发送给所有参与的区块链节点。
24、一种基于区块链和生成对抗网络的联合风控系统,包括数据收集模块、生成数据模块、模型训练模块及模型推理模块:
25、所述数据收集模块,在可信执行环境下获取本地数据,并对所述本地数据进行数据预处理,得到初始数据;
26、基于所述初始数据和随机数据训练生成对抗网络模型,通过生成对抗网络得到虚拟数据,其中,基于本地差分隐私算法对生成对抗网络模型的中间参数进行调整与监控,所述随机数据由随机函数生成;
27、所述模型训练模块,区块链节点获取所述虚拟数据,并基于所述虚拟数据联合训练逻辑斯蒂模型,将训练好的逻辑斯蒂模型发送给所有区块链节点;
28、所述模型推理模块,用于从区块链节点获取所述逻辑斯蒂模型,基于所述逻辑斯蒂模型对待测本地数据进行预测判断是否存在违约行为。
29、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如下所述的方法:
30、在可信执行环境下获取本地数据,并对所述本地数据进行数据预处理,得到初始数据;
31、基于所述初始数据和随机数据训练生成对抗网络模型,通本文档来自技高网...
【技术保护点】
1.一种基于区块链和生成对抗网络的联合风控方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述本地数据包括银行本地数据、电商企业本地数据和互联网公司本地数据,银行本地数据至少包括:第一用户ID、月收入、月支出及是否违约,其中,是否违约用0/1表示,0表示没有违约,1表示违约;电商企业本地数据至少包括:第二用户ID、消费档次、购物深度、商品价格及商品购买数量;互联网公司本地数据至少包括:第三用户ID、职业、出生地、工作地、城市层级、借贷软件安装量、及投资软件安装量。
3.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述对所述本地数据进行数据预处理,得到初始数据,包括以下步骤:数据预处理包括缺失值填充或者异常值处理中的一种或两种;
4.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述基于所述初始数据和初始化随机数据训练生成对抗网络模型,通过生成对抗网络模型得到虚拟数据,包括以下步骤:
5.根据权利要求1所述的基于区块链和
6.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述区块链节点获取虚拟数据,使用所有区块链节点的虚拟数据联合训练逻辑斯蒂模型,将逻辑斯蒂模型发送给所有区块链节点,包括以下步骤:
7.一种基于区块链和生成对抗网络的联合风控系统,其特征在于,包括数据收集模块、生成数据模块、模型训练模块及模型推理模块:
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述的方法。
9.一种基于区块链和生成对抗网络的联合风控装置,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任意一项所述的方法。
...【技术特征摘要】
1.一种基于区块链和生成对抗网络的联合风控方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述本地数据包括银行本地数据、电商企业本地数据和互联网公司本地数据,银行本地数据至少包括:第一用户id、月收入、月支出及是否违约,其中,是否违约用0/1表示,0表示没有违约,1表示违约;电商企业本地数据至少包括:第二用户id、消费档次、购物深度、商品价格及商品购买数量;互联网公司本地数据至少包括:第三用户id、职业、出生地、工作地、城市层级、借贷软件安装量、及投资软件安装量。
3.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述对所述本地数据进行数据预处理,得到初始数据,包括以下步骤:数据预处理包括缺失值填充或者异常值处理中的一种或两种;
4.根据权利要求1所述的基于区块链和生成对抗网络的联合风控方法,其特征在于,所述基于所述初始数据和初始化随机数据训练生成对抗网络模型,通过生成对抗网络模型得到虚拟...
【专利技术属性】
技术研发人员:黄步添,李琳,张小松,曹晟,刘振广,何钦铭,
申请(专利权)人:杭州云象网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。