一种基于联邦学习的信用卡交易风险预测方法技术

技术编号：27513629 阅读：22 留言：0更新日期：2021-03-02 18:45

本发明专利技术涉及一种基于联邦学习的信用卡交易风险预测方法，包括以下步骤：1)获取作为不同本地客户端的各个银行中，关于客户信用卡交易特征数据的数据集；2)采用局部敏感哈希算法搜索各银行数据集中的相似实例；3)采用串行联邦学习环境中GBDT算法构建组合特征；4)根据组合特征和原始特征构建新的训练特征，各本地客户端以此扩展并构建新的数据集；5)各本地客户端分别采用相同的神经网络模型进行训练，并将训练好的模型参数上传到云端，云端将模型参数聚合更新后返回各本地客户端后开始下一次的训练，直至训练过程收敛，得到最终的神经网络模型完成信用卡交易风险预测结果。与现有技术相比，本发明专利技术具有隐私保护、结果准确、适用范围广等优点。广等优点。广等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦学习的信用卡交易风险预测方法

[0001]本专利技术涉及金融数据安全领域，尤其是涉及一种基于联邦学习的信用卡交易风险预测方法。

技术介绍

[0002]近年来，联邦学习作为一种新兴的人工智能基础技术正蓬勃发展。“联邦学习”的概念最早于2016年由谷歌研究科学家H.Brendan McMahan等提出。它是指多个客户(如移动设备、机构、组织等)在一个或多个中央服务器协作下协同进行去中心化机器学习的设置。在去中心化机器学习的过程中，联邦学习能够保证每个客户的隐私数据不出本地，从而降低了传统中心化机器学习带来的隐私泄露风险和因数据泄露带来的相应成本。另外，根据近年来的银行年报来看，信用卡的不良率及贷款坏账率都有提升，并且受疫情影响，生产工作都放缓了脚步，伴随着收入的暂停，但是仍然需要生活必须消费。而信用社会的信用卡制度，超前消费，提前预支未来收入越来越被大家所接受，疫情期间，不良贷款率以及坏账率都在增加，银行体系由于贷款增加了不少风险杠杆，一旦杠杆继续加大，将造成很严重的后果，因此，发展及时检测信用卡交易潜在风险的技术迫在眉睫。
[0003]在过去，数据动模型不动，也就是说可以从各地来购买数据，或移动数据到一个中心点，在中心点建立模型。而碍于法律法规的影响，各银行间难以跨越法律壁垒来进行联合建模，并且由于信用卡不良率与合法交易数据的比例严重失衡导致单一银行的数据库缺乏不良样本，因此希望通过联邦学习进行银行间的联合建模来改善现有的预测模型。
[0004]本专利技术主要应用于缺乏有效不良交易的标签的信...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的信用卡交易风险预测方法，其特征在于，包括以下步骤：1)获取作为不同本地客户端的各个银行中，关于客户信用卡交易特征数据的数据集，每个银行数据集中每条实例对应的原始特征的维度相同；2)采用局部敏感哈希算法搜索各银行数据集中的相似实例；3)采用串行联邦学习环境中GBDT算法构建组合特征；4)根据组合特征和原始特征构建新的训练特征，各本地客户端以此扩展并构建新的数据集；5)各本地客户端分别采用相同的神经网络模型进行训练，并将训练好的模型参数上传到第三方云端，云端将模型参数聚合更新后返回各本地客户端后开始下一次的训练，直至训练过程收敛，得到最终的神经网络模型完成信用卡交易风险预测结果。2.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法，其特征在于，所述的步骤1)中，每条实例的特征包括基础字段、信用字段和交易字段，所述的基础字段包括性别、年龄、婚姻状况和地区以及学历数据，所述的信用字段包括账户信用等级评定、是否通过交易密码验证、是否通过短信身份验证以及是否通过人脸识别验证数据，所述的交易字段包括交易金额、是否分期、交易手续费、交易时间和交易笔数数据。3.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法，其特征在于，所述的步骤2)具体包括以下步骤：21)给定L个随机生成的p稳定哈希函数，每个本地客户端，即数据拥有方，根据生成的p稳定哈希函数获取其所有实例对应的哈希值；22)以每个实例的ID及其哈希值作为输入，采用AllReduce运算构建L个全局哈希表并广播；23)各数据拥有方根据广播的全局哈希表获得数据集中的相似实例。4.根据权利要求3所述的一种基于联邦学习的信用卡交易风险预测方法，其特征在于，所述的步骤23)中，通过Reduce操作将拥有相同的哈希值实例的ID进行合并，对于数据拥有方P
m
的给定实例另一数据拥有方P
j
中的相似实例为具有相同哈希值最高计数的实例。5.根据权利要求1所述的一种基于联邦学习的信用卡交易风险预测方法，其特征在于，所述的步骤3)中，当一个实例与多个其他实例相似时，该实例重要性较高，则采用梯度表示该实例的重要性。6.根据权利要求5所述的一种基于联邦学习的信用卡交易风险预测方法，其特征在于，所述的步骤3)中，在每个本地客户端进行GBDT模型训练时，采用加权梯度进行训练，具体包括以下步骤：31)每个数据拥有方更新本地实例的梯度，当数据拥有方P
m
在第t...

【专利技术属性】
技术研发人员：李莉，樊宇曦，林国义，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人