借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置制造方法及图纸

技术编号:20449577 阅读:23 留言:0更新日期:2019-02-27 03:22
本申请提供了一种借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置,其中借贷欺诈检测模型训练方法包括:获取多个样本用户的身份信息、用户银行流水信息,以及与每个样本用户对应的欺诈标注信息;基于身份信息构建身份特征向量;以及根据用户银行流水信息,构建流水特征向量;将身份特征向量以及流水特征向量进行拼接,生成用于表征每个样本用户身份以及支出收入情况的目标特征向量;将目标特征向量输入至目标神经网络,获取目标特征向量的欺诈检测结果;根据欺诈检测结果以及对应的欺诈标注信息,对目标神经网络进行训练,得到借贷欺诈检测模型。本申请能够提高信贷平台对欺诈用户的识别效率和识别准确率,同时大大的节省了人力成本。

【技术实现步骤摘要】
借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
本申请涉及机器学习
,具体而言,涉及一种借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置。
技术介绍
随着互联网金融的快速发展,伴随而来的是互联网欺诈及信贷风险发生率的上升。据统计数据显示,近年来我过消费金融行业资产不良率呈不断上升趋势,中国互联网欺诈风险已在全球排名前三,网络犯罪每年给全球带来高达4450亿美元的经济损失,日益复杂并向不同行业渗透。互联网金融风险包含信用风险和操作风险,信用风险即客户在发起借款请求时即无意还款。其中信用风险中欺诈类居高,消费金融的坏账损失超过50%来源于欺诈。为了规避借贷中的欺诈行为,目前借贷平台处理用户的借贷请求的时候基本上都是采取人工审核的方式,审核用户在进行借贷申请的时候为了证明自己的身份信息往往需要提供一些能够反应个人信息的材料,一般包括:学历证明,收入证明,职业信息,地域信息,历史银行流水信息等。一般来说,借贷平台只会对其认定的具有还款能力并且消费行为正常的借贷者发放贷款,其中银行流水信息是衡量一个用户还款能力的最重要的维度。每个月拥有固定收入以及符合规律的消费行为记录将能够帮助用户高概率的通过借贷平台的审核。基于此类放贷规则,现在很多黑产中介会通过伪造银行流水的方式帮助借贷用户进行隐瞒自身资质以达到贷款目的,此类借款人往往存在逾期甚至失联等高风险。正是由于在信贷平台对借贷用户进行信用审核的时候基本上都是依靠业务人员的专家经验进行判断,由于银行历史流水信息往往比较繁杂,涉及的信息的体量比较大,单纯由人工审核的话不但效率低下,而且很难综合银行流水数据和用户个人信息得出整体的正确结论。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置,能够提高信贷平台对欺诈用户的识别效率和识别准确率,同时大大的节省了人力成本。第一方面,提供一种借贷欺诈检测模型训练方法,包括:获取多个样本用户的身份信息、用户银行流水信息,以及与每个样本用户对应的欺诈标注信息;针对每个样本用户,基于该样本用户的所述身份信息构建身份特征向量;以及根据所述用户银行流水信息,构建流水特征向量;将所述身份特征向量以及该样本用户的所述流水特征向量进行拼接,生成用于表征该样本用户身份以及支出收入情况的目标特征向量;将所述目标特征向量输入至目标神经网络,获取各个所述样本用户的欺诈检测结果;根据所述欺诈检测结果以及对应的欺诈标注信息,对所述目标神经网络进行训练,得到所述借贷欺诈检测模型。在一种可选实施方式中,所述身份信息包括:多个身份特征下的特征值;所述针对每个样本用户,基于该样本用户的所述身份信息构建身份特征向量,包括:根据该样本用户在多个身份特征下的特征值,生成该样本用户的身份特征向量。在一种可选实施方式中,所述根据所述用户银行流水信息,构建流水特征向量,包括:根据至少一个预设时长以及所述用户银行流水信息,生成时长为所述预设时长的多个不同时间段的流水数据向量;将时长为该预设时长的各个时间段的流水数据向量进行加权求和,得到与该预设时长对应的流水特征向量。在一种可选实施方式中,所述根据至少一个预设时长以及所述用户银行流水信息,生成时长为所述预设时长的多个不同时间段的流水数据向量,包括:针对每个预设时长的多个不同时间段中的每个时间段,根据发生时间落入该时间段的用户银行流水信息,生成该时间段的原始流水数据向量;将所述原始流水数据向量进行变换处理,生成该时间段的流水数据向量。在一种可选实施方式中,所述将所述原始流水数据向量进行变换处理,生成该时间段的流水数据向量,包括:对所述原始流水数据向量进行增强鲁棒性变换,和/或对所述原始流水数据向量进行消除差距变换,生成该时间段的流水数据向量。在一种可选实施方式中,针对将所述原始流水数据向量进行变换处理包括:对所述原始流水数据向量进行增强型鲁棒性变换的情况,采用下述方式对所述原始流水数据向量进行增强型鲁棒性变换:基于滑动窗口法对所述原始流水数据向量进行增强鲁棒性变换,生成该时间段的流水数据向量。在一种可选实施方式中,所述基于滑动窗口法对所述原始流水数据向量进行增强鲁棒性变换,生成该时间段的流水数据向量,包括:按照预设大小的窗口,多次从所述原始流水数据向量中选择多个元素,并针对每次选择,根据该次选择的多个元素,生成该次选择对应的变换数据;根据各次选择对应的变换数据,构成所述流水数据向量;其中,首次选择的多个元素包括所述原始流水数据向量中的首位元素;最后一次选择的多个元素包括所述原始流水数据向量中的末位元素;且每相邻的两次选择,前一次选择的第一个元素和后一次选择的第一个元素之间的位置间隔预设步长。在一种可选实施方式中,所述根据该次选择的多个元素,生成该次选择对应的变换数据,包括:将该次选择的多个元素进行加权求和,将加权求和的结果作为该次选择对应的变换数据;或者,将该次选择的多个元素的均值作为该次选择对应的变换数据。在一种可选实施方式中,针对将所述原始流水数据向量进行变换处理包括:对所述原始流水数据向量进行消除差距变换的情况,采用下述方式对所述原始流水数据向量进行消除差距变换:针对所述原始流水数据向量的每个非首元素,计算该非首元素以及与该非首元素相邻的前一个元素的差值的绝对值,并将所述绝对值与该非首元素的比值作为该非首元素的差距消除变换结果;针对所述原始流水数据向量中的首元素,将1作为该首元素的差距消除变换结果;使用所述原始流水数据向量中首元素的差值消除变换结果,以及各个所述非首元素的差距消除变换结果,构成所述流水数据向量。在一种可选实施方式中,针对将所述原始流水数据向量进行变换处理包括:对所述原始流水数据向量进行增强鲁棒性变换以及消除差距变换的情况,采用下述方式对所述原始流水数据向量进行增强鲁棒性变换以及消除差距变换:基于滑动窗口法对所述原始流水数据向量进行增强鲁棒性变换,生成所述变换向量;并针对述变换向量的每个非首元素,计算该非首元素以及与该非首元素相邻的前一个元素的差值的绝对值,并将所述绝对值与该非首元素的比值作为该非首元素的差距消除变换结果;针对所述变换向量中的首元素,将1作为该首元素的差距消除变换结果;使用所述变换向量中的首元素的差距消除变换结果,以及各个所述非首元素的差距消除变换结果,构成所述流水数据向量。在一种可选实施方式中,所述用户银行流水信息包括:收入流水信息以及支出流水信息;所述流水特征向量包括:收入流水特征向量、支出流水特征向量以及流水交互特征向量;所述根据所述用户银行流水信息以及用户银行流水交互信息,构建流水特征向量,包括:根据所述收入流水信息,生成所述收入流水特征向量;根据所述支出流水信息,生成所述支出流水特征向量;以及,根据所述收入流水信息以及所述支出流水信息,生成流水交互信息,并根据所述流水交互信息,生成流水交互特征向量。在一种可选实施方式中,所述根据所述收入流水信息以及所述支出流水信息,生成流水交互信息,包括:根据所述收入流水信息,生成每天的收入总额,并根据支出流水信息,生成每天的支出总额;计算每天收入总额与支出总额的差值;并根据所述差值构成所述流水交互信息。在一种可选实施方式中,所述根据所述欺诈检测结果以及对应的欺诈标注信息,对所述目本文档来自技高网
...

【技术保护点】
1.一种借贷欺诈检测模型训练方法,其特征在于,包括:获取多个样本用户的身份信息、用户银行流水信息,以及与每个样本用户对应的欺诈标注信息;针对每个样本用户,基于该样本用户的所述身份信息构建身份特征向量;以及根据所述用户银行流水信息,构建流水特征向量;将所述身份特征向量以及该样本用户的所述流水特征向量进行拼接,生成用于表征该样本用户身份以及支出收入情况的目标特征向量;将所述目标特征向量输入至目标神经网络,获取各个所述样本用户的欺诈检测结果;根据所述欺诈检测结果以及对应的欺诈标注信息,对所述目标神经网络进行训练,得到所述借贷欺诈检测模型。

【技术特征摘要】
1.一种借贷欺诈检测模型训练方法,其特征在于,包括:获取多个样本用户的身份信息、用户银行流水信息,以及与每个样本用户对应的欺诈标注信息;针对每个样本用户,基于该样本用户的所述身份信息构建身份特征向量;以及根据所述用户银行流水信息,构建流水特征向量;将所述身份特征向量以及该样本用户的所述流水特征向量进行拼接,生成用于表征该样本用户身份以及支出收入情况的目标特征向量;将所述目标特征向量输入至目标神经网络,获取各个所述样本用户的欺诈检测结果;根据所述欺诈检测结果以及对应的欺诈标注信息,对所述目标神经网络进行训练,得到所述借贷欺诈检测模型。2.根据权利要求1所述的方法,其特征在于,所述身份信息包括:多个身份特征下的特征值;所述针对每个样本用户,基于该样本用户的所述身份信息构建身份特征向量,包括:根据该样本用户在多个身份特征下的特征值,生成该样本用户的身份特征向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述用户银行流水信息,构建流水特征向量,包括:根据至少一个预设时长以及所述用户银行流水信息,生成时长为所述预设时长的多个不同时间段的流水数据向量;将时长为该预设时长的各个时间段的流水数据向量进行加权求和,得到与该预设时长对应的流水特征向量。4.根据权利要求3所述的方法,其特征在于,所述根据至少一个预设时长以及所述用户银行流水信息,生成时长为所述预设时长的多个不同时间段的流水数据向量,包括:针对每个预设时长的多个不同时间段中的每个时间段,根据发生时间落入该时间段的用户银行流水信息,生成该时间段的原始流水数据向量;将所述原始流水数据向量进行变换处理,生成该时间段的流水数据向量。5.根据权利要求4所述的方法,其特征在于,所述将所述原始流水数据向量进行变换处理,生成该时间段的流水数据向量,包括:对所述原始流水数据向量进行增强鲁棒性变换,和/或对所述原始流水数据向量进行消除差距变换,生成该时间段的流水数据向量。6.根据权利要求1所述的方法,其特征在于,所述用户银行流水信息包括:收入流水信息以及支出流水信息;所述流水特征向量包括:收入流水特征向量、支出流水特征向量以及流水交互特征向量;所述根据所述用户银行流水信息,构建流水特征向量,包括:根据所述收入流水信息,生成所述收入流水特征向量;根据所述支出流水信息,生成所述支出流水特征向量;以及,根据所述收入流水信息以及所述支出流水信息,生成流水交互信息,并根据所述流水交互信息,生成流水交互特征向量。7.根据权利1所述的方法,其特征在于,所述根据所述欺诈检测结果以及对应的欺诈标注信息,对所述目标神经网络进行训练,包括:将本轮还未完成训练的所述样本用户中的任意一个样本用户作为目标样...

【专利技术属性】
技术研发人员:郭豪孙善萍康晓中蔡准孙悦郭晓鹏
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1