借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置制造方法及图纸

技术编号：20449577 阅读：23 留言：0更新日期：2019-02-27 03:22

本申请提供了一种借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置，其中借贷欺诈检测模型训练方法包括：获取多个样本用户的身份信息、用户银行流水信息，以及与每个样本用户对应的欺诈标注信息；基于身份信息构建身份特征向量；以及根据用户银行流水信息，构建流水特征向量；将身份特征向量以及流水特征向量进行拼接，生成用于表征每个样本用户身份以及支出收入情况的目标特征向量；将目标特征向量输入至目标神经网络，获取目标特征向量的欺诈检测结果；根据欺诈检测结果以及对应的欺诈标注信息，对目标神经网络进行训练，得到借贷欺诈检测模型。本申请能够提高信贷平台对欺诈用户的识别效率和识别准确率，同时大大的节省了人力成本。

全部详细技术资料下载

【技术实现步骤摘要】
借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
本申请涉及机器学习
，具体而言，涉及一种借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置。
技术介绍
随着互联网金融的快速发展，伴随而来的是互联网欺诈及信贷风险发生率的上升。据统计数据显示，近年来我过消费金融行业资产不良率呈不断上升趋势，中国互联网欺诈风险已在全球排名前三，网络犯罪每年给全球带来高达4450亿美元的经济损失，日益复杂并向不同行业渗透。互联网金融风险包含信用风险和操作风险，信用风险即客户在发起借款请求时即无意还款。其中信用风险中欺诈类居高，消费金融的坏账损失超过50％来源于欺诈。为了规避借贷中的欺诈行为，目前借贷平台处理用户的借贷请求的时候基本上都是采取人工审核的方式，审核用户在进行借贷申请的时候为了证明自己的身份信息往往需要提供一些能够反应个人信息的材料，一般包括：学历证明，收入证明，职业信息，地域信息，历史银行流水信息等。一般来说，借贷平台只会对其认定的具有还款能力并且消费行为正常的借贷者发放贷款，其中银行流水信息是衡量一个用户还款能力的最重要的维度。每个月拥有固定收入以及符合规律的消费行为记录将能够帮助用户高概率的通过借贷平台的审核。基于此类放贷规则，现在很多黑产中介会通过伪造银行流水的方式帮助借贷用户进行隐瞒自身资质以达到贷款目的，此类借款人往往存在逾期甚至失联等高风险。正是由于在信贷平台对借贷用户进行信用审核的时候基本上都是依靠业务人员的专家经验进行判断，由于银行历史流水信息往往比较繁杂，涉及的信息的体量比较大，单纯由人工审核的话不但效率低下，而且很难综合银行流水数据和用户个人...

【技术保护点】
1.一种借贷欺诈检测模型训练方法，其特征在于，包括：获取多个样本用户的身份信息、用户银行流水信息，以及与每个样本用户对应的欺诈标注信息；针对每个样本用户，基于该样本用户的所述身份信息构建身份特征向量；以及根据所述用户银行流水信息，构建流水特征向量；将所述身份特征向量以及该样本用户的所述流水特征向量进行拼接，生成用于表征该样本用户身份以及支出收入情况的目标特征向量；将所述目标特征向量输入至目标神经网络，获取各个所述样本用户的欺诈检测结果；根据所述欺诈检测结果以及对应的欺诈标注信息，对所述目标神经网络进行训练，得到所述借贷欺诈检测模型。

【技术特征摘要】
1.一种借贷欺诈检测模型训练方法，其特征在于，包括：获取多个样本用户的身份信息、用户银行流水信息，以及与每个样本用户对应的欺诈标注信息；针对每个样本用户，基于该样本用户的所述身份信息构建身份特征向量；以及根据所述用户银行流水信息，构建流水特征向量；将所述身份特征向量以及该样本用户的所述流水特征向量进行拼接，生成用于表征该样本用户身份以及支出收入情况的目标特征向量；将所述目标特征向量输入至目标神经网络，获取各个所述样本用户的欺诈检测结果；根据所述欺诈检测结果以及对应的欺诈标注信息，对所述目标神经网络进行训练，得到所述借贷欺诈检测模型。2.根据权利要求1所述的方法，其特征在于，所述身份信息包括：多个身份特征下的特征值；所述针对每个样本用户，基于该样本用户的所述身份信息构建身份特征向量，包括：根据该样本用户在多个身份特征下的特征值，生成该样本用户的身份特征向量。3.根据权利要求1所述的方法，其特征在于，所述根据所述用户银行流水信息，构建流水特征向量，包括：根据至少一个预设时长以及所述用户银行流水信息，生成时长为所述预设时长的多个不同时间段的流水数据向量；将时长为该预设时长的各个时间段的流水数据向量进行加权求和，得到与该预设时长对应的流水特征向量。4.根据权利要求3所述的方法，其特征在于，所述根据至少一个预设时长以及所述用户银行流水信息，生成时长为所述预设时长的多个不同时间段的流水数据向量，包括：针对每个预设时长的多个不同时间段中的每个时间段，根据发生时间落入该时间段的用户银行流水信息，生成该时间段的原始流水数据向量；将所述原始流水数据向量进行变换处理，生成该时间段的流水数据向量。5.根据权利要求4所述的方法，其特征在于，所述将所述原始流水数据向量进行变换处理，生成该时间段的流水数据向量，包括：对所述原始流水数据向量进行增强鲁棒性变换，和/或对所述原始流水数据向量进行消除差距变换，生成该时间段的流水数据向量。6.根据权利要求1所述的方法，其特征在于，所述用户银行流水信息包括：收入流水信息以及支出流水信息；所述流水特征向量包括：收入流水特征向量、支出流水特征向量以及流水交互特征向量；所述根据所述用户银行流水信息，构建流水特征向量，包括：根据所述收入流水信息，生成所述收入流水特征向量；根据所述支出流水信息，生成所述支出流水特征向量；以及，根据所述收入流水信息以及所述支出流水信息，生成流水交互信息，并根据所述流水交互信息，生成流水交互特征向量。7.根据权利1所述的方法，其特征在于，所述根据所述欺诈检测结果以及对应的欺诈标注信息，对所述目标神经网络进行训练，包括：将本轮还未完成训练的所述样本用户中的任意一个样本用户作为目标样...

【专利技术属性】
技术研发人员：郭豪，孙善萍，康晓中，蔡准，孙悦，郭晓鹏，
申请(专利权)人：北京芯盾时代科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人