本发明专利技术涉及人工智能,揭露一种欺诈行为识别方法,包括:计算多个历史行为数据对应的权重值,根据权重值从多个历史行为数据中筛选出目标行为数据;对经过数据清洗得到的标准行为数据对应的用户进行异常检测,得到异常检测结果,根据异常检测结果将用户划分为用户分类,得到正常用户集和异常用户集并进行线性组合,得到多组用户训练集,基于多组用户训练集进行模型训练,得到欺诈行为识别模型;将待识别用户对应的用户数据输入至欺诈行为识别模型中,得到待识别用户的欺诈判定结果。此外,本发明专利技术还涉及区块链技术,权重值可存储于区块链的节点。本发明专利技术还提出一种欺诈行为识别装置、电子设备以及存储介质。本发明专利技术可以提高欺诈行为识别的准确度。别的准确度。别的准确度。
【技术实现步骤摘要】
欺诈行为识别方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种欺诈行为识别方法、装置、电子设备及存储介质。
技术介绍
[0002]在当前行业欺诈对金融行业造成了巨大的损失,有着业务环节多,手段多样化,隐秘性强的特点,行业欺诈会导致用户的安全受到影响,进而导致行业发展越来越差。
[0003]在过去,很多金融企业通过规则引擎和线下调查来识别诈骗,能拦截到发标后触碰到规则的用户,但是覆盖范围小,准确率不高。因此亟待提出一种准确度更高的欺诈行为识别方法。
技术实现思路
[0004]本专利技术提供一种欺诈行为识别方法、装置、电子设备及存储介质,其主要目的在于提高欺诈行为识别的准确度。
[0005]为实现上述目的,本专利技术提供的一种欺诈行为识别方法,包括:
[0006]获取多个不同维度的历史行为数据,基于预设的权重计算方法计算多个所述历史行为数据对应的权重值,并根据所述权重值从多个所述历史行为数据中筛选出目标行为数据;
[0007]对所述目标行为数据进行数据清洗处理,得到标准行为数据;
[0008]基于预设隔离森林算法对所述标准行为数据对应的用户进行异常检测,得到异常检测结果,并根据所述异常检测结果将用户划分为用户分类,得到正常用户集和异常用户集;
[0009]对所述正常用户集和所述异常用户集进行线性组合,得到多组用户训练集,基于多组所述用户训练集进行模型训练,得到欺诈行为识别模型;
[0010]获取待识别用户及所述待识别用户对应的用户数据,将所述待识别用户对应的用户数据输入至所述欺诈行为识别模型中,得到所述待识别用户的欺诈判定结果。
[0011]可选地,所述基于预设的权重计算方法计算多个所述历史行为数据对应的权重值,包括:
[0012]对所述历史行为数据进行分箱处理,得到分组数据集;
[0013]利用预设的权重值公式分别计算所述分组数据集中多个分组数据对应的权重值。
[0014]可选地,所述预设的权重值公式为:
[0015][0016]其中,WOE
i
为多个权重值,py
i
为历史行为数据取值为“是”的个体数目,pn
i
为历史行为数据取值为“否”的个体数目。
[0017]可选地,所述对所述目标行为数据进行数据清洗处理,包括:
[0018]对所述目标行为数据进行缺失值检测处理,并根据缺失值检测处理得到的检测结果计算缺失比例;
[0019]判断所述缺失比例与预设的缺失阈值之间的大小,当所述缺失比例大于或者等于所述缺失阈值时,将所述缺失比例对应的目标行为数据执行剔除处理,得到标准行为数据;
[0020]当所述缺失比例小于所述缺失阈值时,对所述缺失比例对应的目标行为数据执行均值填充处理,得到标准行为数据。
[0021]可选地,所述根据缺失值检测处理得到的检测结果计算缺失比例,包括:
[0022]统计所述目标行为数据的数据长度,并将所述目标行为数据的数据长度作为第一数据长度;
[0023]识别所述检测结果的数据长度,并将所述检测结果的数据长度作为第二数据长度;
[0024]将所述第二数据长度作为分子,所述第一数据长度作为分母计算得到缺失比例。
[0025]可选地,所述基于多组所述用户训练集进行模型训练,得到欺诈行为识别模型,包括:
[0026]获取标准决策树,将多组所述用户训练集输入至所述标准决策树,得到得分数据集;
[0027]根据所述得分数据集和预设的损失函数计算所述标准决策树的损失值;
[0028]当所述损失值大于或者等于预设的损失阈值时,再次执行所述对所述初始决策树进行决策树添加处理的操作,直至所述损失值小于所述损失阈值时,输出当前的标准决策树为欺诈行为识别模型。
[0029]可选地,所述获取标准决策树,包括:
[0030]获取特征信息集,任意选取所述特征信息集中的一个特征信息作为根节点,在所述根节点上分裂左节点和右节点;
[0031]将所述特征信息集分配至所述左节点和所述右节点,得到基本决策树;
[0032]对所述基本决策树进行决策树增添处理,得到标准决策树。
[0033]为了解决上述问题,本专利技术还提供一种欺诈行为识别装置,所述装置包括:
[0034]数据清洗模块,用于获取多个不同维度的历史行为数据,基于预设的权重计算方法计算多个所述历史行为数据对应的权重值,并根据所述权重值从多个所述历史行为数据中筛选出目标行为数据,对所述目标行为数据进行数据清洗处理,得到标准行为数据;
[0035]异常检测模块,用于基于预设隔离森林算法对所述标准行为数据对应的用户进行异常检测,得到异常检测结果,并根据所述异常检测结果将用户划分为用户分类,得到正常用户集和异常用户集;
[0036]模型训练模块,用于对所述正常用户集和所述异常用户集进行线性组合,得到多组用户训练集,基于多组所述用户训练集进行模型训练,得到欺诈行为识别模型;
[0037]欺诈判定模块,用于获取待识别用户及所述待识别用户对应的用户数据,将所述待识别用户对应的用户数据输入至所述欺诈行为识别模型中,得到所述待识别用户的欺诈判定结果。
[0038]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0039]至少一个处理器;以及,
[0040]与所述至少一个处理器通信连接的存储器;其中,
[0041]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的欺诈行为识别方法。
[0042]为了解决上述问题,本专利技术还提供一种存储介质,所述存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的欺诈行为识别方法。
[0043]本专利技术实施例中,通过权重计算方法计算多个历史行为数据对应的权重值,并根据所述权重值从多个所述历史行为数据中筛选出目标行为数据,可以选择出占比较高的目标行为数据,并对目标行为数据进行数据清洗处理,得到标准行为数据,数据清理可以保证数据的准确性进而避免数据冗余,基于预设隔离森林算法对所述标准行为数据对应的用户进行异常检测,得到异常检测结果,并根据异常检测结果进行训练数据集的构建,再训练得到欺诈行为识别模型,使得通过欺诈行为识别模型得到的待识别用户的欺诈判定结果更加准确。因此本专利技术提出的欺诈行为识别方法、装置、电子设备及存储介质,可以解决欺诈行为识别的准确度较低的问题。
附图说明
[0044]图1为本专利技术一实施例提供的欺诈行为识别方法的流程示意图;
[0045]图2为图1中其中一个步骤的详细实施流程示意图;
[0046]图3为图1中其中一个步骤的详细实施流程示意图;
[0047]图4为图1中其中一个步骤的详细实施流程示意图;
[00本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种欺诈行为识别方法,其特征在于,所述方法包括:获取多个不同维度的历史行为数据,基于预设的权重计算方法计算多个所述历史行为数据对应的权重值,并根据所述权重值从多个所述历史行为数据中筛选出目标行为数据;对所述目标行为数据进行数据清洗处理,得到标准行为数据;基于预设隔离森林算法对所述标准行为数据对应的用户进行异常检测,得到异常检测结果,并根据所述异常检测结果将用户划分为用户分类,得到正常用户集和异常用户集;对所述正常用户集和所述异常用户集进行线性组合,得到多组用户训练集,基于多组所述用户训练集进行模型训练,得到欺诈行为识别模型;获取待识别用户及所述待识别用户对应的用户数据,将所述待识别用户对应的用户数据输入至所述欺诈行为识别模型中,得到所述待识别用户的欺诈判定结果。2.如权利要求1所述的欺诈行为识别方法,其特征在于,所述基于预设的权重计算方法计算多个所述历史行为数据对应的权重值,包括:对所述历史行为数据进行分箱处理,得到分组数据集;利用预设的权重值公式分别计算所述分组数据集中多个分组数据对应的权重值。3.如权利要求2所述的欺诈行为识别方法,其特征在于,所述预设的权重值公式为:其中,WOE
i
为多个权重值,py
i
为历史行为数据取值为“是”的个体数目,pn
i
为历史行为数据取值为“否”的个体数目。4.如权利要求1所述的欺诈行为识别方法,其特征在于,所述对所述目标行为数据进行数据清洗处理,包括:对所述目标行为数据进行缺失值检测处理,并根据缺失值检测处理得到的检测结果计算缺失比例;判断所述缺失比例与预设的缺失阈值之间的大小,当所述缺失比例大于或者等于所述缺失阈值时,将所述缺失比例对应的目标行为数据执行剔除处理,得到标准行为数据;当所述缺失比例小于所述缺失阈值时,对所述缺失比例对应的目标行为数据执行均值填充处理,得到标准行为数据。5.如权利要求4所述的欺诈行为识别方法,其特征在于,所述根据缺失值检测处理得到的检测结果计算缺失比例,包括:统计所述目标行为数据的数据长度,并将所述目标行为数据的数据长度作为第一数据长度;识别所述检测结果的数据长度,并将所述检测结果的数据长度作为第二数据长度;将所述第二数据长度作为分子,所述第一数据长度作为...
【专利技术属性】
技术研发人员:李方园,
申请(专利权)人:未鲲上海科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。