一种基于概念漂移检测的金融交易欺诈识别方法、设备及存储介质技术

技术编号：33811042 阅读：22 留言：0更新日期：2022-06-16 10:20

本发明专利技术公开了一种基于概念漂移检测的金融交易欺诈识别方法、设备及存储介质。本发明专利技术首先将金融交易数据看作流数据，将金融交易流数据划分为等大小的数据块，在每个数据块中继续划分，得到一定量的数据子块。然后基于数据子块训练得到一个流数据快速决策树分类模型。进而，评估该模型在连续数据子块上的分类错误率。同时，数据子块中的样本均值和样本方差的稳定性被用来评估金融交易流数据分布的稳定性。最后，通过统计量在连续数据子块上的置信区间求交集，识别出金融欺诈行为。本发明专利技术通过三个统计量在连续金融交易数据上的置信区间求交集，可以有效地降低概念漂移的检测迟延，从而实时地识别出金融交易数据中的欺诈行为。从而实时地识别出金融交易数据中的欺诈行为。从而实时地识别出金融交易数据中的欺诈行为。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于概念漂移检测的金融交易欺诈识别方法、设备及存储介质

[0001]本专利技术涉及一种基于概念漂移检测的金融交易欺诈识别方法、设备及存储介质。

技术介绍

[0002]近年来，金融欺诈行为越来越多，给人们带来了巨大的经济损失，因此，如何实时有效地识别出金融欺诈行为是普遍关心的问题。金融欺诈即利用金融产品上存在的漏洞来为自身谋取利益的不正当行为。例如，非法入侵银行交易系统，通过违规操作诸如盗取银行卡信息、身份信息等，谋取不正当利益。这种金融欺诈行为往往伴随着异常特征，例如交易对象异常、交易数量巨大、资金走向异常等，金融欺诈行为需要实时地检测并有效地识别，以避免巨大的经济损失。
[0003]由于金融交易数据每天都在不断地产生，并且数据分布随着时间不断地变化。因此，金融交易数据具有流数据的海量、实时、动态等特点，又被称为金融交易流数据。其中，流数据中数据分布的动态性，被称为概念漂移问题。在金融交易欺诈识别的应用背景下，金融交易流数据中概念漂移的产生往往是由于金融交易行为的出现。因此，可利用流数据概念漂移检测技术实现对金融交易流数据中欺诈行为的识别。
[0004]目前已存在的概念漂移检测机制往往通过流数据模型对最新样本的性能的稳定性来识别，例如在流数据挖掘模型对最新数据环境的性能发生暴跌，被视作检测到概念漂移。然而，该概念漂移检测机制会存在很大的检测迟延，无法实时地检测出数据分布的变化。因此，在金融交易欺诈识别领域，无法实时准确地检测欺诈行为，从而会造成经济损失。

技术实现思路

[0005]...

【技术保护点】

【技术特征摘要】
1.一种基于概念漂移检测的金融交易欺诈识别方法，其特征在于：包括以下步骤：步骤1）输入金融交易数据，并基于数据到达的时间戳，划分数据为等大小的数据块，得到候选金融交易数据块D
t
；步骤2）使用步骤1获取的候选金融交易数据块D
t
，进行连续数据子块的划分；步骤3）使用步骤1获取的候选金融交易数据块D
t
，增量式训练得到流数据单分类器，进而得到金融交易流数据集成分类模型M；步骤4）基于监督性信息的概念漂移检测，识别步骤2获取的连续数据子块中的概念漂移，得到概念漂移时刻t1；步骤5）基于非监督性信息的概念漂移检测，识别步骤2）获取的连续数据子块中的概念漂移，得到概念漂移时刻t2；步骤6）基于步骤4与步骤5得到的时刻t1、t2检测出概念漂移发生的时刻t0，从而识别出金融交易欺诈行为。2.根据权利要求1所述的一种基于概念漂移检测的金融交易欺诈识别方法，其特征在于：步骤3）中每个金融交易数据块训练得到一个基于VFDT的单分类器，从而在连续的数据块上得到金融交易流数据集成分类模型M。3.根据权利要求1所述的一种基于概念漂移检测的金融交易欺诈识别方法，其特征在于：步骤4）具体是：首先，评估步骤3）训练得到的流数据集成分类模型M在连续金融交易数据子块中分类错误率；然后，将分类错误率作为基于监督性信息的概念漂移检测机制的...

【专利技术属性】
技术研发人员：谢逸俊，钟蔚蔚，李伟，匡立中，张帅，
申请(专利权)人：杭州趣链科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人