当前位置: 首页 > 专利查询>同济大学专利>正文

基于全中心损失函数的欺诈交易识别方法、系统、装置制造方法及图纸

技术编号:25272661 阅读:66 留言:0更新日期:2020-08-14 23:05
本发明专利技术提供一种基于全中心损失函数的欺诈交易识别方法、系统、装置,所述方法包括以下步骤:构建基于全中心损失函数的深度学习模型;使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;将所述参数带入所述深度学习模型生成欺诈交易识别模型。本发明专利技术的一种基于全中心损失函数的欺诈交易识别方法、系统、装置,用于构建基于全中心损失函数的深度学习模型,从而生成欺诈交易识别模型,用于进行电子交易的欺诈交易识别,提升欺诈交易识别的效果。

【技术实现步骤摘要】
基于全中心损失函数的欺诈交易识别方法、系统、装置
本专利技术涉及互联网金融风控
,特别是涉及一种基于全中心损失函数的欺诈交易识别方法、系统、装置。
技术介绍
长久以来,欺诈和反欺诈一直在动态博弈。当今互联网时代,电子交易成为最便捷的交易方式之一,然而这也为不法分子利用新技术实施欺诈提供了条件,每年都会造成巨额的经济损失,影响金融秩序。因此,有效的欺诈检测系统对于银行和金融机构在线检测或监视交易至关重要。不同的欺诈检测系统具有相同的目标,即从海量的交易日志中挖掘可疑的交易模式,以便将这些可疑交易模式用于检测或监视输入的交易。机器学习模型对于挖掘这些模式非常有效,机器学习将欺诈交易识别看作是有监督学习的二分类任务。机器学习模型使用大量的已经标注好的交易记录能够进行充分地学习,并得到性能良好的分类器来准确识别欺诈交易。机器学习在检测欺诈交易方面已经取得了巨大的成功,但是欺诈检测系统的改进将永无止境,即使一点进步也能够挽回巨大的经济损失。基于机器学习模型的欺诈交易检测比传统二分类任务(如图像分类等)更具挑战性。主要有两个原因:数据集中的类别不平衡,以及用户和欺诈者行为的动态多变。一方面,通常在所有交易记录中仅包含极少数的欺诈交易记录,因此这严重影响了监督分类方法的性能。不过幸运的是,针对类别不均衡问题已经有很多方法来处理,比如基于数据采样的方法和基于代价敏感的方法。另一方面,欺诈分子会绞尽脑汁探索新的欺诈策略,使得欺诈交易与真实的正常交易尽可能的相似,以避免被欺诈检测系统发现。尽管欺诈分子试图像真实的持卡人那样进行交易,但是他们无法知道持卡人的实际交易习惯,他们渴望将卡内的所有资金尽快转移到其他帐户。因此,这些不同的交易行为和心理导致欺诈和真实交易数据之间会有不同特征。欺诈策略可能会更改,但是欺诈分子的目的永远不会改变。因此,提取即使在欺诈策略发生变化的情况下,也能够稳定地将欺诈交易与真实交易区分开的有效特征非常重要。因此,本专利技术提出基于全中心损失函数的欺诈交易识别方法,提出全中心损失函数来监督深度学习模型的训练,希望使得此深度学习模型能够学习到区分欺诈和正常交易行为的有效特征表示,希望在保证准确识别欺诈交易的同时让模型的性能尽可能稳定而不受欺诈策略变化的影响。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于全中心损失函数的欺诈交易识别方法、系统、装置,用于解决现有技术中如何使得此深度学习模型能够学习到区分欺诈和正常交易行为的有效特征表示,如何在保证准确识别欺诈交易的同时让模型的性能尽可能稳定而不受欺诈策略变化的影响的问题。为实现上述目的及其他相关目的,本专利技术提供一种基于全中心损失函数的欺诈交易识别方法,包括以下步骤:构建基于全中心损失函数的深度学习模型;使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;将所述参数带入所述深度学习模型生成欺诈交易识别模型。于本专利技术的一实施例中,所述深度学习模型由特征学习层和输出层构成;其中,所述深度学习模型表示为:DL(xi)=FΘ(xi)=ypred_i其中,Θ表示深度学习模型的参数,xi表示输入深度学习模型的第i个样本,ypred_i表示深度学习模型输出的结果;其中,深度学习模型由特征学习层和输出层两部分构成;特征学习层表示为:其中Θfl表示特征学习层的全部参数;fi表示特征学习层输出的特征;基于全中心损失函数构造的神经网络作为输出层,输出层表示为:其中Θop表示输出层的参数,W表示全中心损失函数的权重;fi表示特征学习层的输出,ypred_i表示深度学习模型的输出;T表示为W矩阵的转置;则基于全中心损函数的深度学习模型表示为:于本专利技术的一实施例中,所述全中心损失函数为:其中,cyi表示xi对应的类别yi的中心点,cyi由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);α表示用来平衡两部分损失的超参数。于本专利技术的一实施例中,所述参数为:Θfl,W,{ck};其中,Θfl表示特征学习层的全部参数;W表示全中心损失函数的权重,{ck},其中,表示xi对应的类别yi的中心点,cyi由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);采用梯度下降的方法计算所述参数Θfl,W,{ck};其中,Θ′fl是Θfl更新后的特征学习层的全部参数;其中,W′为W更新后的全中心损失函数的参数c′k=ck-Δck其中,c′k为ck更新后的所有的类别中心。为实现上述目的,本专利技术还提供一种基于全中心损失函数的欺诈交易识别系统,包括:构建模块、训练模块和生成模块;所述构建模块用于构建基于全中心损失函数的深度学习模型;所述训练模块用于使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;所述生成模块用于将所述参数带入所述深度学习模型生成欺诈交易识别模型。于本专利技术的一实施例中,所述深度学习模型由特征学习层和输出层构成;其中,所述深度学习模型表示为:DL(xi)=FΘ(xi)=ypred_i其中,Θ表示深度学习模型的参数,xi表示输入深度学习模型的第i个样本,ypred_i表示深度学习模型输出的结果;其中,深度学习模型由特征学习层和输出层两部分构成;特征学习层表示为:其中Θfl表示特征学习层的全部参数;fi表示特征学习层输出的特征;基于全中心损失函数构造的神经网络作为输出层,输出层表示为:其中Θop表示输出层的参数,W表示全中心损失函数的权重;fi表示特征学习层的输出,ypred_i表示深度学习模型的输出;T表示为W矩阵的转置;则基于全中心损函数的深度学习模型表示为:于本专利技术的一实施例中,所述全中心损失函数为:其中,表示xi对应的类别yi的中心点,由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);α表示用来平衡两部分损失的超参数。于本专利技术的一实施例中,所述参数为:Θfl,W,{ck};其中,Θfl表示特征学习层的全部参数;W表示全中心损失函数的权重,{ck},其中,表示xi对应的类别yi的中心点,由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);采用梯度下降的方法计算所述参数Θfl,W,{ck};其中,Θ′fl是Θfl更新后的特征学习层的全部参数;其中,W′为W更新后的全中心损失函数的参数c′k=ck-Δck其中,c′k为ck更新后的所有的类别中心。为实现上述目的,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一上述基于全中心损失函数的欺诈交易识别方法。为实现上述目的,本专利技术还提供一种基于本文档来自技高网
...

【技术保护点】
1.一种基于全中心损失函数的欺诈交易识别方法,其特征在于,包括以下步骤:/n构建基于全中心损失函数的深度学习模型;/n使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;/n将所述参数带入所述深度学习模型生成欺诈交易识别模型。/n

【技术特征摘要】
1.一种基于全中心损失函数的欺诈交易识别方法,其特征在于,包括以下步骤:
构建基于全中心损失函数的深度学习模型;
使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;
将所述参数带入所述深度学习模型生成欺诈交易识别模型。


2.根据权利要求1所述的基于全中心损失函数的欺诈交易识别方法,其特征在于,所述深度学习模型由特征学习层和输出层构成;
其中,所述深度学习模型表示为:
DL(xi)=FΘ(xi)=ypred_i
其中,Θ表示深度学习模型的参数,xi表示输入深度学习模型的第i个样本,ypred_i表示深度学习模型输出的结果;
其中,深度学习模型由特征学习层和输出层两部分构成;
特征学习层表示为:



其中Θfl表示特征学习层的全部参数;fi表示特征学习层输出的特征;
基于全中心损失函数构造的神经网络作为输出层,输出层表示为:



其中Θop表示输出层的参数,W表示全中心损失函数的权重;fi表示特征学习层的输出,ypred_i表示深度学习模型的输出;T表示为W矩阵的转置;
则基于全中心损函数的深度学习模型表示为:





3.根据权利要求2所述的基于全中心损失函数的欺诈交易识别方法,其特征在于,所述全中心损失函数为:



其中,表示xi对应的类别yi的中心点,由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);α表示用来平衡两部分损失的超参数。


4.根据权利要求1所述的基于全中心损失函数的欺诈交易识别方法,其特征在于,所述参数为:Θfl,W,{ck};
其中,Θfl表示特征学习层的全部参数;W表示全中心损失函数的权重,{ck},其中,表示xi对应的类别yi的中心点,由类别yi的所有样本的均值计算得到,yi∈{0,1},所有的类别中心表示为{ck}(k=0,1);
采用梯度下降的方法计算所述参数Θfl,W,{ck};



其中,Θ′fl是Θfl更新后的特征学习层的全部参数;



其中,W′为W更新后的全中心损失函数的参数
c′k=ck-Δck
其中,c′k为ck更新后的所有的类别中心。


5.一种基于全中心损失函数的欺诈交易识别系统,其特征在于,包括:构建模块、训练模块和生成模块;
所述构建模块用于构建基于全中心损失函数的深度学习模型;
所述训练模块用于使用标注好的电子交易数据训练所述深度学习模型直到模型收敛,获得深度学习模型的参数;
所述生成模...

【专利技术属性】
技术研发人员:蒋昌俊闫春钢丁志军刘关俊张亚英李震川
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1