应用于信用卡欺诈检测的Encoder-LSTM深度学习模型及其方法技术

技术编号：24499310 阅读：218 留言：0更新日期：2020-06-13 04:22

应用于信用卡欺诈检测的Encoder‑LSTM深度学习模型及方法，其特征在于，分为两个部分：第一部分是自编码器，该部分主要用于提取中间状态的低维特征。自编码器作为分类器进行训练后，将自编码阶段的中间状态作为LSTM模型的输入，在输入之前需对数据进行重新整理，以适应于LSTM网络的输入；第二部分是LSTM网络，该部分主要用于分析信用卡交易之间的相关性，将经过自编码器提取出低维重构特征向量输入LSTM网络，设置相关超参数，使用自适应矩估计优化器，对信用卡交易内部之间的相关性进行挖掘，进而达到检测出欺诈交易的目的。

Encoder LSTM deep learning model and its method applied to credit card fraud detection

全部详细技术资料下载

【技术实现步骤摘要】
应用于信用卡欺诈检测的Encoder-LSTM深度学习模型及其方法
本专利技术涉及异常检测领域，特别涉及到一种应用于信用卡欺诈检测的Encoder-LSTM深度学习模型。
技术介绍
现如今，无现金的交易方式已经彻底的改变了我们的生活。尤其是近年来，几乎每个人都有一台智能手机，在此基础上微信、支付宝、各类信用卡的推广和发展，使得这种快捷、方便的形式也受到越来越多人的青睐。欺诈也因此变得可以从多种方式进行，比如以盗用的身份信息从发卡行获取信用卡、使用被盗的或者伪造的信用卡，然后绑定这种类型的信用卡进行购物消费，进一步套现等等。如何有效的侦测和防范欺诈的交易不仅成为各个银行机构关注的重点，也成为诸多学者研究的重点。对于欺诈的侦测和预防，传统的方法主要是基于规则的，通常由专家制定。这意味着，必须事先的手动建立规则，然后用于交易的标记。但是这样的系统并不灵活，犯罪份子可能会设法绕过或者避开这些规则。由于欺诈模式在迅速改变，所以系统也要被动跟随发生变化，传统基于规则的欺诈检测模型逐渐暴露出了一些问题。最近几年，深度学习技术呈现爆炸式的发展，其在图像识别、语音识别以及自然语言处理等领域已经获得了很大突破。其中，自编码器(Encoder)是深度学习领域中一类重要的神经网络模型。自编码器包含两个部分，分别为编码器和解码器。输入数据先经过编码器进行编码从而得到一个中间向量，然后解码器借助该中间向量对输入数据进行重建。如果输出结果和输入数据非常接近，那么就表明中间向量和输入数据存在关联或者某种映射关系，中间结果就可...

【技术保护点】
1.一种应用于信用卡欺诈检测的Encoder-LSTM深度学习模型，其特征在于，分为两个部分：/n第一部分是自编码器，该部分主要用于提取中间状态的低维特征。自编码器作为分类器进行训练后，将自编码阶段的中间状态作为LSTM模型的输入，在输入之前需对数据进行重新整理，以适应于LSTM网络的输入；/n第二部分是LSTM网络，该部分主要用于分析信用卡交易之间的相关性，将经过自编码器提取出低维重构特征向量输入LSTM网络，设置相关超参数，使用自适应矩估计优化器，对信用卡交易内部之间的相关性进行挖掘，进而达到检测出欺诈交易的目的。/n

【技术特征摘要】
1.一种应用于信用卡欺诈检测的Encoder-LSTM深度学习模型，其特征在于，分为两个部分：
第一部分是自编码器，该部分主要用于提取中间状态的低维特征。自编码器作为分类器进行训练后，将自编码阶段的中间状态作为LSTM模型的输入，在输入之前需对数据进行重新整理，以适应于LSTM网络的输入；
第二部分是LSTM网络，该部分主要用于分析信用卡交易之间的相关性，将经过自编码器提取出低维重构特征向量输入LSTM网络，设置相关超参数，使用自适应矩估计优化器，对信用卡交易内部之间的相关性进行挖掘，进而达到检测出欺诈交易的目的。

2.一种应用于信用卡欺诈检测的Encoder-LSTM深度学习方法，其特征在于，具体如下实施步骤：
步骤1、设计相结合的Encoder-LSTM模型
所述Encoder-LSTM模型，包括为Encoder模型和LSTM模型，以重构后的低维特征为输入，进而判定交易是否欺诈。所述LSTM模型由输入门、遗忘门、输出门三个门控单元以及一个状态单元，这两个单元组成的类似于“细胞”的单元结构，对输入门输入一个数值，如果sigmoid输入门允许，这个输入的数值可以累加到状态单元，状态单元具有线性自循环，其权重由遗忘门控制，遗忘门还会决定是否遗忘某些信息，输出门控制LSTM单元是否输出前面输入门与遗忘门合并的数值信息，其中，所有的门控单元都具有sigmoid非线性函数，将权重控制在0到1之间。
步骤2、待测数据预处理
原始数据为个人信用卡交易记录，每条交易都包含各个维度的特征，为交易时间、交易额度、交易地点信息；
步骤2中，每条交易数据经过一种常用的降维方法，即主成分分析(PCA)进行转换后，提取数据的主要特征分量，构成交易数据集合X＝{xi}([1,...,n])，其中xi表示一条交易数据，xi是一个N维的向量，向量中的每个分量是一个实数，代表了时间、交易额度、交易地点特征，设定一共有n条交易记录。首先，对数据集中是否存在缺失值进行检查，接下来，由于不同特征的取值范围不同，对数据特征进行标准化处理。
步骤3、训练Encoder模型
在整个Encoder-LSTM模型中，在训练阶段，通过已有的带标签的交易数据训练Encoder用来“学习”和“记忆”大多数交易数据所共有的模式。
步骤3中，利用步骤2中样本集训练Encoder模型，进一步包括下列子步骤：
假设交易数据集合X＝{xi}(xi∈RN,i＝[1,...,n])，其中xi表示一条交易数据，是一个N维的向量，向量中的每个分量是一个实数，一共有n条交易记录。每个xi都将有一个与之对应，是数据xi的标签。
a)每个样本x经过Encoder模型编码部分后被映射为中间状态y，如下为编码器的公式(1)，其中σ是非线性激活函数，θ为编码阶段的网络参数，θ＝{W,b}，其中W是权值，b是偏置值。
y＝gθ(x)＝σ(Wx+b)(1)
b)Encoder模型解码部分用来重构交易向量，重构后的交易向量表示为z，如下为解码器的公式(2)，其中σ是非线性激活函数，θ’为解码阶段的网络参数,θ′＝{W′,b′}，其中W’是权值，b’是偏置值。
z＝fθ′(y)＝...

【专利技术属性】
技术研发人员：王俊丽，韩冲，杨丽，吴雨茜，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人