一种异常交易识别方法及装置制造方法及图纸

技术编号:37807295 阅读:10 留言:0更新日期:2023-06-09 09:37
本发明专利技术可用于人工智能技术在金融方面应用的技术领域,本发明专利技术提供了一种异常交易识别方法及装置,异常交易识别方法包括:接收待识别交易的交易数据;根据所述交易数据以及预先生成的异常交易识别模型判断所述待识别交易是否为异常交易,所述异常交易识别模式是基于对抗学习方法以及全连接神经网络算法所生成的。本发明专利技术可以有效解决金融领域机器学习过程中受噪声标签、样本不平衡影响较大的问题。样本不平衡影响较大的问题。样本不平衡影响较大的问题。

【技术实现步骤摘要】
一种异常交易识别方法及装置


[0001]本申请属于人工智能
,具体涉及一种异常交易识别方法及装置。

技术介绍

[0002]在金融机器学习实际应用场景中,标注数据往往需要大量的人力、物力与财力,标注的数据质量某种程度上还受到人为主观因素的影响,导致实际获取的标注样本往往含有不定比例的标签被错误标记,业界技术人员将这部分被错误标记的标签称为噪声标签。
[0003]现有的人工智能(AI,Artificial Intelligence)技术极度依赖标注数据的数量和质量。标注数据的数量、标注的准确性、不同类别训练样本的均衡性,在训练过程中对模型有重大影响,可能会导致模型向完全错误的方向拟合,极大地影响AI技术的准确度和落地应用的可靠性。
[0004]在实际应用场景中,标注数据往往需要大量的人力成本,对标注数量产生制约。另一方面,标注的数据质量不易把控,实际获取的标注样本往往含有一定比例的标签被错误标记(噪声标签)。再者存在很多应用问题,特别是异常检测问题,样本分布极度不均衡,真正的异常样本只占总样本非常小的比例。这些问题的存在,导致许多理论上优秀的监督学习模型在实际应用时无法达到理想的效果。

技术实现思路

[0005]本专利技术可用于人工智能技术在金融方面应用的
,也可用于除金融领域之外的任意领域,本专利技术基于金融领域真实场景数据集,有效解决金融领域机器学习过程中受噪声标签、样本不平衡影响较大的问题。
[0006]为解决本申请
技术介绍
中的技术问题,本专利技术提供以下技术方案
[0007]第一方面,本专利技术提供一种异常交易识别方法包括:
[0008]接收待识别交易的交易数据;
[0009]根据所述交易数据以及预先生成的异常交易识别模型判断所述待识别交易是否为异常交易,所述异常交易识别模式是基于对抗学习方法以及全连接神经网络算法所生成的。
[0010]一实施例中,生成异常交易识别模型的方法包括以下步骤:
[0011]利用全连接神经网络算法生成模拟样本生成模型以及辨别模型,所述模拟样本生成模型用于生成模拟样本,所述辨别模型包括多个子辨别模型,所述多个子辨别模型的全连接神经网络的参数不同;所述子辨别模型用于辨别输入样本是否为所述模拟样本,以及辨别所述输入样本是否为异常交易;
[0012]根据多个子辨别模型、历史交易数据以及所述模拟样本生成模型对所述辨别模型进行训练,直至预设的损失函数收敛,以生成所述异常交易识别模型。
[0013]一实施例中,所述根据多个子辨别模型、历史交易数据以及所述模拟样本生成模型对所述辨别模型进行训练,包括:
[0014]将模拟样本以及所述历史交易数据中的真实样本输入至多个子辨别模型,以生成每个子辨别模型对应的预测标签;
[0015]根据所有子辨别模型的预测标签的平均值与每个子辨别模型的预测标签之间的差值确定所述辨别模型的置信度;
[0016]根据所述预测标签以及所述置信度对所述辨别模型进行反向传播,直至所述损失函数收敛。
[0017]一实施例中,所述根据所述预测标签以及所述置信度对所述辨别模型进行反向传播,包括:
[0018]将历史交易数据中的真实标签与所述预测标签进行凸组合操作,以生成翻新标签;
[0019]根据所述置信度以及所述翻新标签对所述辨别模型进行反向传播,以训练所述辨别模型。
[0020]一实施例中,异常交易识别方法还包括:
[0021]当计算损失函数时,对于生成错误预测标签的子辨别模型进行加权惩罚操作。
[0022]一实施例中,异常交易识别方法还包括:
[0023]根据所述历史交易数据确定随机噪音以及随机标签;
[0024]将所述随机噪音以及随机标签输入至所述模拟样本生成模型,以生成所述模拟样本。
[0025]一实施例中,所述将所述随机噪音以及随机标签输入至所述模拟样本生成模型,以生成所述模拟样本,包括:
[0026]根据所述随机噪音生成随机输入向量;
[0027]根据所述随机标签生成表征类别标签的嵌入向量;
[0028]将所述随机输入向量以及所述嵌入向量输入至所述模拟样本生成模型,以生成模拟样本。
[0029]第二方面,本专利技术提供一种异常交易识别装置,该装置包括:
[0030]交易数据接收模块,用于接收待识别交易的交易数据;
[0031]交易判断模块,用于根据所述交易数据以及预先生成的异常交易识别模型判断所述待识别交易是否为异常交易,所述异常交易识别模式是基于对抗学习方法以及全连接神经网络算法所生成的。
[0032]一实施例中,异常交易识别装置还包括:识别模型生成模块,用于生成异常交易识别模型,所述识别模型模块包括:
[0033]辨别模型生成单元,用于利用全连接神经网络算法生成模拟样本生成模型以及辨别模型,所述模拟样本生成模型用于生成模拟样本,所述辨别模型包括多个子辨别模型,所述多个子辨别模型的全连接神经网络的参数不同;所述子辨别模型用于辨别输入样本是否为所述模拟样本,以及辨别所述输入样本是否为异常交易;
[0034]模型训练单元,用于根据多个子辨别模型、历史交易数据以及所述模拟样本生成模型对所述辨别模型进行训练,直至预设的损失函数收敛,以生成所述异常交易识别模型。
[0035]一实施例中,所述模型训练单元包括:
[0036]预测标签生成单元,用于预测标签将模拟样本以及所述历史交易数据中的真实样
本输入至多个子辨别模型,以生成每个子辨别模型对应的预测标签;
[0037]置信度确定单元,用于根据所有子辨别模型的预测标签的平均值与每个子辨别模型的预测标签之间的差值确定所述辨别模型的置信度;
[0038]模型反向传播单元,用于根据所述预测标签以及所述置信度对所述辨别模型进行反向传播,直至所述损失函数收敛。
[0039]一实施例中,所述模型反向传播单元包括:
[0040]翻新标签生成单元,用于将历史交易数据中的真实标签与所述预测标签进行凸组合操作,以生成翻新标签;
[0041]模型反向传播子单元,用于根据所述置信度以及所述翻新标签对所述辨别模型进行反向传播,以训练所述辨别模型。
[0042]一实施例中,异常交易识别装置还包括:
[0043]模型加权单元,用于当计算损失函数时,对于生成错误预测标签的子辨别模型进行加权惩罚操作。
[0044]一实施例中,异常交易识别装置还包括:
[0045]噪音确定模块,用于根据所述历史交易数据确定随机噪音以及随机标签;
[0046]模拟样本生成模块,用于将所述随机噪音以及随机标签输入至所述模拟样本生成模型,以生成所述模拟样本。
[0047]一实施例中,所述模拟样本生成模块包括:
[0048]输入向量生成单元,用于根据所述随机噪音生成随机输入向量;
[0049]嵌入向量生成单元,用于根据所述随机标签生成表征类别标签的嵌本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常交易识别方法,其特征在于,包括:接收待识别交易的交易数据;根据所述交易数据以及预先生成的异常交易识别模型判断所述待识别交易是否为异常交易,所述异常交易识别模式是基于对抗学习方法以及全连接神经网络算法所生成的。2.根据权利要求1所述的异常交易识别方法,其特征在于,生成异常交易识别模型的方法包括以下步骤:利用全连接神经网络算法生成模拟样本生成模型以及辨别模型,所述模拟样本生成模型用于生成模拟样本,所述辨别模型包括多个子辨别模型,所述多个子辨别模型的全连接神经网络的参数不同;所述子辨别模型用于辨别输入样本是否为所述模拟样本,以及辨别所述输入样本是否为异常交易;根据多个子辨别模型、历史交易数据以及所述模拟样本生成模型对所述辨别模型进行训练,直至预设的损失函数收敛,以生成所述异常交易识别模型。3.根据权利要求2所述的异常交易识别方法,其特征在于,所述根据多个子辨别模型、历史交易数据以及所述模拟样本生成模型对所述辨别模型进行训练,包括:将模拟样本以及所述历史交易数据中的真实样本输入至多个子辨别模型,以生成每个子辨别模型对应的预测标签;根据所有子辨别模型的预测标签的平均值与每个子辨别模型的预测标签之间的差值确定所述辨别模型的置信度;根据所述预测标签以及所述置信度对所述辨别模型进行反向传播,直至所述损失函数收敛。4.根据权利要求3所述的异常交易识别方法,其特征在于,所述根据所述预测标签以及所述置信度对所述辨别模型进行反向传播,包括:将历史交易数据中的真实标签与所述预测标签进行凸组合操作...

【专利技术属性】
技术研发人员:张宝华
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1