VAE-SAGAN模型、欺诈检测模型训练方法及系统技术方案

技术编号：44157837 阅读：20 留言：0更新日期：2025-01-29 10:28

本发明专利技术涉及一种VAE‑SAGAN模型、欺诈检测模型训练方法及系统。VAE‑SAGAN模型训练方法包括：获取多个第一欺诈样本作为第一训练集；将所述第一训练集输入预训VAE‑SAGAN模型进行训练，训练过程如下：将各个第一欺诈样本输入到所述预训VAE‑SAGAN模型，获得各个第一重构欺诈样本；获取每个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值和对抗损失值；将每个第一欺诈样本对应的重构损失值与对抗损失值之和作为总损失值；基于各个总损失值调整所述预训VAE‑SAGAN模型的参数，并重复执行训练直至各个所述总损失值均收敛，和/或，直至迭代预设次数，则将当前的预训VAE‑SAGAN模型作为目标VAE‑SAGAN模型。能够通过过采样方法来保证欺诈样本和正常交易样本之间数据平衡化的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据平衡化处理，具体涉及一种vae-sagan模型、欺诈检测模型训练方法及系统。

技术介绍

1、在金融科技领域，欺诈检测通常面临数据不平衡的挑战。由于欺诈行为在实际交易中占比极小，欺诈检测数据集通常包含大量的正常交易样本和极少数的欺诈样本。这种不平衡导致传统的机器学习模型在训练过程中更倾向于预测多数类样本，从而忽略少数类欺诈样本，导致模型精度下降。这种误判不仅影响欺诈检测模型的分类能力，还可能导致严重的经济损失。因此，如何有效处理欺诈样本和正常交易样本之间数据不平衡的问题，确保欺诈检测模型对少数类欺诈样本的敏感性和准确性，是当前欺诈检测研究中的一个重要课题。

2、对于欺诈样本和正常交易样本之间数据不平衡的问题，通常采用的方法是重采样。重采样方法包括欠采样方法和过采样方法。由于，欠采样方法可能会删除关键的多数类正常交易样本，导致重要信息丢失，从而影响欺诈样本和正常交易样本之间数据平衡化的效果。因此，如何通过过采样方法来保证欺诈样本和正常交易样本之间数据平衡化的效果，是一项亟须解决的问题。

3、需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本专利技术提供了一种vae-sagan模型、欺诈检测模型训练方法及系统，能够通过过采样方法来保证欺诈样本和正常交易样本之间数据平衡化的效果。

2、第一方面，为了解决上述技术问题，本专利技术提供了

3、获取多个第一欺诈样本作为第一训练集；其中，所述第一欺诈样本为交易时发生的欺诈行为所对应的数据；

4、将所述第一训练集输入预训vae-sagan模型进行训练，训练过程如下：

5、步骤s121，将各个第一欺诈样本输入到所述预训vae-sagan模型，触发所述预训vae-sagan模型的变分自编码器基于自注意力机制分别将接收到的各个第一欺诈样本映射到低维潜在空间以获得对应的潜在变量并分别对各个潜在变量进行重构，获得每个所述第一欺诈样本对应的第一重构欺诈样本；

6、步骤s122，获取每个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值，以及获取所述预训vae-sagan模型的判别器判别每个第一欺诈样本与对应的第一重构欺诈样本之间的对抗损失值；

7、步骤s123，将每个第一欺诈样本对应的重构损失值与对抗损失值之和作为总损失值；

8、步骤s124，基于各个总损失值调整所述预训vae-sagan模型的参数，并重复执行步骤s121至步骤s124，直至各个所述总损失值均收敛，和/或，直至迭代预设次数，则将当前的预训vae-sagan模型作为目标vae-sagan模型。

9、第二方面，为了解决上述技术问题，本专利技术提供了一种欺诈检测模型的训练方法，包括：

10、获取多个第二欺诈样本和获取多个正常交易样本作为第二训练集；其中，所述第二欺诈样本和所述正常交易样本的数量在第二训练集中占比平衡；所述第二欺诈样本为交易时发生的欺诈行为所对应的数据，正常交易样本为正常交易时的行为所对应的数据；

11、将所述第二训练集输入到预训欺诈检测模型中进行训练，获得训练完成的目标欺诈检测模型。

12、第三方面，为了解决上述技术问题，本专利技术提供了一种vae-sagan模型训练系统，包括：

13、第一获取模块，用于获取多个第一欺诈样本作为第一训练集；其中，所述第一欺诈样本为交易时发生的欺诈行为所对应的数据；

14、第一训练模块，用于将所述第一训练集输入预训vae-sagan模型进行训练；所述第一训练模块包括重构单元、第一损失值单元、第二损失值单元和结束单元；

15、所述重构单元，用于将各个第一欺诈样本输入到所述预训vae-sagan模型，触发所述预训vae-sagan模型的变分自编码器基于自注意力机制分别将接收到的各个第一欺诈样本映射到低维潜在空间以获得对应的潜在变量并分别对各个潜在变量进行重构，获得每个所述第一欺诈样本对应的第一重构欺诈样本；

16、所述第一损失值单元，用于获取每个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值，以及获取所述预训vae-sagan模型的判别器判别每个第一欺诈样本与对应的第一重构欺诈样本之间的对抗损失值；

17、第二损失值单元，用于将每个第一欺诈样本对应的重构损失值与对抗损失值之和作为总损失值；

18、所述结束单元，用于基于各个总损失值调整所述预训vae-sagan模型的参数，并重复执行重构单元、第一损失值单元、第二损失值单元和结束单元对应的步骤，直至各个所述总损失值均收敛，和/或，直至迭代预设次数，则将当前的预训vae-sagan模型作为目标vae-sagan模型。

19、第四方面，为了解决上述技术问题，本专利技术提供了一种欺诈检测模型的训练系统，包括：

20、第二获取模块，用于获取多个第二欺诈样本和获取多个正常交易样本作为第二训练集；其中，所述第二欺诈样本和所述正常交易样本的数量在第二训练集中占比平衡；所述第二欺诈样本为交易时发生的欺诈行为所对应的数据，正常交易样本为正常交易时的行为所对应的数据；

21、第二训练模块，用于将所述第二训练集输入到预训欺诈检测模型中进行训练，获得训练完成的目标欺诈检测模型。

22、本专利技术的有益效果是：通过获取交易时发生的欺诈行为所对应的数据作为第一欺诈样本，利用多个第一欺诈样本对预训vae-sagan模型进行训练。预训vae-sagan模型中的变分自编码器能够基于自注意力机制将接收到的各个第一欺诈样本映射到低维潜在空间以获得对应的潜在变量，该潜在变量表征了第一欺诈样本的特征分布情况。因此，预训vae-sagan模型中的变分自编码器在基于自注意力机制分别对各个潜在变量进行重构时，能够基于第一欺诈样本的特征分布情况来生成与第一欺诈样本相似的第一重构欺诈样本。再获取各个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值和判别器进行判别的对抗损失值，并根据重构损失值和对抗损失值对预训vae-sagan模型的参数进行调整，从而使得训练后的目标vae-sagan模型输出的第一重构欺诈样本更加真实，以便基于第一欺诈样本生成真实的第一重构欺诈样本，以增加少数类欺诈样本的数量，形成与多数类正常交易样本相匹配的高质量少数类欺诈样本，从而实现通过过采样方法来保证欺诈样本和正常交易样本之间数据平衡化的效果。

本文档来自技高网...

【技术保护点】

1.一种VAE-SAGAN模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取多个第一欺诈样本作为第一训练集，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取每个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值，包括：

4.根据权利要求1所述的方法，其特征在于，所述获取所述预训VAE-SAGAN模型的判别器判别每个第一欺诈样本与对应的第一重构欺诈样本之间的对抗损失值，包括：

5.一种欺诈检测模型的训练方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述获取多个第二欺诈样本，包括：

7.根据权利要求6所述的方法，其特征在于，所述获取多个第二原始欺诈样本，包括：

8.根据权利要求5所述的方法，其特征在于，所述预训欺诈检测模型包括支持向量机、梯度提升树或深度神经网络。

9.一种VAE-SAGAN模型训练系统，其特征在于，包括：

10.一种欺诈检测模型的训练系统，其特征在于，包括：

【技术特征摘要】

1.一种vae-sagan模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取多个第一欺诈样本作为第一训练集，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取每个第一欺诈样本与对应的第一重构欺诈样本之间的重构损失值，包括：

4.根据权利要求1所述的方法，其特征在于，所述获取所述预训vae-sagan模型的判别器判别每个第一欺诈样本与对应的第一重构欺诈样本之间的对抗损失值，包括：

5.一种...

【专利技术属性】
技术研发人员：邬少飞，叶超前，
申请(专利权)人：武汉工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人