System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种信用卡行为特征识别方法、装置、设备及存储介质制造方法及图纸_技高网

一种信用卡行为特征识别方法、装置、设备及存储介质制造方法及图纸

技术编号:44737652 阅读:5 留言:0更新日期:2025-03-21 18:04
本申请公开了一种信用卡行为特征识别方法、装置、设备及存储介质,涉及金融技术领域,该方法包括:获取交易流水数据,并对交易流水数据进行预处理得到多个数据样本,数据样本包括标记样本以及非标记样本,标记样本带有信用卡行为特征类型标记;通过对各标记样本进行节点状态计算,生成各标记样本对应的节点状态序列;将节点状态序列转换为多视角图,并基于多视角图训练多视角图表示学习模型;通过训练好的多视角图表示学习模型对未标记样本进行信用卡行为特征识别;实现了在短期内精确识别信用卡使用行为特征。

【技术实现步骤摘要】

本申请涉及金融,尤其涉及一种信用卡行为特征识别方法、装置、设备及存储介质


技术介绍

1、在金融领域中,挖掘银行信用卡交易流水数据,理解并识别客户使用信用卡的行为特征,对于风险管理,提供个性化服务和营销策略,并使得银行利润最大化具有重要的现实意义。

2、目前,理解并识别客户使用信用卡行为特征的研究方法,一方面是需要依赖客户的工作年限、婚姻状况和收入等隐私数据进行分析。另一方面,使用依赖于领域专业知识和如额度使用率、还款率等专家知识的特征工程方法,如逻辑回归、支持向量机等;提取特征的表达性和描述能力较为有限。并且,很多研究集中于对长期或整个客户进行信用卡行为特征识别,这与客户使用信用卡行为特征复杂且随时间细粒度变化这一事实是不一致的。

3、cn114722935a提供了一种信用卡客户数据细分方法及装置。该方法首先根据细分需求对原始信用卡客户数据进行预处理,得到目标信用卡客户数据集。然后,利用目标信用卡客户数据集创建信用卡客户数据kd-树;最后,使用信用卡客户数据kd-树与dbscan算法相结合的空间搜索算法,对目标信用卡客户数据集进行细分。该专利一方面基于如客户收入和消费金额信用卡等客户属性计算不同维度上的数据方差,选出最大的方差值作为分割维度,这种依赖于领域专业知识定义的指标提取相关特征的能力比较有限。另一方面,该专利是在整个信用卡客户粒度上进行细分,不能反映客户在短期内的信用卡使用行为特征,进而难以做出及时且准确的风险管控和提供个性化服务。

4、cn116385145a提出了一种信用卡客户行为的预测方法。首先,在特征工程方面,根据历史的客户信用卡逾期记录,采取了缺失值填充、独热编码、卡方分析、相关性分析、数据装箱等数据分析处理技术,产生建模数据表。然后,构建基于聚类和装袋的xgboost分类模型,并使用所述训练集进行训练。最后,通过调参获取所述预训练好的信用卡客户行为预测模型。该专利一方面研究的是客诉行为正样本和负样本特征表示学习,是一种二分类问题,不适用于客户在短期内复杂信用卡使用行为特征识别问题。另一方面,该专利技术使用了传统的机器学习方法,此类方法在提取高级特征的能力方面,相对深度学习、表示学习等人工智能算法比较有限,进而难以有效地解决复杂的多分类问题。

5、有鉴于此,如何解决短期内信用卡使用行为特征的识别问题成为亟待解决的问题。


技术实现思路

1、有鉴于此,本申请的主要目的在于提供一种信用卡行为特征识别方法、装置、设备及存储介质,在短期内精确识别信用卡使用行为特征。

2、本申请第一方面提供了一种信用卡行为特征识别方法,该方法包括:

3、获取交易流水数据,并对交易流水数据进行预处理得到多个数据样本,数据样本包括标记样本以及非标记样本,标记样本带有信用卡行为特征类型标记;

4、通过对各标记样本进行节点状态计算,生成各标记样本对应的节点状态序列;

5、将节点状态序列转换为多视角图,并基于多视角图训练多视角图表示学习模型;

6、通过训练好的多视角图表示学习模型对未标记样本进行信用卡行为特征识别。

7、在本申请第一方面的一些实现方式中,对交易流水数据进行预处理得到多个数据样本,包括:

8、将交易流水数据划分为多个连续且等长的数据片段,以得到多个数据样本;

9、从多个数据样本中随机选取多个用于模型训练的数据样本,并为多个用于模型训练的数据样本添加信用卡行为特征类型标记,以得到多个标记样本。

10、在本申请第一方面的一些实现方式中,交易流水数据由按时间排序的一系列交易点构成;将交易流水数据划分为多个连续且等长的数据片段,包括:

11、从交易流水数据的第一个交易点开始,通过预设长度的时间窗口,以预设长度的步幅连续滑动至交易流水数据的最后一个交易点,以得到多个连续且等长的数据片段,数据片段与时间窗口的长度相同。

12、在本申请第一方面的一些实现方式中,通过对各标记样本进行节点状态计算,生成各标记样本对应的节点状态序列,包括:

13、对于各标记样本,通过信用额度以及剩余额度描述标记样本中各交易点的节点状态;

14、将信用额度的额度范围划分为m个信用额度的离散化区间,将剩余额度的额度范围划分为n个剩余额度的离散化区间,并由m个信用额度的离散化区间以及n个剩余额度的离散化区间构成m*n个离散化节点状态,其中,m以及n均为正整数;

15、基于各交易点的节点状态,将各交易点映射到相应的离散化节点状态,以得到标记样本对应的节点状态序列。

16、在本申请第一方面的一些实现方式中,多视角图包括:频率图以及时间图,将节点状态序列转换为多视角图,包括:

17、基于不同离散化节点状态之间的状态转换频率,将节点状态序列转换为频率图,其中,频率图的节点表示离散化节点状态,频率图的边表示不同离散化节点状态之间的状态转换频率;

18、基于不同离散化节点状态之间的状态转换平均时间,将节点状态序列转换为时间图,其中,时间图的节点表示离散化节点状态,时间图的边表示不同离散化节点状态之间的状态转换平均时间。

19、在本申请第一方面的一些实现方式中,多视角图表示学习模型包括:图卷积网络以及分类器;

20、图卷积网络用于提取和池化多视角图中各节点的节点特征,并将各节点的节点特征展平为一维后映射到样本标记空间,以得到数据样本在不同信用卡客户行为特征类别上的概率分布;

21、分类器基于所述图卷积网络所提取的特征表示,为数据样本分配信用卡客户行为特征类别标签。

22、在本申请第一方面的一些实现方式中,图卷积网络包括:图卷积层、图嵌入池化层、压平层以及全连接层;

23、图卷积层用于提取多视角图中各节点的特征,以得到多视角图中各节点的初始特征表示;

24、图嵌入池化层通过加权凸组合,对各节点的初始特征表示进行池化,以得到多视角图中各节点新的特征表示;

25、压平层用于将池化后的各节点新的特征表示展平为一维;

26、全连接层用于将展平后的各节点新的特征表示映射到样本标记空间,以得到所述数据样本在不同信用卡客户行为特征类别上的概率分布。

27、本申请第二方面提供了一种信用卡行为特征识别装置,该装置包括:

28、数据处理模块,用于获取交易流水数据,并对交易流水数据进行预处理得到多个数据样本,数据样本包括标记样本以及非标记样本,标记样本带有信用卡行为特征类型标记;

29、序列生成模块,用于通过对各标记样本进行节点状态计算,生成各标记样本对应的节点状态序列;

30、模型训练模块,用于将节点状态序列转换为多视角图,并基于多视角图训练多视角图表示学习模型;

31、特征识别模块,用于通过训练好的多视角图表示学习模型对未标记样本进行信用卡行为特征识别。

32、本申请第三方面提供本文档来自技高网...

【技术保护点】

1.一种信用卡行为特征识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述交易流水数据进行预处理得到多个数据样本,包括:

3.根据权利要求2所述的方法,其特征在于,所述交易流水数据由按时间排序的一系列交易点构成;所述将所述交易流水数据划分为多个连续且等长的数据片段,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过对各所述标记样本进行节点状态计算,生成各所述标记样本对应的节点状态序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述多视角图包括:频率图以及时间图,所述将所述节点状态序列转换为多视角图,包括:

6.根据权利要求1所述的方法,其特征在于,所述多视角图表示学习模型包括:图卷积网络以及分类器;

7.根据权利要求6所述的方法,其特征在于,所述图卷积网络包括:图卷积层、图嵌入池化层、压平层以及全连接层;

8.一种信用卡行为特征识别装置,其特征在于,所述装置包括:

9.一种信用卡行为特征识别设备,其特征在于,所述设备包括存储器和处理器,所述处理器用于执行所述存储器中存储的程序,运行如权利要求1至7任一项所述的信用卡行为特征识别方法。

10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的信用卡行为特征识别方法的各个步骤。

...

【技术特征摘要】

1.一种信用卡行为特征识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述交易流水数据进行预处理得到多个数据样本,包括:

3.根据权利要求2所述的方法,其特征在于,所述交易流水数据由按时间排序的一系列交易点构成;所述将所述交易流水数据划分为多个连续且等长的数据片段,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过对各所述标记样本进行节点状态计算,生成各所述标记样本对应的节点状态序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述多视角图包括:频率图以及时间图,所述将所述节点状态序列转换为多视角图,包括:

6.根据...

【专利技术属性】
技术研发人员:刘强
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1