一种客户类别确定方法、装置及存储介质制造方法及图纸

技术编号:28841123 阅读:18 留言:0更新日期:2021-06-11 23:39
本说明书实施例提供一种客户类别确定方法、装置及存储介质,可以应用于人工智能技术领域。包括:获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;根据各个维度下客户类别的归类条件确定目标客户的类别,以提高客户类别确定的准确性。

【技术实现步骤摘要】
一种客户类别确定方法、装置及存储介质
本说明书实施例涉及人工智能
,特别涉及一种客户类别确定方法、装置及存储介质。
技术介绍
随着金融行业的发展,国际收支业务在金融机构所占的比重越来越大。由于该国际收支业务场景的复杂性,不良客户很难在事前发现,如果不良客户愈发严重,将会对金融机构造成不利影响,导致金融机构口碑下降,盈利减少等。随着人工智能技术的发展,应用机器学习技术进行国际收支客户分类预测是一种值得尝试的方案。通过机器学习技术可以从大量已有样本中进行建模学习,并对未知样本进行预测,从而能够对进行国际收支客户分类预测。但是,目前主流的机器学习方法在国际收支客户分类上仍有不足,主要有两点。第一,国际收支场景下样本的特征包含非常多的信息,比如国际贸易信息、企业信息信息和企业主信息等,现有的主流方法将这些不同类别的信息直接一起拼接成样本的特征,从而一方面导致样本的特征维度特别大,容易造成“维度灾难问题”;另一方面不同类别的特征,其特征尺度和含义往往相差较大,直接拼接在一起容易使其失去原有的物理含义,从而导致模型达不到预期效果。第二,现有的主流方法将国际收支客户分类问题视为一般的类别平衡的分类问题,实际上,在国际收支客户分类场景中,不良客户所占的比例往往很低,正负类样本数目极不平衡。如果当成类别平衡问题进行处理效果不佳,而且在该场景中,应该更加关注少数类样本,即模型应该再保证准确率的情况下,尽可能准确预测出不良样本,现有方法不能满足此要求。
技术实现思路
本说明书实施例的目的是提供一种客户类别确定方法、装置及存储介质,以提高客户类别确定的准确性。为解决上述问题,本说明书实施例提供一种客户类别确定方法,所述方法包括:获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;根据各个维度下客户类别的归类条件确定目标客户的类别。为解决上述问题,本说明书实施例还提供一种客户类别确定装置,所述装置包括:获取模块,用于获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;划分模块,用于将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;提取模块,用于针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;拟合模块,用于基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;确定模块,用于根据各个维度下客户类别的归类条件确定目标客户的类别。为解决上述问题,本说明书实施例还提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序以实现:获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;根据各个维度下客户类别的归类条件确定目标客户的类别。为解决上述问题,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现:获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;根据各个维度下客户类别的归类条件确定目标客户的类别。由以上本说明书实施例提供的技术方案可见,本说明书实施例中,可以获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;根据各个维度下客户类别的归类条件确定目标客户的类别。本说明书实施例提供的方法,将负样本进行划分,分别与正样本组合成样本子集,有利于缓解分类问题不平衡,并将不同类别的特征划分到不同的维度,充分利用不同维度的互补信息,从而提高客户类别确定的准确性。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本说明书一个场景示例中分类模型的训练过程示意图;图2为本说明书一个场景示例中分类模型的测试过程示意图;图3为本说明书实施例一种客户类别确定方法的流程图;图4为本说明书实施例一种电子设备的功能结构示意图;图5为本说明书实施例一种客户类别确定装置的功能结构示意图。具体实施方式下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。本说明书提供了一个场景示例,在本场景示例中,以客户为国际收支客户为例,可以通过训练分类模型,使用分类模型对国际收支客户类别进行确定,具体的,可以确定该客户为不良客户,即产生信用问题的客户,或者确定该客户为普通客户,即为产生信用问题的客户。在本场景示例中,分类模型的训练过程如图1所示,具体可以包括以下步骤:首先从数据仓库获取国际收支客户相关的特征信息,特征按照类别分为三个维度,分别是国际贸易维度、企业信息维度和企业主信息维度,其中,国际贸易维度包括交易总量、涉外收入、境外汇款金额及其增量、境外汇款笔数及其增量等信息,企业信息维度包括企业基本信息、日均资产及其同比、企业账户流入流出金额、笔数及其同比等,企业主信息维度包括年龄本文档来自技高网...

【技术保护点】
1.一种客户类别确定方法,其特征在于,所述方法包括:/n获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;/n将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;/n针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;/n基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;/n根据各个维度下客户类别的归类条件确定目标客户的类别。/n

【技术特征摘要】
1.一种客户类别确定方法,其特征在于,所述方法包括:
获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;
将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;
针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;
基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;
根据各个维度下客户类别的归类条件确定目标客户的类别。


2.根据权利要求1所述的方法,其特征在于,所述不良客户满足以下情况至少一种:经营快贷逾期、个人征信违约、个人贷款信用卡违约、企业贷款违约;
所述普通客户为无上述情况的客户。


3.根据权利要求1所述的方法,其特征在于,所述正样本的数量与所述负样本的数量比例为3:1;
相应的,将所述负样本等分为多组,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;每个样本子集中负样本与正样本比例为1:1。


4.根据权利要求1所述的方法,其特征在于,所述样本子集数量为三个;
相应的针对不同样本子集,分别从国际贸易维度、企业信息维度和企业主信息维度提取各个样本子集中客户样本的特征向量。


5.根据权利要求1所述的方法,其特征在于,所述特征向量包括时间序列聚合特征和时间序列历史特征;所述时间序列聚合特征表示客户在历史时间段内的交易数据,所述时间序列历史特征表示客户在历史时间点的交易数据。


6.根据权利要求5所述的方法,其特征在于,所述时间序列聚合特征提取方式包括:
Fagg=[f(feature)time,time=1,2,3,4,5,6,1-2,1-3,1-4,1-5,1-6]
其中,Fagg表示时间序列聚合特征,特征数据f(feature)time分别取交易数据的平均值、最大值、最小值、标准差,时间段分别取前一个月、前两个月、前三个月、前四个月、前五个月、前六个月、前第二个月、前第三个月、前第四个月、前第五个月、前第六个月;
所述时间序列历史特征提取方式包括:
Fhis=[featuretime,time=1,2,3,4,5,6]
其中,Fhis表示时间序列历史特征,特征数据f(feature)time分别取交易数据的平均值、最大值、最小值、标准差,时间段分别取前第一个月、前第二个月、前第三个月、前第四个月、前第五个月、前第六个月。


7.根据权利要求1所述的方法,其特征在于,所述目标函数至少包括维度等价约束项:



其中Rmv(X+)表示维度等价约束项,用于使不同维度下客户类别的归类条件对正样本的归类结果保持一致;X+表示正样本,表示正...

【专利技术属性】
技术研发人员:陈李龙王娜强锋王雅欣
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1