【技术实现步骤摘要】
一种客户类别确定方法、装置及存储介质
本说明书实施例涉及人工智能
,特别涉及一种客户类别确定方法、装置及存储介质。
技术介绍
随着金融行业的发展,国际收支业务在金融机构所占的比重越来越大。由于该国际收支业务场景的复杂性,不良客户很难在事前发现,如果不良客户愈发严重,将会对金融机构造成不利影响,导致金融机构口碑下降,盈利减少等。随着人工智能技术的发展,应用机器学习技术进行国际收支客户分类预测是一种值得尝试的方案。通过机器学习技术可以从大量已有样本中进行建模学习,并对未知样本进行预测,从而能够对进行国际收支客户分类预测。但是,目前主流的机器学习方法在国际收支客户分类上仍有不足,主要有两点。第一,国际收支场景下样本的特征包含非常多的信息,比如国际贸易信息、企业信息信息和企业主信息等,现有的主流方法将这些不同类别的信息直接一起拼接成样本的特征,从而一方面导致样本的特征维度特别大,容易造成“维度灾难问题”;另一方面不同类别的特征,其特征尺度和含义往往相差较大,直接拼接在一起容易使其失去原有的物理含义,从而导致模型达不到预期效果。第二,现有的主流方法将国际收支客户分类问题视为一般的类别平衡的分类问题,实际上,在国际收支客户分类场景中,不良客户所占的比例往往很低,正负类样本数目极不平衡。如果当成类别平衡问题进行处理效果不佳,而且在该场景中,应该更加关注少数类样本,即模型应该再保证准确率的情况下,尽可能准确预测出不良样本,现有方法不能满足此要求。
技术实现思路
本说明书实施例的目的是提供一种 ...
【技术保护点】
1.一种客户类别确定方法,其特征在于,所述方法包括:/n获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;/n将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;/n针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;/n基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;/n根据各个维度下客户类别的归类条件确定目标客户的类别。/n
【技术特征摘要】
1.一种客户类别确定方法,其特征在于,所述方法包括:
获取预设数量的客户样本;所述客户样本包括正样本和负样本;所述正样本表示客户类别为不良客户,所述负样本表示客户类别为普通客户;
将所述负样本划分为多组负样本,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;
针对不同样本子集,从不同的维度提取各个样本子集中客户样本的特征向量;
基于预设的目标函数,对各个样本子集中客户样本的特征向量和客户样本表示的客户类别进行拟合,得到各个维度下客户类别的归类条件;
根据各个维度下客户类别的归类条件确定目标客户的类别。
2.根据权利要求1所述的方法,其特征在于,所述不良客户满足以下情况至少一种:经营快贷逾期、个人征信违约、个人贷款信用卡违约、企业贷款违约;
所述普通客户为无上述情况的客户。
3.根据权利要求1所述的方法,其特征在于,所述正样本的数量与所述负样本的数量比例为3:1;
相应的,将所述负样本等分为多组,每组负样本与所述正样本组合形成样本子集,得到多个样本子集;每个样本子集中负样本与正样本比例为1:1。
4.根据权利要求1所述的方法,其特征在于,所述样本子集数量为三个;
相应的针对不同样本子集,分别从国际贸易维度、企业信息维度和企业主信息维度提取各个样本子集中客户样本的特征向量。
5.根据权利要求1所述的方法,其特征在于,所述特征向量包括时间序列聚合特征和时间序列历史特征;所述时间序列聚合特征表示客户在历史时间段内的交易数据,所述时间序列历史特征表示客户在历史时间点的交易数据。
6.根据权利要求5所述的方法,其特征在于,所述时间序列聚合特征提取方式包括:
Fagg=[f(feature)time,time=1,2,3,4,5,6,1-2,1-3,1-4,1-5,1-6]
其中,Fagg表示时间序列聚合特征,特征数据f(feature)time分别取交易数据的平均值、最大值、最小值、标准差,时间段分别取前一个月、前两个月、前三个月、前四个月、前五个月、前六个月、前第二个月、前第三个月、前第四个月、前第五个月、前第六个月;
所述时间序列历史特征提取方式包括:
Fhis=[featuretime,time=1,2,3,4,5,6]
其中,Fhis表示时间序列历史特征,特征数据f(feature)time分别取交易数据的平均值、最大值、最小值、标准差,时间段分别取前第一个月、前第二个月、前第三个月、前第四个月、前第五个月、前第六个月。
7.根据权利要求1所述的方法,其特征在于,所述目标函数至少包括维度等价约束项:
其中Rmv(X+)表示维度等价约束项,用于使不同维度下客户类别的归类条件对正样本的归类结果保持一致;X+表示正样本,表示正...
【专利技术属性】
技术研发人员:陈李龙,王娜,强锋,王雅欣,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。