一种对风险账户的判别方法技术

技术编号:32528036 阅读:14 留言:0更新日期:2022-03-05 11:21
本发明专利技术提供的一种对风险账户的判别方法,所述判别方法包括:定期从大数据平台采集客户储蓄信息;对所述客户储蓄信息进行加工,生成风控规则;将特征变量中离散型的特征变量进行one

【技术实现步骤摘要】
一种对风险账户的判别方法


[0001]本专利技术涉及金融
,尤其涉及一种对风险账户的判别方法。

技术介绍

[0002]风险账户判别方法是判别非法资金转移的跨境赌博、电信网络诈骗等违法犯罪活动的一种方法。风险账户判别则能够及时发现银行中的违法异常账户,挖掘账户出租、出售、出借等潜在风险,判别出由非法犯罪分子行为形成的黑色产业链。较好的配合执法和监管机构打击治理电信网络违法犯罪行为。现有技术中的风险判别方法是,客户触碰单个风险规则,赋10分,所有风险规则检测完毕后,得到客户总分。将总分与既有风险阈值进行比较,若超过阈值则判定为风险账户。
[0003]所以,现有技术中的风险判别方法认为每个风险规则同等重要,且缺乏数据及算法支持,所以获得的风险判别的结果不准确。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术一种对风险账户的判别方法。
[0005]根据本专利技术的一个方面,提供了一种对风险账户的判别方法,所述判别方法包括:
[0006]定期从大数据平台采集客户储蓄信息;
[0007]对所述客户储蓄信息进行加工,生成风控规则;
[0008]以账户作为统一维度,根据所述风控规则作为特征变量X和业务反馈的好坏标签Y进行拼接,最终生成特征变量为X,标签为Y的大宽表;
[0009]将特征变量中离散型的特征变量进行one

hot处理,将特征变量中连续型的特征变量进行字符类型处理,构建特征工程;
[0010]将所述特征工程放入模型中训练,构建模型;
[0011]采用KS和AUC指标对模型结果进行评估,输出特征变量重要性排序和特征变量对应分数;
[0012]将特征变量的分数进行标准化处理,获得处理结果,所述处理结果为风险规则的权重;
[0013]根据所述权重得到风险总得分,将所述风险总得分与风险阈值对比,获得对比结果,根据所述对比结果判别其是否为风险账户。
[0014]可选的,所述客户储蓄信息具体包括客户储蓄明细数据表,流水附表信息,个人客户账户合约信息表,个人客户基本信息表,开销户表,客户资产统计历史表,客户筛选表的数据信息,明确每张表的唯一主键进行关联。
[0015]可选的,所述将特征变量中离散型的特征变量进行one

hot处理具体包括:
[0016]one

hot编码方式如下:
[0017]确定要编码的对象:[

中国

,

美国

,

日本

,

美国

][0018]确定分类变量:中国,美国,日本,共3种类别
[0019]有3个样本,每个样本有3个特征,将每个样本转化为二进制向量表示,首先进行特征的整数编码:中国
‑‑
0,美国
‑‑
1,日本
‑‑
2,并将特征按照从小到大排列,得到one

hot编码如下:
[0020][

中国

,

美国

,

日本

,

美国

]在one

hot编码后为:
[0021][[1,0,0],[0,1,0],[0,0,1],[0,1,0]]。
[0022]可选的,所述采用KS和AUC指标对模型结果进行评估,输出特征变量重要性排序和特征变量对应分数具体包括:
[0023]指标的计算方法基本一致;它是用不同方式呈现分类模型的准确性;KS 值是KS图中两条线之间最大的距离;其中KS的值越大,代表模型预测的准确性越好,KS的取值范围是[0,1],其中,KS>0.2代表模型有很好的区分性;在[0.2,0.4)之间,代表模型勉强接受;在[0.4,0.6)之间,代表模型有很好的区分能力,在[0.6,0.8)之间,代表模型有非常好的区分能力,大于等于0.8以上,代表模型可能异常;
[0024]AUC值为ROC曲线所覆盖的区域面积,AUC越大,分类器分类效果越好;AUC=1,是完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测;0.75=<AUC<1,代表这个分类器模型能有较好的分类结果; 0.5=<AUC<0.75,代表分类器模型分类结果一般;AUC<0.5,比随机猜测还差。
[0025]可选的,所述将特征变量的分数进行标准化处理,获得处理结果,所述处理结果为风险规则的权重具体包括:
[0026]将特征变量的分数进行min

max标准化处理,对应的数值为风控规则的权重;min

max标准化公式如下:
[0027]对序列x1,x2,x3,......,x
n
进行变换,
[0028]则新序列y1,y2,y3,......,y
n
∈[0,1]且无量纲。
[0029]可选的,所述根据所述权重得到风险总得分,将所述风险总得分与风险阈值对比,获得对比结果,根据所述对比结果判别其是否为风险账户具体包括:
[0030]将各个风控规则根据权重进行加总,计算风险总得分;
[0031]将风险总得分和风险阈值进行比较,若超过,对应账户为风险账户;否则,对应账户为无风险账户;
[0032]设总得分为y,风险阈值为Y,规则触碰得分为x1,x2,x3,......,x
n
,规则权重为a1,a2,a3......a
n
,则具体公式如下:
[0033]y=a1x1+a2x2+a3x3+......+a
n
x
n
[0034]若y>Y,对应为风险账户。
[0035]本专利技术提供的一种对风险账户的判别方法,所述判别方法包括:定期从大数据平台采集客户储蓄信息;对所述客户储蓄信息进行加工,生成风控规则;以账户作为统一维度,根据所述风控规则作为特征变量X和业务反馈的好坏标签Y进行拼接,最终生成特征变量为X,标签为Y的大宽表;将特征变量中离散型的特征变量进行one

hot处理,将特征变量中连续型的特征变量进行字符类型处理,构建特征工程;将所述特征工程放入模型中训练,构建模型;采用KS和AUC指标对模型结果进行评估,输出特征变量重要性排序和特征变量对
应分数;将特征变量的分数进行标准化处理,获得处理结果,所述处理结果为风险规则的权重;根据所述权重得到风险总得分,将所述风险总得分与风险阈值对比,获得对比结果,根据所述对比结果判别其是否为风险账户。提高了风险评估的准确度。
[0036]上述说明仅是本专利技术技术方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对风险账户的判别方法,其特征在于,所述判别方法包括:定期从大数据平台采集客户储蓄信息;对所述客户储蓄信息进行加工,生成风控规则;以账户作为统一维度,根据所述风控规则作为特征变量X和业务反馈的好坏标签Y进行拼接,最终生成特征变量为X,标签为Y的大宽表;将特征变量中离散型的特征变量进行one

hot处理,将特征变量中连续型的特征变量进行字符类型处理,构建特征工程;将所述特征工程放入模型中训练,构建模型;采用KS和AUC指标对模型结果进行评估,输出特征变量重要性排序和特征变量对应分数;将特征变量的分数进行标准化处理,获得处理结果,所述处理结果为风险规则的权重;根据所述权重得到风险总得分,将所述风险总得分与风险阈值对比,获得对比结果,根据所述对比结果判别其是否为风险账户。2.根据权利要求1所述的一种对风险账户的判别方法,其特征在于,所述客户储蓄信息具体包括客户储蓄明细数据表,流水附表信息,个人客户账户合约信息表,个人客户基本信息表,开销户表,客户资产统计历史表,客户筛选表的数据信息,明确每张表的唯一主键进行关联。3.根据权利要求1所述的一种对风险账户的判别方法,其特征在于,所述将特征变量中离散型的特征变量进行one

hot处理具体包括:one

hot编码方式如下:确定要编码的对象:[

中国

,

美国

,

日本

,

美国

]确定分类变量:中国,美国,日本,共3种类别有3个样本,每个样本有3个特征,将每个样本转化为二进制向量表示,首先进行特征的整数编码:中国
‑‑
0,美国
‑‑
1,日本
‑‑
2,并将特征按照从小到大排列,得到one

hot编码如下:[

中国

,

美国

,

日本

,

美国

]在one

hot编码后为:[[1,0,0],[0,1,0],[0,0,...

【专利技术属性】
技术研发人员:姜永进
申请(专利权)人:北银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1