幌子企业识别方法及装置、存储介质及电子设备制造方法及图纸

技术编号:36033439 阅读:13 留言:0更新日期:2022-12-21 10:36
本发明专利技术提供了一种幌子企业识别方法及装置、存储介质及电子设备,该方法包括:当需要对目标企业进行识别时,确定目标企业对应的企业信息,其中包括企业基础数据、交易流水数据、渠道登陆数据、工商数据和征信数据;在企业信息中,确定场景特征数据和每个预设特征维度对应的特征数据;将各维度特征数据输入评分模型,经处理后获得风险评分;将场景特征数据和风险评分输入场景解释模型,经处理后获得场景映射规则;依据风险评分和场景映射规则,确定识别结果;若识别结果表征目标企业为幌子企业,则确定目标企业对应的欺诈场景。应用本发明专利技术的方法,结合多维度数据进行识别,可提高识别准确率,且可实现欺诈场景的自动化识别。且可实现欺诈场景的自动化识别。且可实现欺诈场景的自动化识别。

【技术实现步骤摘要】
幌子企业识别方法及装置、存储介质及电子设备


[0001]本专利技术涉及风险控制
,特别是涉及一种幌子企业识别方法及装置、存储介质及电子设备。

技术介绍

[0002]随着金融业务的发展,银行等金融机构面临的违法、欺诈行为越来越多。幌子企业指的是没有实际经营的企业,在金融业务场景中,不法分子通常利用幌子企业实施违法、欺诈行为。故在金融机构的风险防控工作中,识别幌子企业是主要的任务之一。
[0003]目前,通常是基于企业的工商信息,提取对应的特征,以企业是否存在无实际经营业务或不以实际经营业务为设立出发点的特征,识别企业是否为幌子企业。
[0004]基于现有的幌子企业识别方法,仅以工商信息中蕴含的特征识别幌子企业的依据,数据来源单一,识别幌子企业的准确性较低。其次,现有的幌子企业识别方法,仅是识别企业是否为幌子企业,对于识别结果,还需人工结合业务理解风险场景,需耗费一定的人力资源,且容易出现理解偏差。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种幌子企业识别方法,以解决现有的幌子企业识别方式中,依赖单一数据来源,需人工解读风险场景,识别准确率较低,且需耗费大量人力资源的问题。
[0006]本专利技术实施例还提供了一种幌子企业识别装置,用以保证上述方法实际中的实现及应用。
[0007]为实现上述目的,本专利技术实施例提供如下技术方案:
[0008]一种幌子企业识别方法,包括:
[0009]当需要对目标企业进行识别时,确定所述目标企业对应的企业信息,所述企业信息包括企业基础数据、交易流水数据、渠道登陆数据、工商数据和征信数据;
[0010]在所述企业信息中,确定场景特征数据和每个预设特征维度对应的特征数据;
[0011]将各个所述预设特征维度对应的特征数据输入已构建的评分模型,经所述评分模型处理后,获得所述目标企业对应的风险评分;
[0012]将所述场景特征数据和所述风险评分输入已构建的场景解释模型,经所述场景解释模型处理后,获得所述风险评分对应的场景映射规则;
[0013]依据所述风险评分和所述场景映射规则,确定所述目标企业对应的识别结果;
[0014]若所述识别结果表征所述目标企业为幌子企业,则确定所述目标企业对应的欺诈场景,完成所述目标企业的识别过程。
[0015]上述的方法,可选的,所述评分模型的构建过程,包括:
[0016]确定每个所述预设特征维度对应的初始样本集;每个所述预设特征维度对应的初始样本集包括该预设特征维度对应的多个样本数据;
[0017]对于每个所述预设特征维度,依据该预设特征维度对应的初始样本集,确定该预设特征维度对应的训练样本集;
[0018]对于每个所述预设特征维度,依据该预设特征维度对应的训练样本集,构建该预设特征维度对应的子模型;
[0019]对各个所述子模型进行融合处理,得到融合模型,将所述融合模型作为所述评分模型。
[0020]上述的方法,可选的,所述依据该预设特征维度对应的初始样本集,确定该预设特征维度对应的训练样本集,包括:
[0021]依据预设的过采样策略,对该预设特征维度对应的初始样本集进行过采样处理,得到第一样本集;
[0022]依据预设的数据清洗策略,对所述第一样本集进行数据清洗处理,得到所述第一样本集对应的第二样本集;
[0023]依据预设的社区发现算法,对所述第二样本集进行坏样本扩散处理,得到所述第二样本集对应的第三样本集;
[0024]依据预设的变量衍生策略,对所述第三样本集进行变量衍生处理,得到所述第三样本集对应的第四样本集;
[0025]依据预设的变量筛选策略,对所述第四样本集进行变量筛选处理,得到所述第四样本集对应的第五样本集,将所述第五样本集作为该预设特征维度对应的训练样本集。
[0026]上述的方法,可选的,所述依据该预设特征维度对应的训练样本集,构建该预设特征维度对应的子模型,包括:
[0027]依据预设的多个集成树算法,构建每个所述集成树算法对应的集成树模型;
[0028]对于每个所述集成树模型,依据该预设特征维度对应的训练样本集,对该集成树模型进行训练,将完成训练的该集成树模型确定为备选模型;
[0029]对于每个所述备选模型,依据预设的预留样本集和跨时间样本集,对该备选模型进行验证,得到该备选模型对应的验证结果;
[0030]依据各个所述备选模型对应的验证结果,在各个所述备选模型中,确定目标备选模型,将所述目标备选模型确定为该预设特征维度对应的子模型。
[0031]上述的方法,可选的,所述对各个所述子模型进行融合处理,得到融合模型,包括:
[0032]确定每个所述子模型对应的权重;
[0033]按照各个所述子模型对应的权重,对各个所述子模型进行加权融合,将融合结果作为所述融合模型。
[0034]上述的方法,可选的,所述场景解释模型的构建过程,包括:
[0035]依据预设的场景映射规则集合以及预设的梯度提升决策树算法,构建梯度提升决策树模型;
[0036]依据预设的场景解释变量及坏样本集合,对所述梯度提升决策树模型进行训练,得到经过训练的梯度提升决策树模型;
[0037]判断所述经过训练的梯度提升决策树模型是否满足预设的测试验证条件,若所述经过训练的梯度提升决策树模型满足所述测试验证条件,则将所述经过训练的梯度提升决策树模型确定为所述场景解释模型。
[0038]上述的方法,可选的,各个所述预设特征维度包括:基础信息维度、企业流水维度、实控人流水维度、工商与企业征信维度以及实控人征信维度。
[0039]一种幌子企业识别装置,包括:
[0040]第一确定单元,用于当需要对目标企业进行识别时,确定所述目标企业对应的企业信息,所述企业信息包括企业基础数据、交易流水数据、渠道登陆数据、工商数据和征信数据;
[0041]第二确定单元,用于在所述企业信息中,确定场景特征数据和每个预设特征维度对应的特征数据;
[0042]第一处理单元,用于将各个所述预设特征维度对应的特征数据输入已构建的评分模型,经所述评分模型处理后,获得所述目标企业对应的风险评分;
[0043]第二处理单元,用于将所述场景特征数据和所述风险评分输入已构建的场景解释模型,经所述场景解释模型处理后,获得所述风险评分对应的场景映射规则;
[0044]第三确定单元,用于依据所述风险评分和所述场景映射规则,确定所述目标企业对应的识别结果;
[0045]第四确定单元,用于若所述识别结果表征所述目标企业为幌子企业,则确定所述目标企业对应的欺诈场景,完成所述目标企业的识别过程。
[0046]一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的幌子企业识别方法。
[0047]一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种幌子企业识别方法,其特征在于,包括:当需要对目标企业进行识别时,确定所述目标企业对应的企业信息,所述企业信息包括企业基础数据、交易流水数据、渠道登陆数据、工商数据和征信数据;在所述企业信息中,确定场景特征数据和每个预设特征维度对应的特征数据;将各个所述预设特征维度对应的特征数据输入已构建的评分模型,经所述评分模型处理后,获得所述目标企业对应的风险评分;将所述场景特征数据和所述风险评分输入已构建的场景解释模型,经所述场景解释模型处理后,获得所述风险评分对应的场景映射规则;依据所述风险评分和所述场景映射规则,确定所述目标企业对应的识别结果;若所述识别结果表征所述目标企业为幌子企业,则确定所述目标企业对应的欺诈场景,完成所述目标企业的识别过程。2.根据权利要求1所述的方法,其特征在于,所述评分模型的构建过程,包括:确定每个所述预设特征维度对应的初始样本集;每个所述预设特征维度对应的初始样本集包括该预设特征维度对应的多个样本数据;对于每个所述预设特征维度,依据该预设特征维度对应的初始样本集,确定该预设特征维度对应的训练样本集;对于每个所述预设特征维度,依据该预设特征维度对应的训练样本集,构建该预设特征维度对应的子模型;对各个所述子模型进行融合处理,得到融合模型,将所述融合模型作为所述评分模型。3.根据权利要求2所述的方法,其特征在于,所述依据该预设特征维度对应的初始样本集,确定该预设特征维度对应的训练样本集,包括:依据预设的过采样策略,对该预设特征维度对应的初始样本集进行过采样处理,得到第一样本集;依据预设的数据清洗策略,对所述第一样本集进行数据清洗处理,得到所述第一样本集对应的第二样本集;依据预设的社区发现算法,对所述第二样本集进行坏样本扩散处理,得到所述第二样本集对应的第三样本集;依据预设的变量衍生策略,对所述第三样本集进行变量衍生处理,得到所述第三样本集对应的第四样本集;依据预设的变量筛选策略,对所述第四样本集进行变量筛选处理,得到所述第四样本集对应的第五样本集,将所述第五样本集作为该预设特征维度对应的训练样本集。4.根据权利要求2所述的方法,其特征在于,所述依据该预设特征维度对应的训练样本集,构建该预设特征维度对应的子模型,包括:依据预设的多个集成树算法,构建每个所述集成树算法对应的集成树模型;对于每个所述集成树模型,依据该预设特征维度对应的训练样本集,对该集成树模型进行训练,将完成训练的该集成树模型确定为备选模型;对于每个所述备选模型,依据预设的预留样本集和跨时间样本集,对该备...

【专利技术属性】
技术研发人员:刘涛房雯雯王林
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1