风险识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38337691 阅读:12 留言:0更新日期:2023-08-02 09:18
本发明专利技术公开了一种风险识别方法,该方法包括获取第二数据集,第二数据集包括至少一个第二样本数据;对第二样本数据进行自动化特征工程,得到目标样本数据;通过目标样本数据对基准模型进行增量学习,得到更新模型;对基准模型和更新模型进行性能测试,得到基准测试结果以及更新测试结果;根据基准测试结果和更新测试结果,确定目标模型;获取待识别数据,通过目标模型对待识别数据进行风险识别,得到与各待识别数据对应的风险识别结果。本发明专利技术实现了特征工程自动化,节省了人工成本,实现了对待识别数据的快速识别。通过对更新模型进行性能监控,方便了根据实际风控场景和场景需求,决定是否调整基准模型,进而提升了建模效率。进而提升了建模效率。进而提升了建模效率。

【技术实现步骤摘要】
风险识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及智能决策
,尤其涉及一种风险识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着社会不断的发展,在当前金融全球化的环境下,各国金融环境不断变化,导致了个人风险等级的快速改变。而风险等级对于个人进行信贷办理有着重要的参考意义,因此,对个人风险进行识别是极其重要的。
[0003]现有技术中,风险等级是基于大量的用户行为特征,筛选出异常行为数据,从而确定风险等级,但是该方法中风险识别模型的迭代速度较慢,无法及时应用到新的风控场景中。然而,对于信贷而言,风险等级改变导致的个人违贷或错失客户都将带来巨大损失,因此,对金融风控模型提出快速迭代的需求。但模型迭代需要人工进行大量的特征工程以及数据分析,导致模型训练和迭代效率较低,严重影响了对用户风险等级的评估速度。

技术实现思路

[0004]本专利技术实施例提供一种风险识别方法、装置、计算机设备及存储介质,以解决现有技术中需要人工进行特征工程以及数据分析,导致风险识别较慢的问题。
[0005]一种风险识别方法,包括:
[0006]获取第二数据集;所述第二数据集包括至少一个第二样本数据;
[0007]对所有所述第二样本数据进行自动化特征工程,得到至少一个目标样本数据;
[0008]获取基准模型,通过所有所述目标样本数据对所述基准模型进行增量学习,得到更新模型;
[0009]对所述基准模型和所述更新模型进行测试,得到基准测试结果和更新测试结果;
[0010]根据所述基准测试结果和所述更新测试结果,确定目标模型;
[0011]获取待识别数据,通过所述目标模型对所有所述待识别数据进行风险识别,得到与各所述待识别数据对应的风险识别结果。
[0012]一种风险识别装置,包括:
[0013]数据获取模块,用于获取第二数据集;所述第二数据集包括至少一个第二样本数据;
[0014]特征工程模块,用于对所有所述第二样本数据进行自动化特征工程,得到至少一个目标样本数据;
[0015]增量学习模块,用于获取基准模型,通过所有所述目标样本数据对所述基准模型进行增量学习,得到更新模型;
[0016]性能测试模块,用于对所述基准模型和所述更新模型进行测试,得到基准测试结果和更新测试结果;
[0017]目标模型模块,用于根据所述基准测试结果和所述更新测试结果,确定目标模型;
[0018]风险识别模块,用于获取待识别数据,通过所述目标模型对所有所述待识别数据进行风险识别,得到与各所述待识别数据对应的风险识别结果。
[0019]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述风险识别方法。
[0020]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风险识别方法。
[0021]本专利技术提供一种风险识别方法、装置、计算机设备及存储介质,该方法通过获取第二样本数据,并对所有第二样本数据进行自动化特征工程,实现了对目标样本数据的筛选,进而实现了特征工程的自动化,还实现了二阶特征的聚合和选择。通过目标样本数据对基准模型进行增量学习,实现了对更新模型的确定。通过对基准模型和更新模型进行性能测试,并将测试结果进行比较,从而实现了对目标模型的确定。通过目标模型对待识别数据进行风险识别,实现了对风险识别结果的确定,进而实现了对待识别数据中风险的快速识别。进一步地,通过对更新模型性能进行监控,方便了根据实际风控场景和场景需求,决定是否调整基准模型,进而提升了建模效率。
附图说明
[0022]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本专利技术一实施例中风险识别方法的应用环境示意图;
[0024]图2是本专利技术一实施例中风险识别方法的流程图;
[0025]图3是本专利技术一实施例中风险识别方法步骤S20的流程图;
[0026]图4是本专利技术一实施例中基准模型训练方法的流程图;
[0027]图5是本专利技术一实施例中风险识别装置的原理框图;
[0028]图6是本专利技术一实施例中计算机设备的示意图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]本专利技术实施例提供的风险识别方法,该风险识别方法可应用如图1所示的应用环境中。具体地,该风险识别方法应用在风险识别装置中,该风险识别装置包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决现有技术中需要人工进行特征工程和数据分析,导致风险识别较慢的问题。其中,该服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端又称为用户端,是指与服务器相对应,为客户
提供分类服务的程序。客户端可安装在但不限于各种计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。
[0031]在一实施例中,如图2所示,提供一种风险识别方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0032]S10:获取第二数据集;所述第二数据集包括至少一个第二样本数据。
[0033]可理解地,第二样本数据为最新数据,也即近一段时间内的数据。第二样本数据包括用户信息,如姓名、年龄、性别和籍贯等;客户消费,如信用卡的消费情况等;历史借贷和还贷情况等。第二样本数据可以是从不同数据库中采集得到的,也可以是从客户端发送到数据库中的预先准备好的。进而根据所有第二样本数据构建第二数据集。
[0034]S20:对所有所述第二样本数据进行自动化特征工程,得到至少一个目标样本数据。
[0035]可理解地,目标样本数据对所有第二样本数据筛选后符合要求的。
[0036]具体地,在得到第二样本数据之后,对所有第二样本数据进行自动化特征工程,也即第一步先对第二样本数据去重,并统计第二样本数据中的特征饱和度。并根据特征饱和度的分布情况,通过孤立森立算法对离群样本进行剔除,即可得到筛选样本数据。获取历史的统计信息,通过统计信息对部分筛选样本数据中的缺失特征进行补全,并对补全后的筛选样本数据中的类别特征进行编本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险识别方法,其特征在于,包括:获取第二数据集;所述第二数据集包括至少一个第二样本数据;对所有所述第二样本数据进行自动化特征工程,得到至少一个目标样本数据;获取基准模型,通过所有所述目标样本数据对所述基准模型进行增量学习,得到更新模型;对所述基准模型和所述更新模型进行测试,得到基准测试结果和更新测试结果;根据所述基准测试结果和所述更新测试结果,确定目标模型;获取待识别数据,通过所述目标模型对所有所述待识别数据进行风险识别,得到与各所述待识别数据对应的风险识别结果。2.如权利要求1所述的风险识别方法,其特征在于,所述对所有所述第二样本数据进行自动化特征工程,得到至少一个目标样本数据,包括:对所有所述第二样本数据进行筛选,得到筛选样本数据;对所述筛选样本数据中的类别特征进行特征编码,得到与各所述类别特征对应的类别向量;根据所述类别向量中的时间特征向量构建文本信息,并对所述文本信息进行向量嵌入,得到与各所述文本信息对应的嵌入向量;对所有所述嵌入向量进行正则信息提取,得到目标特征向量;对所有所述目标特征向量进行二阶组合,得到至少一个组合特征,并根据所述组合特征,确定目标样本数据。3.如权利要求1所述的风险识别方法,其特征在于,所述通过所有所述目标样本数据对所述基准模型进行增量学习,得到更新模型,包括:在通过所述目标样本数据对所述基准模型进行增量学习中,对所述基准模型执行学习率调整操作,获取与各所述目标样本数据的预测标签;获取与各所述目标样本数据对应的参考标签,根据与同一所述目标样本数据对应的所述参考标签和所述预测标签,确定所述基准模型的预测损失值;根据所述预测损失值对所述基准模型的参数进行调整,并在所述预测损失值达到预设收敛条件时,将收敛之后的所述基准模型确定为更新模型。4.如权利要求1所述的风险识别方法,其特征在于,所述对所述基准模型和所述更新模型进行测试,得到基准测试结果和更新测试结果,包括:获取测试数据集;所述测试数据集中包括至少一个测试数据;通过所有所述测试数据对所述基准模型进行测试,得到基准性能测试值,并将所述基准性能测试值确定为基准测试结果;通过所有所述测试数据对所述更新模型进行测试,得到更新性能测试值,并将所述更新性能测试值确定为更新测试结果。5.如权利要求1所述...

【专利技术属性】
技术研发人员:杨嘉豪易艳王建明肖京任程天
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1