System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法技术_技高网

一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法技术

技术编号:41315266 阅读:2 留言:0更新日期:2024-05-13 14:57
本发明专利技术公开了一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,包括:S01、采集用户基本信息并判断该数据存在的采集数据异常值、缺失值、唯一性,生成第一数据反馈数据包;S02、对所述第一数据反馈数据包进行预处理,然后将处理后的必要数据传导至图谱构建模块内构建业务场景知识图谱;S03、对所述业务场景知识图谱进行图特征的生成以及特征的筛选形成图特征集合,在通过机器学习算法与图特征集合组合构成构建风控模型。该发明专利技术将传统的机器学习提取特征和知识图谱挖掘的图特征有机结合构建风控模型,并与知识图谱风控模型通过交叉验证实现模型融合,最终生成多维风控模型,为信用评估、反欺诈和风险控制提供智能决策。

【技术实现步骤摘要】

本专利技术涉及风险管理方法,具体涉及一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法


技术介绍

1、当前银行业务种类多且服务范围广。在给人们生活带来便利的同时,不可否认,也导致银行风险暴露面不断扩张。随着经济一体化和金融全球化进程的加速,互联网、移动互联网、互联网+的快速发展,金融机构业务规模的迅猛增长和品种日益丰富,以及新兴业务(如互联网金融、电子支付)及银行自身特点(交易场景复杂、覆盖范围广泛、追踪记录难度高)的变化,银行风险的发生率,复杂度与影响力也爆炸性增长。银行所面临的风险大致包括信用风险、市场风险、操作风险、流动性风险、国家风险、声誉风险、法律风险、合规风险和战略风险九大类。其中,信用风险在上述银行风险中占比较大且可识别性较强。因此,对信用风险的实时识别、计量与管控在银行的经营与发展过程中尤为重要。

2、传统的机器学习风控建模主要依赖人工经验进行算法选型和特征工程构建,模型输出比较单一。知识图谱作为一种大规模的语义网络,以海量的业务数据为基础,综合运用语义理解、知识挖掘、知识融合、知识补全等技术,提炼出高精度知识,将真实业务中的实体及其之间的关系通过图结构来表示,在数据挖掘具有传统的机器学习不可比拟的效率优势。


技术实现思路

1、本专利技术的目的是提供一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,增加风控模型的可解释性和提高模型泛化能力。

2、为了实现上述目的,本专利技术提供如下技术方案:一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,包括:

3、s01、采集用户基本信息并判断该数据存在的采集数据异常值、缺失值、唯一性,生成第一数据反馈数据包;

4、s02、对所述第一数据反馈数据包进行预处理,然后将处理后的必要数据传导至图谱构建模块内构建业务场景知识图谱;

5、s03、对所述业务场景知识图谱进行图特征的生成以及特征的筛选形成图特征集合,在通过机器学习算法与图特征集合组合构成构建风控模型;

6、s04、将机器学习算法模块和图算法模块输出的风控模型进行交叉验证和模型融合生成多维风控模型。

7、作为优选的,所述用户基本信息包括客户app的登录设备信息、人行征信、客户基本信息、地址信息、联系人信息、联系电话、账户基本信息、第三方数据、登录行为、工作单位信息以及入账交易流水。

8、作为优选的,步骤s01中对用户基本信息的异常值、缺失值、唯一性判断方法包括:

9、s11、基于所述用户基本信息种类核实出缺少项目,并对确实项目数据进行标识;

10、s12、基于所述用户基本信息种类核实出的完整项目,逐个对项每一个完整项目中数据包含的特征项目进行核对,并标识出缺失的特征项目;

11、s13、基于核对的完整项目和缺少项目进行查找,将完整项目中包含的缺少项目缺少的特征项目进行自动填充。

12、作为优选的,所述图谱构建模块基于schema设计自上而下构建业务场景知识图谱。

13、作为优选的,所述机器学习算法模块基于传统的机器学习算法基于人工经验构建特征工程。

14、作为优选的,所述步骤s02中完成的知识图谱构会导入图算法模块,通过图算法模块内置单源最短路径dijkstra算法、度中心性、spectral clustering算法、dnn、gcn等几十种图算法构建图神经网络风控模型。

15、作为优选的,所述步骤s04中交叉验证是指分别将确定的特征代入图神经网络风控模型和风控模型进行效验,并将效验结果和次数进行均值后百分比,低于百分之八十则数据存在错误。

16、作为优选的,所述步骤s04中模型融合是基于交叉验证成功前提下将图神经网络风控模型和风控模型进行融合。

17、在上述技术方案中,本专利技术提供的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,具备以下有益效果:将传统的机器学习提取特征和知识图谱挖掘的图特征有机结合构建风控模型,并与知识图谱风控模型通过交叉验证实现模型融合,最终生成多维风控模型,为信用评估、反欺诈和风险控制提供智能决策。

本文档来自技高网...

【技术保护点】

1.一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,包括:

2.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述用户基本信息包括客户APP的登录设备信息、人行征信、客户基本信息、地址信息、联系人信息、联系电话、账户基本信息、第三方数据、登录行为、工作单位信息以及入账交易流水。

3.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,步骤S01中对用户基本信息的异常值、缺失值、唯一性判断方法包括:

4.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述图谱构建模块基于SCHEMA设计自上而下构建业务场景知识图谱。

5.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述机器学习算法模块基于传统的机器学习算法基于人工经验构建特征工程。

6.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述步骤S02中完成的知识图谱构会导入图算法模块,通过图算法模块内置单源最短路径Dijkstra算法、度中心性、SpectralClustering算法、DNN、GCN等几十种图算法构建图神经网络风控模型。

7.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述步骤S04中交叉验证是指分别将确定的特征代入图神经网络风控模型和风控模型进行效验,并将效验结果和次数进行均值后百分比,低于百分之八十则数据存在错误。

8.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述步骤S04中模型融合是基于交叉验证成功前提下将图神经网络风控模型和风控模型进行融合。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述基于大规模知识图谱驱动的银行关联风险实时挖掘方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述基于大规模知识图谱驱动的银行关联风险实时挖掘方法的步骤。

...

【技术特征摘要】

1.一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,包括:

2.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述用户基本信息包括客户app的登录设备信息、人行征信、客户基本信息、地址信息、联系人信息、联系电话、账户基本信息、第三方数据、登录行为、工作单位信息以及入账交易流水。

3.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,步骤s01中对用户基本信息的异常值、缺失值、唯一性判断方法包括:

4.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述图谱构建模块基于schema设计自上而下构建业务场景知识图谱。

5.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述机器学习算法模块基于传统的机器学习算法基于人工经验构建特征工程。

6.根据权利要求1所述的一种基于大规模知识图谱驱动的银行关联风险实时挖掘方法,其特征在于,所述步骤s02中完成的知识图谱构会导入图算法模块,...

【专利技术属性】
技术研发人员:宣明辉张姗刘卫东
申请(专利权)人:信雅达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1