System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于多数据分析推理的银行对公贷款风险评估方法和系统。
技术介绍
1、传统上,银行对公贷款风险评估主要依赖于统计推断方法,这些方法通过分析客户的金融指标,如偿债能力、收益质量、盈利能力等,建立数学模型进行信用评级和偿债能力评估。然而,这些方法通常受限于特定假设和模型结构,难以适应不同类型的数据或灵活处理数据变化。此外,它们在处理缺失值和异常值时需要复杂的预处理步骤,可能会影响评估结果的准确性。
2、深度学习在数据分析领域的应用,随着计算资源的提升和深度学习算法的发展,深度学习在自然语言处理、计算机视觉等领域取得了巨大成功。在大数据分析领域,深度学习也被应用于推荐系统、自动驾驶、医疗诊断等多种实际任务中。这表明深度学习具有强大的数据分析和推理能力,能够辅助银行对公贷款风险评估,提升放贷质量。
3、图卷积网络(gcn)在图数据处理中的应用,gcn是深度学习中用于处理图数据的一种强大工具。它通过建立图结构,将实体定义为图的结点,边表示结点间的关系,学习将结点特征与相邻结点特征相结合的函数映射,提取图的结构信息。gcn成功地将卷积操作从传统数据推广到图数据,但gcn在捕捉长距离依赖关系和全局时间信息方面存在局限。
4、循环神经网络(rnn)在时间序列数据中的应用,rnn是专门用于处理具有时间顺序或逻辑顺序数据的神经网络结构,设计目的是捕捉序列中的时序依赖关系。然而,rnn在处理长序列数据时可能会遇到梯度消失或爆炸的问题,难以捕捉长期依赖关系。
5、trans
6、现有技术在银行对公贷款风险评估中存在以下局限性:传统统计方法无法灵活适应数据变化,且对异常值敏感。gcn在捕捉长距离依赖和全局时间信息方面受限。rnn在处理长序列数据时存在梯度问题,难以捕捉长期依赖。尽管transformer模型在时间序列预测中表现出色,但在银行对公贷款风险评估领域缺乏应用。
7、综上所述,现有技术在银行对公贷款风险评估领域尚未充分利用深度学习的优势,特别是在捕捉时空信息和处理长序列数据方面。本专利技术旨在通过结合gcn和transformer模型的优势,解决现有技术的局限性,提供一种更准确、高效的风险评估方法。
技术实现思路
1、为解决现有技术的不足,本专利技术不仅在技术实现上展现了创新,更在应用层面上实现了重大突破。依托于已有的客户真实数据,本方法能够深度挖掘数据内在的空间和时间信息,从而精确评估客户的信用风险等级。在银行对公贷款领域,本专利技术的应用极大地辅助了放贷审核人员,提供了量化的客户信息分析,减少了主观判断的不确定性,有效提升了放贷决策的质量和精准度。另外,不仅优化了数据处理流程,提高了风险评估的科学性和准确性,也为银行贷款业务的稳健发展提供了强有力的技术支撑。
2、为实现以上目的,本专利技术所采用的技术方案包括:
3、一种基于多数据分析推理的银行对公贷款风险评估方法,其特征在于,包括:
4、s1、采集银行历史对公贷款客户的放贷数据,并对所述放贷数据进行预处理获得第一特征矩阵;
5、具体的,采集银行发放过贷款的对公客户在放贷前和放贷期间的放贷数据进行预处理,放贷数据包括六大类:偿债能力(流动比率、速动比率、产权比率、经营活动产生的现金流量净额/负债)、收益质量(经营活动净收益/利润总额、价值变动净收益/利润总额、营业外收支净额/利润总额)、盈利能力(销售毛利率、销售净利率、总资产净利率)、营运能力(存货周转率、流动资产周转率、固定资产周转率、总资产周转率)、资本结构(资产负债率、流动资产/总资产,非流动资产/总资产、流动负债/负债合计、非流动负债/负债合计)、行业风险状况。
6、针对前五类数值数据,采取归一化的方法将每一类数据中的各个数据指标处理成[0,1]的数据,加速收敛速度,同时减少模型对输入数据中微小变化的敏感性,提高模型的泛化能力;针对行业风险状况这类离散数据,使用one-hot编码将离散特征的取值扩展到欧式空间,便于输入到gcn模型,例如以月份的维度,最后将预处理之后的六类数据生成6个特征向量,拼接得到第一特征矩阵。
7、s2、将所述第一特征矩阵作为gcn模型的输入,获得包含空间信息的第二特征矩阵;
8、具体的,将预处理之后得到的第一特征矩阵作为gcn模型的输入,获取客户不同指标间的空间关系,输出得到包含空间信息的第二特征矩阵。
9、s3、将处理后的所述第二特征矩阵作为transformer模型的输入,获得时空特征向量;
10、具体的,将不同月份gcn模型输出的第二特征矩阵作为transformer模型的输入,获取客户在不同月份之间的风险变化情况,输出得到包含丰富空间信息和时间信息的时空特征向量;
11、s4、使用损失函数约束训练gcn模型和transformer模型结合的风险预测模型,使得风险预测模型生成的标签无限接近真实风险等级标签;
12、具体的,获取得到的时空特征向量推理出一个客户风险等级,其中使用存量客户实际的风险值作为标签优化模型,得到一个尽可能推理真实客户风险等级的风险预测模型;
13、s5、利用训练获得的所述风险预测模型对新增客户的放贷数据评估风险等级。
14、具体的,获取申请贷款的对公客户近期数据,收集频率为一月一次,分别采取归一化和one-hot编码处理数值数据和离散数据,将处理之后的数据输入到训练完成的风险预测模型进行分析推理,输出对公客户的风险等级,辅助银行端的审核人员对于客户进行信用评级,评估其偿债能力,提升放贷质量,减少坏账风险。
15、进一步地,所述s1对所述放贷数据进行预处理获得第一特征矩阵,包括,归一化处理所述放贷数据中的数值数据以及使用one-hot编码处理离散数据。
16、进一步地,所述s2将所述第一特征矩阵作为gcn模型的输入,获得包含空间信息的第二特征矩阵,包括:gcn模型通过图卷积和激活函数挖掘空间关系,具体表示公式为:
17、xl=σ(wxl-1a+xl-1)
18、其中w为卷积的参数,xl-1为第一特征矩阵,a为预先定义的邻接矩阵,xl为输出的第二特征矩阵,σ(·)为激活函数。
19、进一步地,所述s2将所述第一特征矩阵作为gcn模型的输入,获得包含空间信息的第二特征矩阵,还包括:将所述第二特征矩阵平铺展开,拼接得到图特征,以便于输入transformer模型进行训练。
20、进一步地,所述s3将处理后的所述第二特征矩阵作为transformer本文档来自技高网...
【技术保护点】
1.一种基于多数据分析推理的银行对公贷款风险评估方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述S1对所述放贷数据进行预处理获得第一特征矩阵,包括,归一化处理所述放贷数据中的数值数据以及使用One-Hot编码处理离散数据。
3.根据权利要求2所述的方法,其特征在于,所述S2将所述第一特征矩阵作为GCN模型的输入,获得包含空间信息的第二特征矩阵,包括:GCN模型通过图卷积和激活函数挖掘空间关系,具体表示公式为:
4.根据权利要求3所述的方法,其特征在于,所述S2将所述第一特征矩阵作为GCN模型的输入,获得包含空间信息的第二特征矩阵,还包括:将所述第二特征矩阵平铺展开,拼接得到图特征,以便于输入Transformer模型进行训练。
5.根据权利要求1-4所述的任一方法,其特征在于,所述S3将处理后的所述第二特征矩阵作为Transformer模型的输入,获得时空特征向量,包括:将不同时刻的所述图特征按照时间顺序拼接成位置向量,进行位置编码,具体的表示公式为:
6.根据权利要求1所述的方法,其特征在于,所
7.一种基于多数据分析推理的银行对公贷款风险评估系统,其特征在于,包括:
8.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。
9.一种电子设备,其特征在于,包括处理器和存储器;
10.一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。
...【技术特征摘要】
1.一种基于多数据分析推理的银行对公贷款风险评估方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述s1对所述放贷数据进行预处理获得第一特征矩阵,包括,归一化处理所述放贷数据中的数值数据以及使用one-hot编码处理离散数据。
3.根据权利要求2所述的方法,其特征在于,所述s2将所述第一特征矩阵作为gcn模型的输入,获得包含空间信息的第二特征矩阵,包括:gcn模型通过图卷积和激活函数挖掘空间关系,具体表示公式为:
4.根据权利要求3所述的方法,其特征在于,所述s2将所述第一特征矩阵作为gcn模型的输入,获得包含空间信息的第二特征矩阵,还包括:将所述第二特征矩阵平铺展开,拼接得到图特征,以便于输入transformer模型进行训练。
5.根据权利要求1-4所述的任一方法,其特征在于,所述s3将处理后的所述第二特征...
【专利技术属性】
技术研发人员:万磊,
申请(专利权)人:中信银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。