风险预测方法和装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号:33962500 阅读:13 留言:0更新日期:2022-06-30 00:48
本公开提供了一种风险预测方法和装置,涉及知识图谱、机器学习等技术领域。具体实现方案为:确定待测对象的源生风险概率;构建待测对象与不同关联对象之间的关系图谱;确定关系图谱中任意两个直接关联对象之间的初级传导概率;基于初级传导概率和关系图谱,确定待测对象的多级传导概率;基于源生风险概率和待测对象的多级传导概率,确定待测对象的目标风险概率。该实施方式提高了风险预测的精确度。该实施方式提高了风险预测的精确度。该实施方式提高了风险预测的精确度。

【技术实现步骤摘要】
风险预测方法和装置、电子设备、计算机可读存储介质


[0001]本公开涉及计算机
,具体涉及知识图谱、机器学习等
,尤其涉及一种风险预测方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]目前金融行业对企业自身风险预测已经有了比较完善的建模方案,但是对于传导性的风险预测依然没有很好的解决方案。一方面是企业之间的关联关系较为复杂,一个企业往往会与多家企业存在关联关系;另一方面企业的关联关系随着时间会发生变化,并且风险传导具有一定的滞后性,对建模带来了挑战。
[0003]目前已有的企业风险传导建模方案主要是对一个阶段的传导进行预测,但是在现实场景中,一方面,企业之间往往存在链路关系,并且可能存在跨级传导的问题。另一方面,企业风险由自身风险和传导风险两部分组成,但是这两个部分无法很好地进行分离,因此在传导边标签的时候,往往是错误的。

技术实现思路

[0004]本公开提供了一种风险预测方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。
[0005]根据第一方面,提供了一种风险预测方法,该方法包括:确定待测对象的源生风险概率;构建待测对象与不同关联对象之间的关系图谱;确定关系图谱中任意两个直接关联对象之间的初级传导概率;基于初级传导概率和关系图谱,确定待测对象的多级传导概率;基于源生风险概率和待测对象的多级传导概率,确定待测对象的目标风险概率。
[0006]根据第二方面,又提供了一种风险预测装置,该装置包括:源生确定单元,被配置成确定待测对象的源生风险概率;图谱构建单元,被配置成构建待测对象与不同关联对象之间的关系图谱;初始确定单元,被配置成确定关联图谱中任意两个直接关联对象之间的初级传导概率;多级确定单元,被配置成基于初级传导概率和关系图谱,确定待测对象的多级传导概率;概率确定单元,被配置成基于源生风险概率和待测对象的多级传导概率,确定待测对象的目标风险概率。
[0007]根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。
[0008]根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。
[0009]根据第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面任一实现方式描述的方法。
[0010]本公开的实施例提供的风险预测方法和装置,首先,确定待测对象的源生风险概
率;其次,构建待测对象与不同关联对象之间的关系图谱;再次,确定关系图谱中任意两个直接关联对象之间的初级传导概率;从次,基于初级传导概率和关系图谱,确定待测对象的多级传导概率;最后,基于源生风险概率和待测对象的多级传导概率,确定待测对象的目标风险概率。本公开首先预测待测对象的源生风险概率,通过利用多个对象之间的关联关系,预测待测对象与各个对象发生多级风险传导的多级传导概率,最后将源生风险概率与多级传导概率结合,预测待测对象未来发生风险的概率,提高了风险预测的准确度。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开风险预测方法的一个实施例的流程图;
[0014]图2是本公开实施例中确定待测对象的多级传导概率的结构示意图;
[0015]图3是本公开训练传导概率模型方法的一个实施例的流程图;
[0016]图4是本公开实施例中采用滑动窗口构建传导样本对的一种结构示意图;
[0017]图5是根据本公开风险预测装置的一个实施例的结构示意图;
[0018]图6是用来实现本公开实施例的风险预测方法的电子设备的框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]针对现有企业之间关联关系较为复杂,并且企业自身风险与传导风险较难分离的问题,本公开提出了一种风险预测方法,以通过技术手段提升预测企业发生风险的准确性。图1示出了根据本公开风险预测方法的一个实施例的流程100,上述风险预测方法包括以下步骤:
[0021]步骤101,确定待测对象的源生风险概率。
[0022]本实施例中,源生风险概率是指因对象自身因素(例如经营不善)发生风险的可能性的概率,该源生风险概率基于对象的目标特征计算得到,其中目标特征是表现对象的本质属性的特征,针对不同种类的对象,对象的目标特征表现形式不同,例如,当对象为企业时,对象的目标特征包括:静态特征、动态特征,其中,静态特征用于表征企业的基本属性,例如企业的注册时间,注册资本等,并且静态特征也是不会随时间的变化而发生变化。动态特征指企业随时间变化的特征,例如,在对象为企业时,动态特征可以是企业的雇员个数,企业的规模等。
[0023]由于静态特征不会随时间变换,只需在包括所有的企业的基本信息表中,按照企业ID对整个数据表格进行去重,既可以得到静态信息表,将静态信息表输入预先建立的特征工程,得到静态特征。
[0024]对企业的基本信息表中按照企业ID分组,每组为每家企业的所有历史更变记录,
根据更变时间对每组数据进行排序,获得有序的更变特征。对于各个更变特征,利用时序特征提取方法进行特征的抽取,得到动态特征,其中,时序特征提取方法例如可以包括计算斜率,方差,更变频次等。
[0025]可选地,对象的目标特征还可以包括:行为特征,行为特征为对象进行某些操作的特征,例如,在对象为企业时,行为特征为企业投资的公司的数目、金额、比例等。
[0026]可选地,可以基于待测对象的基本信息,确定待测对象的源生风险概率。其中,基本信息是对象参与生产活动而表现的信息,基本信息是用于表征待测对象的属性、特征以及社会关系的信息,例如,基本信息包括:待测对象的类型、数量以及待测对象与多个不同对象之间的关系等。
[0027]本实施例中,风险预测方法运行于其上的执行主体可以通过多种方式获取待测对象的基本信息,例如,执行主体可以通过有线连接方式或无线连接方式,从数据库服务器中获取存储于其中的基本信息。再例如,用户可以通过与终端通信,获取终端所收集的待测对象的基本信息。
[0028]本实施例中,上述基于待测对象的基本信息,确定待测对象的源生风险概本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险预测方法,所述方法包括:确定待测对象的源生风险概率;构建所述待测对象与不同关联对象之间的关系图谱;确定所述关系图谱中任意两个直接关联对象之间的初级传导概率;基于所述初级传导概率和所述关系图谱,确定所述待测对象的多级传导概率;基于所述源生风险概率和所述待测对象的多级传导概率,确定所述待测对象的目标风险概率。2.根据权利要求1所述的方法,其中,所述基于所述初级传导概率和所述关系图谱,确定所述待测对象的多级传导概率包括:基于所述关系图谱,检测与所述待测对象相关的风险对象是否有多个,所述风险对象为所述关系图谱中历史或当前发生风险的对象;响应于所述风险对象有多个,基于所述初级传导概率,计算所述风险对象的并联传导概率,所述并联传导概率用于表征所述风险对象与该风险对象的多个直接关联对象的初级传导概率的融合;基于所述并联传导概率、所述关系图谱和预设的多级传导规则,确定所述待测对象的多级传导概率。3.根据权利要求2所述的方法,其中,基于所述并联传导概率、所述关系图谱和预设的多级传导规则,确定所述待测对象的多级传导概率,包括:基于所述并联传导概率、所述关系图谱和预设的多级传导规则,检测所述待测对象是否会被多级传导;响应于所述待测对象会被多级传导,基于所述并联传导概率,计算所述待测对象的多级传导概率。4.根据权利要求3所述的方法,其中,所述基于所述并联传导概率、所述关系图谱和预设的多级传导规则,检测所述待测对象是否会被多级传导,包括:检测所述并联传导概率是否满足传导停止条件;响应于所述并联传导概率不满足传导停止条件,基于所述并联传导概率、所述关系图谱和预设的多级传导规则,检测所述待测对象是否会被多级传导。5.根据权利要求2所述的方法,其中,所述基于所述初级传导概率和所述关系图谱,确定所述待测对象的多级传导概率还包括:响应于所述并联传导概率满足传导停止条件,在所述风险对象与所述待测对象直接相关时,将所述并联传导概率作为所述待测对象的多级传导概率。6.根据权利要求1所述的方法,其中,所述确定关系图谱中任意两个直接关联对象之间的初级传导概率,包括:基于所述关系图谱,确定与所述待测对象相关的所有关联对象;基于与所述待测对象相关的所有关联对象,确定具有直接关联关系的传导关系对;基于所述关系图谱,确定所述传导关系对的传导边特征;将所述传导关系对、所述传导边特征输入预训练完成的传导概率模型,得到所述传导概率模型输出的直接关联对象之间的初级传导概率;所述传导概率模型用于表征传导关系
对、所述传导关系对的传导边特征两者与初级传导概率之间的对应关系。7.根据权利要求6所述的方法,其中,所述传导概率模型通过以下步骤训练得到:基于关系图谱,构建传导样本对;为各个传导样本对进行伪标签标注;基于所述关系图谱,对标签标注后的传导样本对的传导边进行特征处理,得到传导特征关联对,所述传导特征关联对包括:多个具有伪标签的传导样本对和对应各个传导样本对的传导边特征;基于所述传导特征关联对,对预先构建的传导概率网络进行训练,得到训练完成的传导概率模型。8.根据权利要求7所述的方法,其中,所述基于关系图谱,构建传导样本对,包括:基于所述关系图谱,采用滑动窗口构建所述传导样本对;所述为各个传导样本对进行伪标签标注,包括:基于所述滑动窗口,为各个传导样本对进行伪标签标注。9.根据权利要求8所述的方法,其中,所述滑动窗口包括:起始期和传导期;基于所述关系图谱,采用滑动窗口构建所述传导样本对,包括:筛选在所述起始期发生风险的样本作为起始节点;基于关系图谱,确定在所述传导期与所述起始节点相关的终止节点;将所述起始节点与所述终止节点作为传导样本对;基于所述滑动窗口,为各个传导样本对进行伪标签标注,包括:响应于所述终止节点在所述传导期发生风险,则为所述终止节点进行已传导风险的伪标签标注。10.根据权利要求7所述的方法,其中,所述基于所述传导特征关联对,对预先构建的传导概率网络进行训练包括:对所述传导特征关联对进行修正;基于修正后的传导特征关联对,对预先构建的传导概率网络进行训练。11.根据权利要求10所述的方法,其中,所述对所述传导特征关联对进行修正,包括:将所述传导特征关联对中的各个传导样本对的伪标签与预先得到的概率预测值进行对比,确定两者的差值;对所述差值进行异常值检测,并去除所述传导特征关联对中差值异常的传导样本对,得到修正后的传导特征关联对。12.根据权利要求11所述的方法,其中,通过以下方式获取所述概率预测值:将所述传导特征关联对中对应的一部分传导样本对作为训练集,将所述传导特征关联对中对应的除该部分传导样本对之外的传导样本对作为预测集,并采用所述训练集和所述预测集对二分类器进行训练以及预测,得到所述概率预测值。13.根据权利要求11所述的方法,其中,所述对所述传导特...

【专利技术属性】
技术研发人员:刘朦月张海滨赵鹏昊李曙鹏施恩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1