基于人工智能的企业风险判断方法及相关设备技术

技术编号:34514252 阅读:15 留言:0更新日期:2022-08-13 21:01
本申请提出一种基于人工智能的企业风险判断方法、装置、电子设备及存储介质,基于人工智能的企业风险判断方法包括:从业务数据库中查询企业的历史登记信息,依据开源信息获取企业的历史公示信息;对比企业的历史登记信息和历史公示信息以构建企业的风险特征向量;对企业进行标注以获取每一个风险特征向量的标签;基于风险特征向量和标签计算优选维度因子,将风险特征向量的维度降至优选维度因子以获取优选风险特征向量;基于优选风险特征向量和企业标签训练企业风险判断网络;采集待判断企业的优选风险特征向量输入企业风险判断网络得到风险判断结果。本申请能够增强不同风险类型的企业之间特征向量的差异,从而提高企业风险判断的准确性。判断的准确性。判断的准确性。

【技术实现步骤摘要】
基于人工智能的企业风险判断方法及相关设备


[0001]本申请涉及人工智能
,尤其涉及一种基于人工智能的企业风险判断方法、装置、电子设备及存储介质。

技术介绍

[0002]企业每年都会进行一些基本信息的变更,如股东信息、股权变更、行政许可资质以及受到的对应的行政处罚,这些变更情况全都记录在工商系统的数据库中。理论上,企业年报或发布的即时公示文件应包含有所有基本信息的变更内容,以确保大众和投资者可以获取企业即时的真实经营状况。然而,部分企业并不能即时地对企业信息变更做出公示,这就影响了大众和投资者对企业真实经营状况的判断,进而增加了企业的投资风险。
[0003]通常,通过爬虫技术获取企业的开源信息,获取所有开源信息中的关键词和关键词的频率得到企业的风险判断结果,然而,这种方式不能对众多的开源信息进行筛选,计算较大且企业风险判断的准确性较低。

技术实现思路

[0004]鉴于以上内容,有必要提出一种基于人工智能的企业风险判断方法及相关设备,以解决如何提高企业风险判断的准确性这一技术问题,其中,相关设备包括基于人工智能的企业风险判断装置、电子设备及存储介质。
[0005]本申请基于人工智能的企业风险判断方法,所述方法包括:
[0006]依据企业ID从业务数据库中查询企业的历史登记信息,并依据所述企业的开源信息获取所述企业的历史公示信息,所述历史登记信息和所述历史公示信息均包括历史时间内每年所述企业的所有基本信息;
[0007]对比所有企业的所述历史登记信息和所述历史公示信息以构建所有企业的风险特征向量;
[0008]对所述企业进行标注以获取每一个风险特征向量的标签;
[0009]基于所述风险特征向量和所述标签计算优选维度因子以获取优选降维矩阵,并基于所述优选降维矩阵对所有风险特征向量进行降维处理以获取优选风险特征向量以及所述优选风险特征向量的标签;
[0010]基于所述优选风险特征向量和所述优选风险特征向量的标签训练分类网络以获取企业风险判断网络;
[0011]采集待判断企业的优选风险特征向量以作为所述企业风险判断网络的输入,得到所述待判断企业的风险判断结果。
[0012]在一些实施例中,所述依据企业ID从业务数据库中查询企业的历史登记信息,并依据所述企业的开源信息获取所述企业的历史公示信息,包括:
[0013]储存所有企业每年基本信息的登记内容以构建业务数据库,所述基本信息包括与基本信息相关的所有基本字符段;
[0014]储存所有企业每年基本信息的公示内容以构建开源数据库;
[0015]依据企业ID搜索所述业务数据库获取所述企业的历史登记信息,所述历史登记信息包括历史时间内每年所述企业基本信息的登记内容;
[0016]依据企业ID搜索所述开源数据库获取所述企业的历史公示信息,所述历史公示信息包括历史时间内每年所述企业基本信息的公示内容。
[0017]在一些实施例中,所述对比所有企业的所述历史登记信息和所述历史公示信息以构建所有企业的风险特征向量包括:
[0018]将所述基本信息的所有基本字符段中的任意一个字符段作为目标字符段;
[0019]基于目标企业的历史登记信息和历史公示信息获取所述目标字符段的属性值,所述目标企业为所有企业中的任意一个;
[0020]遍历所述基本信息的所有基本字符段得到每一个基本字符段的属性值;
[0021]将所有基本字符段的属性值按照固定顺序进行排列得到所述目标企业的风险特征向量;
[0022]遍历所有企业的历史登记信息和历史公示信息以获取每一个企业的风险特征向量。
[0023]在一些实施例中,所述基于目标企业的历史登记信息和历史公示信息获取所述目标字符段的属性值包括:
[0024]基于所述目标字符段搜索所述目标企业的历史登记信息以获取每一年所述目标字符段的登记内容;
[0025]基于所述目标字符段搜索所述目标企业的历史公示信息以获取每一年所述目标字符段的公示内容;
[0026]对比相同年份所述目标字符段的登记内容和公示内容以获取每一年的对比结果;
[0027]统计每一年的所述对比结果以获取所述目标字符段的属性值。
[0028]在一些实施例中,所述基于所述风险特征向量和所述标签计算优选维度因子以获取优选降维矩阵,并基于所述优选降维矩阵对所有风险特征向量进行降维处理以获取优选风险特征向量以及所述优选风险特征向量的标签,包括:
[0029]依据PCA算法对所有企业的风险特征向量进行处理以获取所有主成分向量以及所述主成分向量的特征值;
[0030]按照所述特征值从大到小的顺序将所述主成分向量沿列方向从上到下进行排列以获取主成分向量矩阵;
[0031]依据复杂度指标模型遍历所述主成分向量矩阵中的主成分向量以获取优选维度因子;
[0032]从所述主成分向量矩阵中从上到下选取一定数量的主成分向量以构成优选降维矩阵,所述一定数量与所述优选维度因子相同;
[0033]基于所述优选降维矩阵对所述风险特征向量进行降维处理以获取优选风险特征向量,并将所述风险特征向量的标签作为所述优选风险特征向量的标签。
[0034]在一些实施例中,所述依据复杂度指标模型遍历所述主成分向量矩阵中的主成分向量以获取优选维度因子包括:
[0035]A1,从所述主成分向量矩阵中从上到下选取n个主成分向量以构成第n降维矩阵;
[0036]A2,基于所述第n降维矩阵对所述风险特征向量进行降维处理以获取n维风险特征向量;
[0037]A3,将所述风险特征向量的标签复制给维度后的n维风险特征向量,得到n维风险特征向量的标签,所述标签为0或1;
[0038]A4,依据复杂度指标模型计算所述n维风险特征向量的复杂度指标;
[0039]A5,重复执行步骤A1到步骤A4得到降维后所有维度风险特征向量的复杂度指标,将复杂度指标最小值对应的维度作为优选维度因子。
[0040]在一些实施例中,所述复杂度指标模型满足关系式:
[0041][0042]其中,分别为第i个n维风险特征向量和第j个n维风险特征向量;M为所有n维风险特征向量的数量;为第i个n维风险特征向量和第j个n维风险特征向量的L2距离;分别为第i个n维风险特征向量和第j个n维风险特征向量的标签;α
n
为所述n维风险特征向量的复杂度指标,为自定义函数,所述自定义函数满足关系式:
[0043][0044]本申请实施例还提供一种基于人工智能的企业风险判断装置,所述装置包括:
[0045]获取单元,用于依据企业ID从业务数据库中查询企业的历史登记信息,并依据所述企业的开源信息获取所述企业的历史公示信息,所述历史登记信息和所述历史公示信息均包括历史时间内每年所述企业的所有基本信息;
[0046]对比单元,用于对比所有企业的所述历史登记信息和所述历史公示信息以构建所有企业的风险特征向量;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的企业风险判断方法,其特征在于,所述方法包括:依据企业ID从业务数据库中查询企业的历史登记信息,并依据所述企业的开源信息获取所述企业的历史公示信息,所述历史登记信息和所述历史公示信息均包括历史时间内每年所述企业的所有基本信息;对比所有企业的所述历史登记信息和所述历史公示信息以构建所有企业的风险特征向量;对所述企业进行标注以获取每一个风险特征向量的标签;基于所述风险特征向量和所述标签计算优选维度因子以获取优选降维矩阵,并基于所述优选降维矩阵对所有风险特征向量进行降维处理以获取优选风险特征向量以及所述优选风险特征向量的标签;基于所述优选风险特征向量和所述优选风险特征向量的标签训练分类网络以获取企业风险判断网络;采集待判断企业的优选风险特征向量以作为所述企业风险判断网络的输入,得到所述待判断企业的风险判断结果。2.如权利要求1所述的基于人工智能的企业风险判断方法,其特征在于,所述依据企业ID从业务数据库中查询企业的历史登记信息,并依据所述企业的开源信息获取所述企业的历史公示信息,包括:储存所有企业每年基本信息的登记内容以构建业务数据库,所述基本信息包括与基本信息相关的所有基本字符段;储存所有企业每年基本信息的公示内容以构建开源数据库;依据企业ID搜索所述业务数据库获取所述企业的历史登记信息,所述历史登记信息包括历史时间内每年所述企业基本信息的登记内容;依据企业ID搜索所述开源数据库获取所述企业的历史公示信息,所述历史公示信息包括历史时间内每年所述企业基本信息的公示内容。3.如权利要求1所述的基于人工智能的企业风险判断方法,其特征在于,所述对比所有企业的所述历史登记信息和所述历史公示信息以构建所有企业的风险特征向量包括:将所述基本信息的所有基本字符段中的任意一个字符段作为目标字符段;基于目标企业的历史登记信息和历史公示信息获取所述目标字符段的属性值,所述目标企业为所有企业中的任意一个;遍历所述基本信息的所有基本字符段得到每一个基本字符段的属性值;将所有基本字符段的属性值按照固定顺序进行排列得到所述目标企业的风险特征向量;遍历所有企业的历史登记信息和历史公示信息以获取每一个企业的风险特征向量。4.如权利要求3所述的基于人工智能的企业风险判断方法,其特征在于,所述基于目标企业的历史登记信息和历史公示信息获取所述目标字符段的属性值包括:基于所述目标字符段搜索所述目标企业的历史登记信息以获取每一年所述目标字符段的登记内容;基于所述目标字符段搜索所述目标企业的历史公示信息以获取每一年所述目标字符段的公示内容;
对比相同年份所述目标字符段的登记内容和公示内容以获取每一年的对比结果;统计每一年的所述对比结果以获取所述目标字符段的属性值。5.如权利要求4所述的基于人工智能的企业风险判断方法,其特征在于,所述基于所述风险特征向量和所述标签计算优选维度因子以获取优选降维矩阵,并基于所述优选降维矩阵对所有风险特征向量进行降维处理以获取优选风险特征向量以及所述优选风险特征向量的标签,包括:依据PCA算法对所有企业的风险特征向量组成的矩阵进行处理以获取所有主成分向量以及所述主成分向量的特征值;...

【专利技术属性】
技术研发人员:陈芷昕
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1