System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于法人知识图谱的企业风险识别方法及装置。
技术介绍
1、在我国供给侧改革不断深化、媒体信息传播日益多元化、监管力度不断加强的大背景下,企业风险管控的需求愈发凸显,传统的企业风险管控主要依赖于静态规则与人工经验对企业进行风险识别,从而对识别出的风险企业进行监管,但企业风险是一个动态概念,通常涉及多个领域和因素的交叉影响,市场、政策和竞争环境的不断变化使得企业面临的风险数据量大且多样化,传统的企业风险识别的方法难以适应快速变化和复杂多样的风险环境,降低企业风险识别的准确性。
技术实现思路
1、本专利技术所要解决的技术问题是:本专利技术提供一种基于法人知识图谱的企业风险识别方法及装置,提高企业风险识别的准确性。
2、为了解决上述技术问题,本专利技术采用的技术方案为:
3、第一方面,本专利技术提供一种基于法人知识图谱的企业风险识别方法,包括:
4、获取企业法人数据,将所述企业法人数据输入实体识别模型进行实体识别,输出识别出的实体,基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别,输出对应的实体关系,基于所述实体和所述实体关系生成对应的三元组,基于所述三元组构建法人知识图谱;
5、基于所述法人知识图谱识别与待识别企业关联的所有关联实体,通过企业自身风险值计算模型计算所述待识别企业的第一自身风险值和每一个所述关联实体的第二自身风险值;
6、将所述第一自身风险值与所述第二自身风险值输
7、
8、y1=var*tanh(w1*x1+w2*x2+……+wn*xn)
9、y2=max(wi*x1,w2*x2,……,wn*xn)
10、其中,y表示最终风险值,var表示第一自身风险值,wn表示第n个关联实体的第二自身风险值,xn表示第n个关联实体与待识别企业的关系权重。
11、本专利技术的有益效果在于:通过实体识别模型和关系识别模型对获取的企业法人数据进行实体和实体关系识别,从而生成三元组构建法人知识图谱,即将复杂多样的企业法人数据用简单清晰的三元组进行表示,实现企业间复杂多样关系的快速响应和推理,从而通过法人知识图谱识别与待识别企业关联的所有关联实体,分别计算各自的自身风险值并通过风险传递函数获得待识别企业的最终风险值,从而识别出风险企业,提高企业风险识别的准确性。
12、可选地,所述将所述企业法人数据输入实体识别模型进行实体识别包括:
13、获取历史企业法人数据,按照预设比例将所述历史企业法人数据随机划分为训练集和测试集;
14、基于各个领域词典通过bio模式对所述训练集进行实体标注,得到标注后的训练数据,将所述训练数据输入采用bert+bilstm+crf模型构建的实体识别模型进行训练,得到训练后的实体识别模型;
15、将所述测试集输入训练后的实体识别模型进行实体识别测试,得到测试结果达到预期效果的实体识别模型,将所述企业法人数据输入所述实体识别模型进行实体识别。
16、根据上述描述可知,将各个领域的实体均考虑在内,以各个领域词典对训练集进行实体标注,提高实体标注的准确性和全面性,采用bert+bilstm+crf模型构建的实体识别模型对标注后的训练数据进行训练,提高实体识别的准确性。
17、可选地,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别,输出对应的实体关系包括:
18、通过关系关键词模板识别出所述企业法人数据中的关系关键词,基于所述关系关键词通过语法匹配规则对所述实体进行关系匹配,输出对应的实体关系。
19、根据上述描述可知,以关系关键词识别模板识别关系关键词再通过语法匹配规则对实体进行关系匹配的方式得到对应的实体关系,提高得到实体关系的效率和灵活性。
20、可选地,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别包括:
21、获取历史企业关系数据,按照预设比例将所述历史企业关系数据随机划分为训练集和测试集;
22、将所述训练数据输入采用att-cnn模型构建的关系识别模型进行训练,得到训练后的关系识别模型;
23、将所述测试集输入训练后的关系识别模型进行关系识别测试,得到测试结果达到预期效果的关系识别模型,基于所述实体将所述企业法人数据输入所述关系识别模型进行实体间的关系识别。
24、根据上述描述可知,以历史企业关系数据为训练数据,保证输入att-cnn模型构建的关系识别模型的数据客观性,使得关系识别模型能正确学习关系特征,提高关系识别的准确性。
25、可选地,所述基于所述实体和所述实体关系生成对应的三元组包括:
26、根据同义词词典对所述实体进行同义词扩展,得到扩展后的实体;
27、根据已知关系衍生规则对所述实体关系进行衍生,得到衍生后的实体关系;
28、基于扩展后的实体和衍生后的实体关系对三元组进行扩展,得到扩展后的三元组。
29、根据上述描述可知,以同义词词典对实体进行同义词扩展且通过已知关系衍生规则对实体关系进行衍生,从而实现对三元组的扩展,提高三元组的全面性进而提高基于三元组构建的法人知识图谱的完整性。
30、可选地,所述基于所述三元组构建法人知识图谱包括:
31、获取所述法人知识图谱中每一个实体对应的属性,计算所述属性的属性相似度,当所述属性相似度达到属性相似阈值时,将对应的实体合并为同一实体对所述法人知识图谱进行更新,得到更新后的法人知识图谱;
32、根据潜在关系推理规则对所述法人知识图谱中的实体和实体关系进行潜在关系推理,得到新的三元组,将新的三元组添加至所述法人知识图谱中,得到新的法人知识图谱。
33、根据上述描述可知,将实体属性相似度达到相似阈值的实体合并为同一实体,实现对法人知识图谱的更新,且根据潜在关系推理规则对实体与实体关系进行潜在关系推理,将所有可能的潜在隐含关系考虑在内,提高法人知识图谱的全面性。
34、可选地,所述通过企业自身风险值计算模型计算所述待识别企业的第一自身风险值和每一个所述关联实体的第二自身风险值之前包括:
35、基于企业自身风险指标构建企业抗风险能力影响因素集和企业抗风险能力影响因素评价集:
36、u={u1,u2,u3,...,un}
37、v={v1,v2,v3,...,,vm}
38、其中,u表示企业抗风险能力影响因素集,ui,i=1…n,表示企业抗风险能力影响因素集中的第i个子因素,v表示企业抗风险能力影响因素评价集,vj,j=1…m,表示企业抗风险能力影响因素评价集中的第j级子因素;
39、基于所述企本文档来自技高网...
【技术保护点】
1.一种基于法人知识图谱的企业风险识别方法,其特征在于,包括:
2.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述将所述企业法人数据输入实体识别模型进行实体识别包括:
3.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别,输出对应的实体关系包括:
4.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别包括:
5.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体和所述实体关系生成对应的三元组包括:
6.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述三元组构建法人知识图谱包括:
7.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述通过企业自身风险值计算模型计算所述待识别企业的第一自身风险值和每一个所述关联实体
8.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述法人知识图谱识别与待识别企业关联的所有关联实体包括:
9.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述获取企业法人数据包括:
10.一种基于法人知识图谱的企业风险识别装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9中任一项所述的方法。
...【技术特征摘要】
1.一种基于法人知识图谱的企业风险识别方法,其特征在于,包括:
2.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述将所述企业法人数据输入实体识别模型进行实体识别包括:
3.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别,输出对应的实体关系包括:
4.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体将所述企业法人数据输入关系识别模型进行实体间的关系识别包括:
5.如权利要求1所述的一种基于法人知识图谱的企业风险识别方法,其特征在于,所述基于所述实体和所述实体关系生成对应的三元组包括:
6.如权利要求1所述的一种基于法人知识图...
【专利技术属性】
技术研发人员:李喆,涂平,王宇奇,郑浩翔,许玉杯,邹建红,黄炜,李元,
申请(专利权)人:福建大数据一级开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。