一种基于地点和语义的知识图谱反馈方法技术

技术编号:37713595 阅读:17 留言:0更新日期:2023-06-02 00:08
本发明专利技术涉及数据分析技术领域,具体涉及一种基于地点和语义的知识图谱反馈方法,包括:步骤S1:针对新生成的所述突发事件,获取所述突发事件的当前发生地;步骤S2:依照所述当前发生地和历史事件的历史地点进行聚类以得到多个聚类事件;步骤S3:对所述聚类事件进行匹配以得到匹配事件;步骤S4:对所述匹配事件进行分类,根据分类结果自所述知识图谱中提取所述处置方法。有益效果在于:通过对突发事件依次进行地点聚类、语义匹配和分类,从而获得对应于本次突发事件的分类结果,其对应于知识图谱中的标签;随后,依照标签直接从知识图谱中查找到相应的处置方法,避免了现有技术中依赖多判断分支进行判断相对繁琐,且难以维护的问题。题。题。

【技术实现步骤摘要】
一种基于地点和语义的知识图谱反馈方法


[0001]本专利技术涉及数据分析
,具体涉及一种基于地点和语义的知识图谱反馈方法。

技术介绍

[0002]知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。在应用层面而言,主要是把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,摆脱原始的人工输入,在智能搜索、文本分析、机器阅读理解、异常监控、风险控制等场景中有着广泛的应用。
[0003]现有技术中,已存在有较多的通过应用知识图谱来进行业务运作的方案。比如,在电力行业,通常会将应急预案体系分解至一个分类表下,在该分类表下建立相应的应急处置流程、方法等;当出现相应的故障事件时,则可依照相应的分类方法、判断分支等自动提出相应的应急处置流程。
[0004]但是,在实施过程中,专利技术人发现,现有技术中的知识图谱处置方案,通常是配置为固定的分类、判断逻辑,通过相应的树状判断分支来返回处理方法。这导致当知识图谱结构相对复杂、层级较多时处理速度较慢的问题,且依照逻辑分支进行判断也使得知识图谱进行维护的难度进一步增加。

技术实现思路

[0005]针对现有技术中存在的上述问题,现提供一种基于地点和语义的知识图谱反馈方法。
[0006]具体技术方案如下:
[0007]一种基于地点和语义的知识图谱反馈方法,针对多个突发事件预先构建有知识图谱,所述知识图谱存储有对应于所述突发事件的处置方法;
[0008]所述知识图谱反馈方法包括:
[0009]步骤S1:针对新生成的所述突发事件,获取所述突发事件的当前发生地;
[0010]步骤S2:依照所述当前发生地和历史事件的历史地点进行聚类以得到多个聚类事件;
[0011]步骤S3:对所述聚类事件进行匹配以得到匹配事件;
[0012]步骤S4:对所述匹配事件进行分类,根据分类结果自所述知识图谱中提取所述处置方法。
[0013]另一方面,所述步骤S1包括:
[0014]步骤S11:自所述突发事件的输入文本中抽取地址实体;
[0015]步骤S12:获取所述地址实体的经纬度,将所述经纬度作为所述当前发生地。另一
方面,所述步骤S11中,采用地址抽取模型获取所述地址实体;
[0016]所述地址抽取模型包括
[0017]双向编码模型,所述双向编码模型接收所述输入文本并根据所述输入文本生成第一语义向量;
[0018]条件随机场网络,所述条件随机场网络连接所述双向编码模型,所述条件随机场网络根据所述第一语义向量生成所述地址实体。
[0019]另一方面,所述步骤S2包括:
[0020]步骤S21:获取所述当前发生地和多个所述历史地点;
[0021]步骤S22:采用聚类模型对所述当前发生地和所述历史地点进行聚类;
[0022]步骤S23:依照聚类结果获取对应的所述历史事件,将所述历史事件和所述突发事件作为所述聚类事件输出。
[0023]另一方面,于执行所述步骤S22之前,还包括用于训练所述聚类模型的训练过程,所述训练过程包括:
[0024]步骤A1:采集对应于所述历史地点的训练数据;
[0025]步骤A2:采用所述聚类模型对所述训练数据进行聚类生成训练簇以及对应于所述训练簇的簇质心;
[0026]步骤A3:依照所述训练簇和所述簇质心调整所述聚类模型的K值。
[0027]另一方面,于执行所述步骤S2之后,还包括模型重训练过程,所述模型重训练过程包括:
[0028]步骤B1:将当前的所述突发事件添加至所述历史事件中;
[0029]步骤B2:分别获取每个所述历史事件的发生时间,将所述发生时间和预先设定的日期范围进行比较,以筛选出近期发生的所述历史事件;
[0030]步骤B3:采用筛选后的所述历史事件对所述聚类模型重新训练。
[0031]另一方面,所述步骤S3中,采用语义匹配模型对所述聚类事件进行匹配以得到所述匹配事件;
[0032]所述语义匹配模型包括:
[0033]第一输入层,所述第一输入层依次接收所述聚类事件;
[0034]对抗扰动层,所述对抗扰动层连接所述第一输入层,所述对抗扰动层根据所述聚类事件生成第二语义向量;
[0035]第一分类层,所述第一分类层连接所述对抗扰动层,所述第一分类层根据所述第二语义向量输出匹配结果,所述匹配结果用于自所述聚类事件中标记所述匹配事件。
[0036]另一方面,所述步骤S4包括:
[0037]步骤S41:对所述匹配事件进行语义识别,以获得所述分类结果;
[0038]步骤S42:依照所述分类结果对预先构建在所述知识图谱中的标签进行查找,以获得匹配标签;
[0039]步骤S43:输出所述匹配标签下的所述处置方法。
[0040]另一方面,所述步骤S41中,采用语义分类模型获得所述分类结果;
[0041]所述语义分类模型包括:
[0042]第二输入层,所述第二输入层接收所述匹配事件;
[0043]标记嵌入层,所述标记嵌入层连接所述第二输入层,所述标记嵌入层将所述匹配事件映射至第三语义向量中;
[0044]第二分类层,所述第二分类层连接所述标记嵌入层,所述第二分类层根据所述第三语义向量生成所述分类结果。
[0045]上述技术方案具有如下优点或有益效果:
[0046]针对现有技术中的知识图谱查找方法依赖判断分支处理效率较低、难以维护的问题,本方案中,通过对突发事件依次进行地点聚类、语义匹配和分类,从而获得对应于本次突发事件的分类结果,其对应于知识图谱中的标签;随后,依照标签直接从知识图谱中查找到相应的处置方法,避免了现有技术中依赖多判断分支进行判断相对繁琐,且难以维护的问题。
附图说明
[0047]参考所附附图,以更加充分的描述本专利技术的实施例。然而,所附附图仅用于说明和阐述,并不构成对本专利技术范围的限制。
[0048]图1为本专利技术实施例的整体示意图;
[0049]图2为本专利技术实施例中步骤S1子步骤示意图;
[0050]图3为本专利技术实施例中地址抽取模型示意图;
[0051]图4为本专利技术实施例中步骤S2子步骤示意图;
[0052]图5为本专利技术实施例中模型训练过程示意图;
[0053]图6为本专利技术实施例中模型重训练过程示意图;
[0054]图7为本专利技术实施例中语义匹配模型示意图;
[0055]图8为本专利技术实施例中步骤S4子步骤示意图;
[0056]图9为本专利技术实施例中语义分类模型示意图。
具体实施方式
[0057]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于地点和语义的知识图谱反馈方法,其特征在于,针对多个突发事件预先构建有知识图谱,所述知识图谱存储有对应于所述突发事件的处置方法;所述知识图谱反馈方法包括:步骤S1:针对新生成的所述突发事件,获取所述突发事件的当前发生地;步骤S2:依照所述当前发生地和历史事件的历史地点进行聚类以得到多个聚类事件;步骤S3:对所述聚类事件进行匹配以得到匹配事件;步骤S4:对所述匹配事件进行分类,根据分类结果自所述知识图谱中提取所述处置方法。2.根据权利要求1所述的知识图谱反馈方法,其特征在于,所述步骤S1包括:步骤S11:自所述突发事件的输入文本中抽取地址实体;步骤S12:获取所述地址实体的经纬度,将所述经纬度作为所述当前发生地。3.根据权利要求2所述的知识图谱反馈方法,其特征在于,所述步骤S11中,采用地址抽取模型获取所述地址实体;所述地址抽取模型包括双向编码模型,所述双向编码模型接收所述输入文本并根据所述输入文本生成第一语义向量;条件随机场网络,所述条件随机场网络连接所述双向编码模型,所述条件随机场网络根据所述第一语义向量生成所述地址实体。4.根据权利要求1所述的知识图谱反馈方法,其特征在于,所述步骤S2包括:步骤S21:获取所述当前发生地和多个所述历史地点;步骤S22:采用预先训练的聚类模型对所述当前发生地和所述历史地点进行聚类;步骤S23:依照聚类结果获取对应的所述历史事件,将所述历史事件和所述突发事件作为所述聚类事件输出。5.根据权利要求4所述的知识图谱反馈方法,其特征在于,于执行所述步骤S22之前,还包括用于训练所述聚类模型的训练过程,所述训练过程包括:步骤A1:采集对应于所述历史地点的训练数据;步骤A2:采用所述聚类模型对所述训练数据进行聚类生成训练簇以及对应于所述训练簇的簇质心;...

【专利技术属性】
技术研发人员:程栋吴颖健谭锐潘希尧吴飞王晔
申请(专利权)人:上海市大数据股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1