System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向军事数据的知识图谱自动构建及自适应扩展方法技术_技高网

面向军事数据的知识图谱自动构建及自适应扩展方法技术

技术编号:42379772 阅读:4 留言:0更新日期:2024-08-16 15:05
一种面向军事数据的知识图谱自动构建及自适应扩展方法,首先,建立实体信息抽取模型,构建领域词汇集模型、缩略词挖掘模型、多模态实体模型;然后,建立无监督关系抽取及有监督关系抽取模型,提取抽取到的实体信息之间的数据映射关系;随后,将军事数据实体信息和军事实体关系数据推送到事件识别模型和事件结构化模型,补充知识库;接着,调用实体对齐、属性对齐、数值融合接口,将军事数据整合为知识图谱;最后,建立知识图谱智能更新模型,识别出变化的实体并完成更新。本发明专利技术能够为军事作战场景下情报和知识的快速检索、知识的自动解析、知识抽取、知识的可信评估与验证提供支撑,为未来智能化人机协同作战指挥决策提供重要的基础技术。

【技术实现步骤摘要】

本专利技术涉及知识图谱,特别是一种面向军事数据的知识图谱自动构建及自适应扩展方法


技术介绍

1、知识图谱将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答、大数据分析与决策中显示出强大威力,已经成为互联网基于知识的智能服务的基础设施。知识图谱与大数据和深度学习一起,成为推动人工智能发展的核心驱动力之一。

2、知识图谱平台通过自动知识抽取技术,提取概念、实体和关系,组合成知识网络。知识图谱平台是综合利用数据清洗与解析、自然语言处理、机器学习、智能检索以及知识图谱等技术,拥有构建、存储、应用三大模块的综合性平台。

3、在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:

4、针对典型军事领域多源异构数据的知识提取准确度不高、分析挖掘效率低等问题,基于智能应用领域的知识生成、演化与评估技术,实现知识的自动抽取、识别和融合的研究较少,仍需要进一步探索,这也是本专利技术重点关注的内容。


技术实现思路

1、本专利技术所要解决的技术问题是针对现有技术的不足,提供一种有助于提高典型军事智能应用领域多源异构数据的知识提取准确度、分析挖掘效率、多源数据综合分析能力的知识图谱自动构建及自适应扩展方法。

2、本专利技术所要解决的技术问题是通过以下的技术方案来实现的。本专利技术是一种面向军事数据的知识图谱自动构建及自适应扩展方法,包括以下步骤:

3、(1)建立实体信息抽取模型,提取数据源中的领域概念信息;

4、(2)建立实体关系抽取模型,提取实体之间的数据映射关系;

5、(3)将非结构化军事实体数据推送到事件抽取模型,输出结构化实体事件知识;

6、(4)调用军事数据知识图谱融合接口,消解军事数据冲突,实现军事数据重组,构建军事数据知识图谱;

7、(5)将军事知识图谱数据推送到军事知识图谱推理接口,支撑军事知识图谱知识推理;

8、(6)建立知识图谱智能更新模型,识别出变化的实体并完成更新。

9、本专利技术所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(1)中的实体信息抽取模型包括领域词汇集模型,缩略词挖掘模型,多模态实体模型;

10、领域词汇集模型:支持输入军事文档,输出军事数据标签,用于提取已切分好的词汇,通过分词规则、组合规则、内部凝固度规则、左邻字熵与右邻字熵规则,将军事知识文本语料库转换为军事领域专业词汇,其中,

11、分词规则:以逗号句号等分割符来分割句子,将较多低频的实体词,添加本地的自定义词典;

12、组合规则:判断字序列在字典中或者n-gram列表中;

13、内部凝固度规则:计算待识别汉字同上下文为2的窗口内每个字符的内部凝固度,作为抽取词语中准备使用的一个重要的衡量特征;

14、左邻字熵与右邻字熵规则:利用左邻字熵来衡量左邻字集合的随机性,利用右邻字熵来衡量右邻字集合的随机性;

15、缩略词挖掘模型:支持利用数据驱动,在大量的数据的基础上训练出相应的模型,进行实体对应缩略词的自动预测,用于通过字符级别、词级别以及概念级别表示,增强军事数据的特征表达能力;

16、多模态实体模型:支持利用内网搜索引擎或者文件搜索引擎构建多模态知识图谱,用于实现语义理解问题,利用模态之间的互补性,获取每种模态潜在解释因素的监督信息。

17、本专利技术所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(2)中的实体关系抽取模型包括无监督关系抽取模型和有监督关系抽取模型;

18、无监督关系抽取模型:支持抽取共现关系和近义关系,用于实现从文档中抽取关系,通过共现关系和近义关系,输入文档,输出军事知识实体关系;

19、有监督关系抽取模型:支持基于模板匹配的关系抽取模型、基于深度序列标注模型的抽取器以及基于预训练模型的抽取器,用于实现从模板和句子中抽取关系,通过模板匹配关系抽取规则、基于深度序列标注抽取规则以及基于预训练抽取规则,输入模板和文本句子,输出军事知识实体关系。

20、本专利技术所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(3)中的事件抽取模型包括事件识别模型和事件结构化模型;

21、事件识别模型:基于规则的事件三元组,识别事件候选过滤和消歧,用于实现引入知识库外部知识,通过基于规则的时间识别规则、事件候选过滤和消歧规则,事件抽取系统输出结构化实体事件知识,并提供事件可视化系统进行事件展示;

22、事件结构化模型:事件时间消歧技术,段落级别事件分类,事件触发词识别,用于实现为知识库中的实体补充丰富的动态事件知识,通过段落级别事件分类规则、事件触发词识别及分类规则处理,构建事件关系模型,对事件进行分类,识别事件的触发词。

23、本专利技术所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(4)中军事数据知识图谱融合接口包括实体对齐、属性对齐、属性值对齐;

24、实体对齐:支持基于图方法的实体对齐模型,基于融合特征相似度的实体对齐模型,基于卷积神经网络的实体对齐模型,基于人工标注的实体对齐模型,用于实现判断两个知识图谱中的实体是否等价,进行数据预处理、分块、成对对齐和集体对齐,统一实体命名,降低需要计算的实体对的数量,匹配实体信息;

25、属性对齐:基于学习的通用算法,数据驱动的细粒度对齐,用于实现用统一的属性名称表示,采取属性名称相似性规则、外部同义词知识库、属性取值相似度规则,将单数据源中的所有等价属性合并;

26、属性值对齐:异构信息网络,投票算法,用于实现删除重复和错误知识,通过属性值规范化规则、投票策略规则,合并来自不同知识图谱,同一实体属性的属性值。

27、本专利技术所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(5)中军事知识图谱推理接口包括链接预测接口、三元组分类接口;

28、链接预测接口:选择与给定关系相关的单词,以减少不相关和噪声单词的干扰,从相关文本中,模型采用完全卷积网络提取词的嵌入,最后,将提取的词嵌入与知识图谱中的现有实体进行比较,以解决目标实体的排序列表,用于实现减少不相关和噪声单词的干扰,通过依存关系的文本隐藏规则、目标融合规则、语义平均规则,采用完全卷积网络提取词的嵌入;

29、三元组分类接口:使用编码器和解码器模型,编码器依次输入向量、关系变换、向量变换、权重聚合、输出向量组成,解码器通过输出分数判断三元组的本文档来自技高网...

【技术保护点】

1.一种面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(1)中的实体信息抽取模型包括领域词汇集模型,缩略词挖掘模型,多模态实体模型;

3.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(2)中的实体关系抽取模型包括无监督关系抽取模型和有监督关系抽取模型;

4.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(3)中的事件抽取模型包括事件识别模型和事件结构化模型;

5.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(4)中军事数据知识图谱融合接口包括实体对齐、属性对齐、属性值对齐;

6.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(5)中军事知识图谱推理接口包括链接预测接口、三元组分类接口;

7.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(6)中知识图谱智能更新模型包括结构化军事数据更新模型、非结构化军事数据更新模型、半结构化军事数据更新模型;

8.根据权利要求7所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:所述的结构化军事数据更新模型用于实现插入或替换原军事知识图谱中的知识,通过插入或替换规则,将结构化链接军事数据或结构化数据库军事数据插入或替换原军事知识图谱中的知识。

9.根据权利要求7所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:所述的非结构化军事数据更新模型用于实现开放域的关系抽取,通过关系模式抽取规则、候选关系抽取规则及关系过滤规则,从文本中抽取表示关系的指示词,从而得到实体关系元组。

10.根据权利要求7所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:所述的半结构化军事数据更新模型用于实现识别出已变化的实体并集市的覆盖新出现的实体,利用实体发现规则、实体更新规则、实体扩展规则及扩展更新规则,预测实体的更新频率值,进行军事数据更新。

...

【技术特征摘要】

1.一种面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(1)中的实体信息抽取模型包括领域词汇集模型,缩略词挖掘模型,多模态实体模型;

3.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(2)中的实体关系抽取模型包括无监督关系抽取模型和有监督关系抽取模型;

4.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(3)中的事件抽取模型包括事件识别模型和事件结构化模型;

5.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(4)中军事数据知识图谱融合接口包括实体对齐、属性对齐、属性值对齐;

6.根据权利要求1所述的面向军事数据的知识图谱自动构建及自适应扩展方法,其特征在于:步骤(5)中军事知识图谱推理接口包括链接预测接口、三元组分类接口;

7.根据权利要求1所述的面向军事...

【专利技术属性】
技术研发人员:胥昕昕陈端迎张科伟韩永磊金逊刘远亮武育邓鹏吉寒冬宋胜利
申请(专利权)人:江苏杰瑞信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1