基于知识图谱构建规章的本体模型的方法技术

技术编号:30068299 阅读:25 留言:0更新日期:2021-09-18 08:19
本发明专利技术提供一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点、第二图节点以及关系图节点分别构建关系链接;步骤S5,在规章文本存在索引号时,将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应实体类别以及关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。本体模型。本体模型。

【技术实现步骤摘要】
基于知识图谱构建规章的本体模型的方法


[0001]本专利技术属于知识图谱领域,具体涉及一种使用知识图谱三元组构建规章的本体模型的方法。

技术介绍

[0002]适航规则是航空领域最基础的部分,在飞机设计的初始阶段就必须将适航规则完全匹配,否则后期修改成本会大幅上升。目前对于飞机设计的规则是由领域专家进行审核,在行业领域中,培养一位领域专家需要大量的人力和时间成本,国内人材不足,审核流程复杂都成为了飞机设计的瓶颈。
[0003]知识图谱是一个基于图的存储方法,主要应用于检索引擎和智能问答,目前存在将其应用于自然语言处理的研究,一般而言,该分类下应用较多的是法律文书的处理,称为司法辅助功能。该司法辅助功能主要为:把法律文书的时间线路、线索整理出来,供法官查看;在有多个文书时,把多个文书间的逻辑关系整出来,得到两个事件之间有多大概率是因果关系。
[0004]然而,将知识图谱应用在适航规则时,会因为适航规则的术语较多,文本结构复杂,从而导致大段文字作为一个图节点,内容不能够细化。同时,传统知识图谱还具有不能对先后顺序、布尔计算、条件逻辑进行建模的缺点,因此将知识图谱应用在适航规则时,会进一步导致建模内容的宽泛,也就难以构建能够完整表达适航规章的本体。

技术实现思路

[0005]为解决上述问题,提供一种能够利用知识图谱构建规章数据库的方法,本专利技术采用了如下技术方案:
[0006]应用于数据库构建,智能问答等领域
[0007]本专利技术提供了一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个能够的本体模型,其特征在于,包括如下步骤:步骤S1,获取规章文本并对该规章文本中各个单词的词性进行识别,进一步将规章文本的段落按照主语、宾语、谓语进行划分;步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点;步骤S3,将谓语以及宾语中的连接词构建为关系图节点;步骤S4,为第一图节点以及第二图节点分别构建一个第一关系链接并与关系图节点进行链接,进一步构建一个用于链接第一图节点以及第二图节点的第二关系链接;步骤S5,判断规章文本是否存在索引号并在判断存在索引号时,就将该索引号构建为索引图节点,并为索引图节点构建一个第三关系连接并分别与第一图节点、第二图节点以及关系图节点链接;步骤S6,对规章文本进行抽象并确定对应第一图节点、第二图节点与关系图节点的实体类别,以及对应第一关系链接、第二关系链接与第三关系链接的关系类别;步骤S7,基于实体类别、关系类别以及规章文本构建本体模型。
[0008]本专利技术提供的基于知识图谱构建规章的本体模型的方法,还可以具有这样的技术
include the horn or fitting to which the control system is attached.
[0026](b)Compliance with the special factors requirements of
§§
25.619 through 25.625 and 25.657 for control surface hinges must be shown by analysis or individual load tests.
[0027]在本实施例的步骤S1中,通过常规的词性分析方法对上述规章进行检测,即可完成如下划分:
[0028]主语有:$25.651;Limit load tests;control surface hings
[0029]谓语有:require;include;compliance;shown;
[0030]宾语有:control surfaces;horn or fitting to which the control system is attached;the special factors requirements of $$25.619 through 25.625 and 25.657;analysis or individual load test.
[0031]步骤S2,将主语、宾语分别构建为第一图节点以及第二图节点。
[0032]步骤S3,将谓语以及宾语中的连接词构建为关系图节点。
[0033]在传统的知识图谱构建方法中,如图2所示,除了将主语和宾语构建为知识图谱图节点(即实体A与实体B),还会将谓语构建为两个知识图谱图节点之间的关系连接(即关系C)。
[0034]与之相比,在本实施例的知识图谱构建方法中,如图3所示,主语和宾语被构建为知识图谱图节点(即实体A与实体B)后,谓语以及宾语中的连接词也会被构建为知识图谱图节点(即关系C)。
[0035]步骤S4,为第一图节点以及第二图节点分别构建一个第一关系链接并与关系图节点进行链接,进一步构建一个用于链接第一图节点以及第二图节点的第二关系链接。
[0036]本实施例中,第一关系链接为自定义的关系,专用于链接谓语关系节点和原始图节点,这个关系连接可以随意取名,只要和其他关系不重名就可以,例如,取名blank、entity-to-relationEntity等,该第一关系链接的目的就是连接实体和关系节点。。第一图节点和关系图节点之间的关系与第二图节点和关系图节点之间的关系为相同的关系,形成了两个连续的三元组,即主语->关系->谓语(或连接词)->关系->宾语。
[0037]本实施例中,第二关系链接是关系节点(即谓语)的父级关系。比如谓语是“up”,“upper”,“not lower than”,那么这里的关系就是“position”。如果分类更细,可以是“up”。对于逻辑关系“and”“or”“if”父级关系可以是“logic”,更为细化的话,可以是“bool”“judge”。如果用户不需要父级关系,或者关系划分非常细,那么父级关系和关系节点的内容是一样的。
[0038]本实施例中,第一图节点和第二图节点之间存在有两条通路:一条是独立的三元组(即两者的通路为第一图节点->第二关系链接->第二图节点);另一条是一个谓语关系(即两者的通路为第一图节点->第一关系连接->关系节点->第一关系连接->第二图节点)。
[0039]本实施例中,在对美国联邦规章第25部分、适航规则651条进行处理时,如图4所示,粗体字是可以构建独立三元组的关系图节点,灰底色标出的词是关系图节点连接的实体(即第一图节点及第二图节点),灰色字体字需要人工参与并根据实际语义判断(或者也可以与连接的实体作为一个整体进行处理)。
[0040]步骤S5,判断规章文本是否存在索引号并在判断存在索引号时,就将该索引号构
建为索引图节点,并为索引图节点构建一个第三关系链接并分别与第一图节点、第二图节点以及关系图节点链接。
[0041]本实施例的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱构建规章的本体模型的方法,用于通过知识图谱对规章文本进行处理从而形成一个本体模型,其特征在于,包括如下步骤:步骤S1,获取所述规章文本并对该规章文本中各个单词的词性进行识别,进一步将所述规章文本的段落按照主语、宾语、谓语进行划分;步骤S2,将所述主语、所述宾语分别构建为第一图节点以及第二图节点;步骤S3,将所述谓语以及所述宾语中的连接词构建为关系图节点;步骤S4,为所述第一图节点以及所述第二图节点分别构建一个第一关系链接并与所述关系图节点进行链接,进一步构建一个用于链接所述第一图节点以及所述第二图节点的第二关系链接;步骤S5,判断所述规章文本是否存在索引号并在判断存在索引号时,就将该索引号构建为索引图节点,并为所述索引图节点构建一个第三关系连接并分别与所述第一图节点、所述第二图节点以及所述关系图节点链接;步骤S...

【专利技术属性】
技术研发人员:刘宏刚杨卫东
申请(专利权)人:珠海复旦创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1