一种本体智能生成方法技术

技术编号：35477515 阅读：7 留言：0更新日期：2022-11-05 16:26

本发明专利技术公开了一种本体智能生成方法，其步骤包括：1)将待处理XSD文档中用于描述实体的元素转化为类节点；将该待处理XSD文档中描述实体属性的元素转化为数据属性节点；2)根据该待处理XSD文档中元素之间的嵌套等级关系确定各元素所对应节点之间的边，生成该待处理XSD文档对应的有向图；3)生成所述有向图中的每一节点的语义嵌入向量，根据节点的语义嵌入向量计算节点间的语义相似度；将语义相似度大于设定阈值的节点合并为簇节点；4)根据步骤3)处理后的有向图得到OWL语言描述的资源知识内容本体。本发明专利技术能够揭示更多原有XML资源中的知识内容，提高本体对于原有知识内容的描述与揭示能力。能力。能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种本体智能生成方法

[0001]本专利技术涉及本体的智能生成方法，尤其涉及一种从原始知识资源提取知识内容的本体智能生成方法。

技术介绍

[0002]本体具有较强的语义描述能力，可以描述现实世界中的实体，揭示知识之间的关联。现在广泛使用的数据交换格式为XML，但XML只能表达不同元素之间的等级嵌套关系，不能很好揭示XML文档中具有的丰富语义内容。而OWL本体具有丰富表达性，可以描述原有知识资源中知识内容之间的相互关联，并使用体系化、形式化的方式进行表达。因此，为了更好挖掘XML知识资源中的知识内容，需要一种XML至OWL的转化方法。现有的转化方法多通过直接建立映射的方式，或直接根据XSD定义的元素类型进行转化，或使用XSD本身的树形结构进行转化，这些方法得到的OWL本体只能表达原有XML文档等级嵌套结构中的语义信息，在对于XML知识资源进行知识内容提取时，存在以下问题：(1)传统的方法不能更好地组织多源异构知识资源。原始知识资源(如XML资源文件)中涉及的标签复杂多样，仅通过简单的映射关系并不能很好对标签进行组织整序，使得最终形成的本体随着资源规模的增大而使本体结构异常复杂，没有形成有效的知识体系，知识资源的利用效率极低。(2)传统方法不能很好的揭示出原始知识资源中蕴含的丰富知识内容。现有的方法主要对于XML的等级嵌套结构进行转化，但不同的嵌套层级、所处的嵌套位置等信息并没有得到充分的利用，缺失用于形成知识体系的上下位关系，仅仅获取XSD结构树后进行转化实际上并没有深入语义层面进行分析，XML知识资源中蕴含的更深层的...

【技术保护点】

【技术特征摘要】
1.一种本体智能生成方法，其步骤包括：1)将待处理XSD文档中用于描述实体的元素转化为类节点；将该待处理XSD文档中描述实体属性的元素转化为数据属性节点；2)根据该待处理XSD文档中元素之间的嵌套等级关系确定各元素所对应节点之间的边，生成该待处理XSD文档对应的有向图；3)生成所述有向图中的每一节点的语义嵌入向量，根据节点的语义嵌入向量计算节点间的语义相似度；将语义相似度大于设定阈值的节点合并为簇节点；4)根据步骤3)处理后的有向图得到OWL语言描述的资源知识内容本体。2.根据权利要求1所述的方法，其特征在于，生成所述有向图的方法为：对于该待处理XSD文档中的嵌套关系N(a,b)，a为父元素，b为子元素；根据N(a,b)生成元素a对应节点指向元素b所对应节点的有向边，并将该有向边命名为“has”+b；如果元素b满足条件(1)～(3)中任一条件，则元素a对应节点与元素b所对应节点之间的边称为类边；其中条件(1)～(3)为：(1)元素b所对应节点为类节点之下的节点；(2)元素b在该待处理XSD中有具体的约束条件进行限制；(3)元素b为该待处理XSD中的命名节点，即元素b为实际业务对象。3.根据权利要求1所述的方法，其特征在于，将语义相似度大于设定阈值的节点合并为簇节点的方法为：1)生成该处理XSD文档的XML结构树；将语义相似度大于设定阈值的节点放到同一节点团中...

【专利技术属性】
技术研发人员：李广建，王宇轩，罗立群，黄振，张闻彬，
申请(专利权)人：国网山东省电力公司信息通信公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人