一种基于多模态融合的知识库构建方法技术

技术编号：24683962 阅读：356 留言：0更新日期：2020-06-27 08:07

本发明专利技术公开了一种基于多模态融合的知识库构建方法，包括基于数据源中词条的信息框信息抽取实体的基本属性建立二元关系，生成所述信息框属性与关系的映射字典；建立基于词向量空间和条件随机场的主题实体与关系提取模型，扩充所述二元关系生成多元关系模板；基于抽取到的所述二元关系的名称构建实体的特征集合，对所述实体进行层次聚类划分，构建分类体系，概括所述分类体系信息；对数据源中的数据以所述实体的固有属性和属性值进行属性规范化；确定融合的数据集合，根据实体对齐算法识别不同数据源中的等价实体，建立不同数据源中同一实体的等价链接，进行多源数据融合；对进行所述多源数据融合后的知识图谱进行纠正和扩充，实现知识的自动补全。

A knowledge base construction method based on multimodal fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态融合的知识库构建方法
本专利技术涉及计算机
，尤其涉及一种基于多模态融合的知识库构建方法。
技术介绍
目大数据已经逐步渗透到科学技术发展、国民经济和民众日常生活的各个方面，从海量数据中发现知识和挖掘信息成为关键技术。自然语言处理的快速发展为知识图谱的构建和扩充提供了可行性，而知识的抽取和统一表示为理解和关联知识提供了理论和技术支持。2012年Google提出知识图谱的概念，并将其作为向知识引擎迈进的关键和下一代搜索引擎的核心，实现客观世界中知识和事物到互联网中数据的转换。知识图谱的提出和快速发展，已经成为高校和企业进行知识转化和表示的重要工具，为信息挖掘、语义解析、知识生成和知识推理提供了重要手段。知识图谱以大量复杂且结构化的知识，存储与描述着互联网中的数据，为机器提供了一种更加可读的知识网络，助力其从语义角度理解用户的搜索意图，从海量数据中快速、准确地获得有价值的结果，并呈现与搜索结果关联的整个知识体系，满足信息时代人们更具深度与广度的数据需求。知识库中的知识条目(即事实,fact)被表示为一个形如(subject,relation,object)的三元组，其中subject和object表示实体，relation描述subject和object间的语义关系。将所有三元组组织在一起可以构成一个有向图，图中的节点和有向边分别表示实体及其实体间的关系，通过这种方式从知识库中得到的有向图被称为知识图谱(KnowledgeGraph)。目前多源数据融合的问题主要有两个：(1)来源于不同数...

【技术保护点】
1.一种基于多模态融合的知识库构建方法，其特征在于，所述方法包括：/n步骤一：基于数据源中词条的信息框信息抽取实体的基本属性建立二元关系，生成所述信息框属性与关系的映射字典；利用所述词条的文本描述信息建立基于词向量空间和条件随机场的主题实体与关系提取模型，扩充所述二元关系生成多元关系模板；基于抽取到的所述二元关系的名称构建实体的特征集合，对所述实体进行层次聚类划分，构建分类体系，概括所述分类体系信息；/n步骤二：对若干数据源中每个数据源中的数据以所述实体的固有属性和属性值进行属性规范化；确定融合的数据集合，根据实体对齐算法识别不同数据源中的等价实体，建立不同数据源中同一实体的等价链接，进行多源数据融合；/n步骤三：对进行所述多源数据融合后的知识图谱进行纠正和扩充，对语义向量空间进行联合学习以及链接预测，设计事实重建方法，实现知识的自动补全。/n

【技术特征摘要】
1.一种基于多模态融合的知识库构建方法，其特征在于，所述方法包括：
步骤一：基于数据源中词条的信息框信息抽取实体的基本属性建立二元关系，生成所述信息框属性与关系的映射字典；利用所述词条的文本描述信息建立基于词向量空间和条件随机场的主题实体与关系提取模型，扩充所述二元关系生成多元关系模板；基于抽取到的所述二元关系的名称构建实体的特征集合，对所述实体进行层次聚类划分，构建分类体系，概括所述分类体系信息；
步骤二：对若干数据源中每个数据源中的数据以所述实体的固有属性和属性值进行属性规范化；确定融合的数据集合，根据实体对齐算法识别不同数据源中的等价实体，建立不同数据源中同一实体的等价链接，进行多源数据融合；
步骤三：对进行所述多源数据融合后的知识图谱进行纠正和扩充，对语义向量空间进行联合学习以及链接预测，设计事实重建方法，实现知识的自动补全。

2.根据权利要求1所述的基于多模态融合的知识库构建方法，其特征在于，所述步骤二中所述实体对齐算法用于计算所述实体间的相似度，当相似度超过设定的阈值时，所述实体为等价实体，其中，所述相似度为两个所述实体间本文描述的相似度。<...

【专利技术属性】
技术研发人员：张日崇，谭智隆，刘幼峰，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人