知识网络节点间属性生成系统及生成方法技术方案

技术编号：8593994 阅读：173 留言：0更新日期：2013-04-18 07:11

本发明专利技术公开了一种知识网络节点间属性关系生成系统及生成方法。该生成系统包括非结构化文本库、去标签模块、分词引擎、规则库、规则引擎和知识网络库，其中首先将预定领域的非结构化文本通过去标签模块进行预处理，然后由分词引擎对处理后的文本进行分词处理，形成有确切语义的词汇；词汇输入规则引擎中，规则引擎调用规则库中的规则，对知识网络节点之间的属性关系进行判别，并将判别后的结果输入知识网络库中。利用本发明专利技术可以通过机器生成的方式获得知识网络节点间的属性关系，从而解决由人工生成预定领域的知识网络节点间属性关系存在的工作量大、更新不及时的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种知识网络节点间属性关系的生成系统及生成方法，尤其涉及一种针对预定领域的知识网络，基于规则组合实现的知识网络节点间属性关系生成系统及生成方法，属于信息抽取

技术介绍
随着互联网的发展，一个典型的信息抽取应用是从无结构化或者半结构化的文本中，通过信息抽取技术提取人们所感兴趣的内容，并以结构化的形式，例如关系数据库形式或者XML形式保存下来。从应用的广泛程度以及研究的深入程度来看，信息抽取技术主要包含两个方面命名实体识别技术和实体关系抽取技术。命名实体识别技术的目标是识别文本中包含的各种命名实体，比如人名、地名、公司组织名和时间短语等等。而实体关系抽取技术的目标主要是发现和识别隐含在实体与实体之间的关系。目前，人们利用知识网络来研究人及企业间的知识传播、合作及创新行为，表示各类知识资源，分析个人及组织知识体系的结构、组成等。其中，知识网络节点是组成知识网络的基本单元，具有独立性、继承性、变异性、多维性等特点。知识网络节点可以多向成簇。即每一个知识网络节点都可同其他知识网络节点通过多种多样的形象、属性、关系相连，这种多维性来源于构成知识网络节点的知识单元内在构成元素、结构和外在形态的多元性。因此，在构建知识网络的过程中，生成并利用知识网络节点间的属性关系是一项十分重要的工作。但是，利用人工生成预定领域的知识网络节点间属性关系存在工作量大、更新不及时的问题，亟需采取技术措施加以解决。生成知识网络节点间属性关系的关键在于命名实体的关系挖掘，即上述的实体关系抽取技术。在这一领域内，目前有多种不同的技术方案。例如深圳腾讯公司在公开号为1021...

【技术保护点】
一种知识网络节点间属性生成系统，其特征在于：所述知识网络节点间属性生成系统包括非结构化文本库、去标签模块、分词引擎、规则库、规则引擎和知识网络库；所述非结构化文本库与所述去标签模块连接，所述去标签模块连接所述分词引擎，所述分词引擎与所述规则引擎连接，所述规则引擎分别与所述规则库和所述知识网络库连接；所述分词引擎向所述规则引擎提供有确切语义的词汇；所述规则引擎从所述规则库中获得进行属性关系判断的规则，对所述词汇生成知识网络节点间的属性关系，并将知识网络节点以及知识网络节点之间的属性关系存储在所述知识网络库中。

【技术特征摘要】
1.一种知识网络节点间属性生成系统，其特征在于所述知识网络节点间属性生成系统包括非结构化文本库、去标签模块、分词引擎、规则库、规则引擎和知识网络库；所述非结构化文本库与所述去标签模块连接，所述去标签模块连接所述分词引擎，所述分词引擎与所述规则引擎连接，所述规则引擎分别与所述规则库和所述知识网络库连接; 所述分词引擎向所述规则引擎提供有确切语义的词汇；所述规则引擎从所述规则库中获得进行属性关系判断的规则，对所述词汇生成知识网络节点间的属性关系，并将知识网络节点以及知识网络节点之间的属性关系存储在所述知识网络库中。2.如权利要求1所述的知识网络节点间属性生成系统，其特征在于所述知识网络节点间属性生成系统中还包括辅助概念树；所述辅助概念树与所述规则库连接，用于向所述规则库提供知识支持。3.如权利要求1所述的知识网络节点间属性生成系统，其特征在于在所述知识网络库中，所述知识网...

【专利技术属性】
技术研发人员：杨伟锋，宋传宝，张作职，
申请(专利权)人：北京海量融通软件技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人