当前位置: 首页 > 专利查询>邓寅生专利>正文

文档的采集、标识及关联的系统技术方案

技术编号:15400950 阅读:189 留言:0更新日期:2017-05-24 12:04
本发明专利技术公开了文档的采集、标识及关联的系统,搭建了某一专业领域的基于计算机系统的知识管理系统,提高了对专业领域知识的学习效率和利用效率。其技术方案为:在不特定文档中以关键词搜索方式标识和关联与一组关键词有文档间逻辑关系的一系列文档,并对该系列文档组成的关系图以该组关键词按一定的逻辑组合进行命名。

Document collection, identification, and associated systems

The invention discloses a system for collection, identification and related documents, to build a knowledge management system based on the computer system of a professional field, improve the learning efficiency and utilization efficiency of knowledge in the field of professional. The technical proposal is that in a specific document by keyword search a series of document logical relationship between documents and labeling is associated with a set of keywords, diagram and the composition of this series of documents with the set of keywords according to certain logic named.

【技术实现步骤摘要】
文档的采集、标识及关联的系统
本专利技术涉及文档系统,尤其涉及在某一特定专业领域中对在线或单机文档(含手持设备)的采集、标识和关联的高效的处理系统。
技术介绍
通过世界上现有的许多文档的搜索及展示的系统,专业技术人员获取、学习并研究文档,并需要从多份生成日期不同、作者不同(独立作者或联合作者)的文档中获取有效的信息作为相关行事准则的参考依据。可能最终需要的某一知识内容仅占其所查询的文档内容5%以下,而且这些知识内容可能分散在若干个不明显相关的文档之中。本申请人认识到,需要为这些专业技术人员,从他们所关心的领域中寻找到符合他们要求的、准确的特定信息,即需要在海量文档提取出相应信息的解答是非常耗时的。而且能够为这些专业人员提供相关类似服务的人员非常稀少。因此,本申请人认识到需要建立一种更好的针对文档进行采集、标识及关联的系统方法。
技术实现思路
本专利技术的目的在于解决上述问题,提供了一种文档的采集、标识及关联的系统,搭建了某一专业领域的基于计算机系统的知识管理系统,提高了对专业领域知识的学习效率和利用效率。本专利技术的技术方案为:本专利技术揭示了一种文档的采集、标识及关联的系统,包括文档分类存储管理平台服务器和文档库平台服务器,其中文档分类存储管理平台服务器包括单一文档的采集装置、单一文档的标识和关联装置以及文档间关系图建立装置,文档存储装置的主节点部署在文档分类存储管理平台服务器上,文档存储装置的主节点的镜像版本部署在文档库平台服务器上,其中:单一文档的采集装置,用于将所需管理类型的文档进行搜集、初步加工和系统导入;单一文档的标识和关联装置,按照不同的维度和层级对预设的专业术语进行分类和定义,建立和维护对应专业领域的关键词列表,对单一文档按照不同的属性和层级进行定义,在单一文档中设置若干个文档单元,对文档单元进行若干个关键词的系统标识,定义任意两个单一文档或文档单元之间可能产生的逻辑关系列表,并通过已设定的逻辑关系种类实现两个单一文档之间的逻辑关系的关联设置;文档间关系图建立装置,对文档间关系图进行定义,对文档间关系图的各组成部分之间的关系进行定义;文档存储装置,根据单一文档的采集装置、单一文档的标识和关联装置、文档间关系图建立装置的调用将相关信息存储到文档分类存储管理平台服务器的数据库中,将指定的格式文件归档到文档库平台服务器中,并通过数据交换引擎将相关数据信息在文档分类存储管理平台服务器和文档库平台服务器之间传输数据。根据本专利技术的文档的采集、标识及关联的系统的一实施例,单一文档的采集装置进一步包括:格式整理模块,将文档整理成指定的格式;分类信息标识模块,连接格式整理模块,将格式文件按要求添加初步的分类信息标识;文件导入模块,连接分类信息标识模块,将添加了分类信息标识的格式文件导入到系统中。根据本专利技术的文档的采集、标识及关联的系统的一实施例,单一文档的标识和关联装置进一步包括:关键词维度设定模块,对关键词的维度进行设定;关键词定义模块,连接关键词维度设定模块,对关键词各维度所对应的关键词进行定义;文档分类设定模块,按照关键词对单一文档进行分类设定;文档片段设定模块,按照关键词对文档的各文档片段进行分类设定。根据本专利技术的文档的采集、标识及关联的系统的一实施例,单一文档的标识和关联装置还包括:文档单元设置模块,将单一文档的具有相同关键词标识的文档片段组合为若干个文档单元;文档单元标识模块,对文档单元进行若干个关键词的系统标识;逻辑关联模块,定义任意两个单一文档之间可能产生的逻辑关系列表,通过已设定的逻辑关系种类在系统内实现两个单一文档或者文档单元之间的逻辑关系的关联。根据本专利技术的文档的采集、标识及关联的系统的一实施例,文档间关系图建立装置进一步包括:关键词命名模块,对任一具体的文档间关系图通过特定的一组关键词进行命名;文档间关系图生成模块,生成文档间关系图,包括文档间关系图中按文档单元间的特定逻辑关系排列的一系列文档单元的展现、文档单元之间的逻辑关系的图形标识、单一文档单元的展现。根据本专利技术的文档的采集、标识及关联的系统的一实施例,文档存储装置进一步包括:关系型数据库管理系统,用于建立文档分类存储管理平台;文档库管理系统,用于建立文档库平台;写入操作模块,对各装置的调用执行数据库的写入操作;保存操作模块,对各装置的调用以归档功能保存相应的单一文档文件或文档间关系图文件;平台数据传输模块,通过数据交换引擎将相关数据在文档分类存储管理平台服务器和文档库平台服务器之间传递。根据本专利技术的文档的采集、标识及关联的系统的一实施例,系统还包括文档释读采集平台服务器,其中包括:文档释读采集装置,采集用户对文档的解释内容相关的输入数据;数据采集审核装置,对采集到的输入数据进行审核;文档释读存储装置,将通过审核的文档解释内容相关的输入数据链接到相应的文档或文档间关系图中进行存储。根据本专利技术的文档的采集、标识及关联的系统的一实施例,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关系的逻辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。根据本专利技术的文档的采集、标识及关联的系统的一实施例,具体的实现方式还包括基于云技术构建的服务架构体系,实现诸如云端的数据查询、程序更新以及文件更新处理等服务。根据本专利技术的文档的采集、标识及关联的系统的一实施例,文档包括但不限于论文、教材、历史文献、法律法规、培训课件、新闻和公告,包括但不限于文字、音频、视频、网页的多媒体介质。本专利技术还揭示了一种文档的采集、标识及关联的系统,以单机版的方式在单台设备上运行,包括:单一文档的采集装置,用于将所需管理类型的文档进行搜集、初步加工和系统导入;单一文档的标识和关联装置,按照不同的维度和层级对预设的专业术语进行分类和定义,建立和维护对应专业领域的关键词列表,对单一文档按照不同的属性和层级进行定义,在单一文档中设置若干个文档单元,对文档单元进行若干个关键词的系统标识,定义任意两个单一文档或文档单元之间可能产生的逻辑关系列表,并通过已设定的逻辑关系种类实现两个单一文档之间的逻辑关系的关联设置;文档间关系图建立装置,对文档间关系图进行定义,对文档间关系图的各组成部分之间的关系进行定义;文档存储装置,根据单一文档的采集装置、单一文档的标识和关联装置、文档间关系图建立装置的调用将相关信息存储到单台设备的数据库中,将指定的格式文件归档到单台设备的数据库中;单机版打包发布装置,将通过文档存储装置所最终保存的数据及归档后指定格式的文件打包成一个完整的发布包裹,并根据目标平台的不同有针对性的生成发布装置程序可执行文件及配套附属文件;客户端安装装置,通过执行发布装置的程序可执行文件,将发布包裹完整的展开到单台设备上,包括:通过文档存储装置所最终保存的数据及归档后指定格式的文件。根据本专利技术的文档的采集、标识及关联的系统的一实施例,单一文档的采集装置进一步包括:格式整理模块,将文档整理成指定的格式;分类信息标识模块,连接格式整理模块,将格式文件按要求添加初步的分类信息标识;文件导入模块,连接分类信息标识模块,将添加了分类信息标识的格式文件导入到系统中。根据本专利技术的文档的采集、标识及关联的系统的一实施例,单一文档的标识和关联装置进一本文档来自技高网...
文档的采集、标识及关联的系统

【技术保护点】
一种文档的采集、标识及关联的系统,包括文档分类存储管理平台服务器和文档库平台服务器,其中文档分类存储管理平台服务器包括单一文档的采集装置、单一文档的标识和关联装置以及文档间关系图建立装置,文档存储装置的主节点部署在文档分类存储管理平台服务器上,文档存储装置的主节点的镜像版本部署在文档库平台服务器上,其中:单一文档的采集装置,用于将所需管理类型的文档进行搜集、初步加工和系统导入;单一文档的标识和关联装置,按照不同的维度和层级对预设的专业术语进行分类和定义,建立和维护对应专业领域的关键词列表,对单一文档按照不同的属性和层级进行定义,在单一文档中设置若干个文档单元,对文档单元进行若干个关键词的系统标识,定义任意两个单一文档或文档单元之间可能产生的逻辑关系列表,并通过已设定的逻辑关系种类实现两个单一文档之间的逻辑关系的关联设置;文档间关系图建立装置,对文档间关系图进行定义,对文档间关系图的各组成部分之间的关系进行定义;文档存储装置,根据单一文档的采集装置、单一文档的标识和关联装置、文档间关系图建立装置的调用将相关信息存储到文档分类存储管理平台服务器的数据库中,将指定的格式文件归档到文档库平台服务器中,并通过数据交换引擎将相关数据信息在文档分类存储管理平台服务器和文档库平台服务器之间传输数据。...

【技术特征摘要】
1.一种文档的采集、标识及关联的系统,包括文档分类存储管理平台服务器和文档库平台服务器,其中文档分类存储管理平台服务器包括单一文档的采集装置、单一文档的标识和关联装置以及文档间关系图建立装置,文档存储装置的主节点部署在文档分类存储管理平台服务器上,文档存储装置的主节点的镜像版本部署在文档库平台服务器上,其中:单一文档的采集装置,用于将所需管理类型的文档进行搜集、初步加工和系统导入;单一文档的标识和关联装置,按照不同的维度和层级对预设的专业术语进行分类和定义,建立和维护对应专业领域的关键词列表,对单一文档按照不同的属性和层级进行定义,在单一文档中设置若干个文档单元,对文档单元进行若干个关键词的系统标识,定义任意两个单一文档或文档单元之间可能产生的逻辑关系列表,并通过已设定的逻辑关系种类实现两个单一文档之间的逻辑关系的关联设置;文档间关系图建立装置,对文档间关系图进行定义,对文档间关系图的各组成部分之间的关系进行定义;文档存储装置,根据单一文档的采集装置、单一文档的标识和关联装置、文档间关系图建立装置的调用将相关信息存储到文档分类存储管理平台服务器的数据库中,将指定的格式文件归档到文档库平台服务器中,并通过数据交换引擎将相关数据信息在文档分类存储管理平台服务器和文档库平台服务器之间传输数据。2.根据权利要求1所述的文档的采集、标识及关联的系统,其特征在于,单一文档的采集装置进一步包括:格式整理模块,将文档整理成指定的格式;分类信息标识模块,连接格式整理模块,将格式文件按要求添加初步的分类信息标识;文件导入模块,连接分类信息标识模块,将添加了分类信息标识的格式文件导入到系统中。3.根据权利要求2所述的文档的采集、标识及关联的系统,其特征在于,单一文档的标识和关联装置进一步包括:关键词维度设定模块,对关键词的维度进行设定;关键词定义模块,连接关键词维度设定模块,对关键词各维度所对应的关键词进行定义;文档分类设定模块,按照关键词对单一文档进行分类设定;文档片段设定模块,按照关键词对文档的各文档片段进行分类设定。4.根据权利要求3所述的文档的采集、标识及关联的系统,其特征在于,单一文档的标识和关联装置还包括:文档单元设置模块,将单一文档的具有相同关键词标识的文档片段组合为若干个文档单元;文档单元标识模块,对文档单元进行若干个关键词的系统标识;逻辑关联模块,定义任意两个单一文档之间可能产生的逻辑关系列表,通过已设定的逻辑关系种类在系统内实现两个单一文档或者文档单元之间的逻辑关系的关联。5.根据权利要求4所述的文档的采集、标识及关联的系统,其特征在于,文档间关系图建立装置进一步包括:关键词命名模块,对任一具体的文档间关系图通过特定的一组关键词进行命名;文档间关系图生成模块,生成文档间关系图,包括文档间关系图中按文档单元间的特定逻辑关系排列的一系列文档单元的展现、文档单元之间的逻辑关系的图形标识、单一文档单元的展现。6.根据权利要求5所述的文档的采集、标识及关联的系统,其特征在于,文档存储装置进一步包括:关系型数据库管理系统,用于建立文档分类存储管理平台;文档库管理系统,用于建立文档库平台;写入操作模块,对各装置的调用执行数据库的写入操作;保存操作模块,对各装置的调用以归档功能保存相应的单一文档文件或文档间关系图文件;平台数据传输模块,通过数据交换引擎将相关数据在文档分类存储管理平台服务器和文档库平台服务器之间传递。7.根据权利要求1所述的文档的采集、标识及关联的系统,其特征在于,系统还包括文档释读采集平台服务器,其中包括:文档释读采集装置,采集用户对文档的解释内容相关的输入数据;数据采集审核装置,对采集到的输入数据进行审核;文档释读存储装置,将通过审核的文档解释内容相关的输入数据链接到相应的文档或文档间关系图中进行存储。8.根据权利要求1所述的文档的采集、标识及关联的系统,其特征在于,文档间的逻辑关系包括但不限于派生关系、平行关系、或关系、与关系、包含关系、修订关系、覆盖关系、否定关系的逻辑关系,其中每一种文档间的逻辑关系对应系统中唯一的图标。9.根据权利要求1所述的文档的采集、标识及关联的系统,其特征在于,具体的...

【专利技术属性】
技术研发人员:邓寅生
申请(专利权)人:邓寅生
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1