一种管理非结构化数据的装置和方法制造方法及图纸

技术编号：12583331 阅读：109 留言：0更新日期：2015-12-23 23:36

本发明专利技术涉及一种管理非结构化数据的装置，其包括服务器、数据解析模块、原始数据导入模块、数据库、匹配规则定义模块、分析模块和调整模块，服务器连接用户终端，服务器的数据输出端依次连接数据解析模块和原始数据导入模块，原始数据导入模块通过一对数据输出端口分别连接数据库和匹配规则定义模块，匹配规则定义模块依次连接分析模块和调整模块，分析模块的数据输出端口连接数据库。本发明专利技术能够实时的采集用户的访问数据，通过匹配规则定义模块、分析模块和调整模块能够对每条数据进行扩展，并即使的分类保存到数据库中，从而保证服务器在接受访问时能够快速的调取数据，使得非结构化数据的检索更加快捷、范围更加广泛和准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及非结构化数据管理领域，具体涉及。
技术介绍
所有信息分为两类:一类信息能够用数据或统一的结构加以表示，成为结构化数据，如数字、符号等；另一类信息无法用数字或统一的结构表示，比如文本、图片、网页、各类报表、图像和音频/视频信息等等。随着网络技术的发展非结构化数据的数量口趋增大。目前，对非结构化数据进行管理，主要使用全文索引技术，具体的:建立倒排索引文件，根据关键字对非结构化数据进行内容检索，再对检索到的内容进行处理。索引是对数据库表中的一列或多列的值进行排序的一种结构，使用索引可快速访问数据库表中的特定信息，大大提高了数据库检索的性能。数据包括两大类:结构化数据和非结构化数据，实际应用中的数据可能混合了结构化和非结构化的数据。对结构化的数据进行检索称之为结构化检索，反之，对非结构化数据进行检索称之为非结构化检索。但是，这种对非结构化数据进行管理的方法，由于每次索引都需要进行全文搜索，且只能对预置的关键字进行搜索，无法根据需要进行扩展以便更准确的查找。可见，现有技术中对非结构化数据库信息进行管理，存在搜索周期长、查找准确度不高、以及扩展性差的问题。
技术实现思路
针对以上问题，本专利技术提供了一种能够实时的采集用户的访问数据并对数据进行分类，将结构化数据直接储存，非结构化数据的检索更加快捷、范围更加广泛、更加准确的管理非结构化数据的装置和方法。本专利技术的技术方案如下:上述的一种管理非结构化数据的装置，包括服务器、数据解析模块、原始数据导入模块、数据库、匹配规则定义模块、分析模块和调整模块，所述服务器连接用户终端，所述服务器的数据输出端...

【技术保护点】
一种管理非结构化数据的装置，包括服务器、数据解析模块、原始数据导入模块、数据库、匹配规则定义模块、分析模块和调整模块，其特征在于，所述服务器连接用户终端，所述服务器的数据输出端依次连接所述数据解析模块和原始数据导入模块，所述原始数据导入模块通过一对数据输出端口分别连接所述数据库和匹配规则定义模块，所述匹配规则定义模块依次连接所述分析模块和调整模块，所述分析模块的数据输出端口连接数据库。

【技术特征摘要】

【专利技术属性】
技术研发人员：张艳平，付治国，解书华，韩雪峰，
申请(专利权)人：辽宁工程技术大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人