一种合理化建议全文检索系统技术方案

技术编号:9569079 阅读:130 留言:0更新日期:2014-01-16 02:38
本发明专利技术提出的一种合理化建议全文检索系统,本系统支持包括合理化建议题目,建议内容,改善方案,建议人,建议部门等在内的检索。系统后台采集合理化建议数据,按类目对数据进行格式化操作,形成完整的索引文件,用户通过系统前台页面搜索数据,系统根据用户数据的关键字搜索索引文件,并对符合条件的搜索结果进行处理后返回给前台页面。有了索引文件,系统即可脱离数据库进行搜索工作。

【技术实现步骤摘要】
【专利摘要】本专利技术提出的一种合理化建议全文检索系统,本系统支持包括合理化建议题目,建议内容,改善方案,建议人,建议部门等在内的检索。系统后台采集合理化建议数据,按类目对数据进行格式化操作,形成完整的索引文件,用户通过系统前台页面搜索数据,系统根据用户数据的关键字搜索索引文件,并对符合条件的搜索结果进行处理后返回给前台页面。有了索引文件,系统即可脱离数据库进行搜索工作。【专利说明】一种合理化建议全文检索系统
本专利技术属于计算机应用范畴,具体涉及一种合理化建议全文检索系统。
技术介绍
合理化建议全文检索系统是一种搜索引擎,它以一定的策略在指定的搜索空间上收集和查找信息,对信息进行处理和组织后为用户提供信息查询服务。它克服了数据库中存在的一些不足,为数据的检索提供了更为方便快捷的方式。本系统利用最新的Lucene(v4.0)工具包构建了一个合理化建议搜索引擎,为建议审核管理员与普通用户提供一个快捷、方便的检索平台。本专利技术是针对企业内部合理化建议的全文检索系统,不接入互联网。合理化建议是指员工对公司科研开发、生产制造、经营、管理等方面各个环节所提出的、具有可操作性的改进方法和措施,以及其它有助于公司业务发展的,由员工所提出的具体和有益的构想。一条合理化建议信息包括:建议名称、建议内容、建议部门、建议人、改善方案、建议日期等多个维度项。本专利技术支持这些维度项的全文检索。系统以JSP页面作为结果显示,数据处理模块采用JAVA+Lucene API4.0编写,WEB服务器使用Resin,系统部署方式简洁,运行环境一般服务器即可支撑,适用性强,可推广性好;系统只在指定数据集搜索,没有噪音数据;与合理化建议采集平台无缝对接,搜索实时性强;整体架构清晰,可扩展性强;索引文件独立,不依赖于具体平台,搜索不依赖数据库;提供管理员功能,便于索引及搜索管理。现有合理化建议搜索功能存在的缺陷:.现有的搜索功能必须依赖数据库,需要分配对应的链接。.现有的搜索功能只能针对某一个项进行搜索,不能联合搜索,例如:只能针对建议人姓名,或者建议部门等单项搜索。.现有的搜索功能搜索速度一般。经过测试,均值在1-2秒,.现有的搜索功能关键字单一,只支持单字或单词的查询。
技术实现思路
要解决的技术问题为了避免现有技术的不足之处,本专利技术提出一种合理化建议全文检索系统,技术方案一种合理化建议全文检索系统,其特征在于步骤如下:步骤1、数据收集处理:以一条合理化建议为一个流程,一条合理化建议数据为是一个Document文档;当该流程被提交后,搜索引擎后台数据收集程序被触发,开始数据收集处理;步骤2、按照搜索引擎需要项的名称索引建立:搜索引擎需要的项包括:建议名称,OA登录人,建议人,建议内容,改善方案,提出部门,实施部门,提案日期,审核日期,实施前状态和实施后状态;步骤3、内容存储:按照实际需求及各项属性将其加入Field域,这些域将组成一个文档;所述每个域都对应一段数据,系统将输入数据存储为Inverted Index倒排索引;步骤4、搜索与结果展示:系统使用Resin作为Web服务器,JSP页面接收到用户输入的查询关键字后,将其传递给系统后台进行搜索,搜索类直接返回TopDocs对象,结果处理类会根据TopDocs数据对结果进行处理与组装,传递给前端,JSP负责接收处理结果并返回给用户。有益效果本专利技术提出的一种合理化建议全文检索系统,本系统支持包括合理化建议题目,建议内容,改善方案,建议人,建议部门等在内的检索。系统后台采集合理化建议数据,按类目对数据进行格式化操作,形成完整的索引文件,用户通过系统前台页面搜索数据,系统根据用户数据的关键字搜索索引文件,并对符合条件的搜索结果进行处理后返回给前台页面。有了索引文件,系统即可脱离数据库进行搜索工作。本系统突破了现有搜索功能的局限,解决了以上的问题,目前本系统可以支持:.搜索时无需链接数据库,节约珍贵的数据库资源。.本系统支持合理化建议的全文检索,包括建议人,建议部门,建议内容,实施方案,建议题目等多维度检索,无需用户人为制定某项搜索域,系统将满足关键字的所有结果展现在结果页面。.大幅度提高了搜索速度,经过实际日志监控,搜索速度为0.01-0.1秒。.本系统支持多词查询,通过扩展,还可支持关系查询,如:或,并等查询。【专利附图】【附图说明】图1:系统结构图图2:索引时序图图3:合理化建议全文检索主页面图4:合理化建议全文检索搜索界面图5:支持多词查询【具体实施方式】现结合实施例、附图对本专利技术作进一步描述:本系统支持包括合理化建议题目,建议内容,改善方案,建议人,建议部门等在内的检索。系统后台采集合理化建议数据,按类目对数据进行格式化操作,形成完整的索引文件,用户通过系统前台页面搜索数据,系统根据用户数据的关键字搜索索引文件,并对符合条件的搜索结果进行处理后返回给前台页面。有了索引文件,系统即可脱离数据库进行搜索工作。系统主要分为数据收集处理与索引建立、搜索与结果展示,系统结构图如图1所/Jn ο本单位的合理化建议是在办公自动化(OA)系统中以流程的形式提出的,一条合理化建议就是一个流程,在本系统中,一条合理化建议数据就认为是一个Document(文档)。建议人提交流程后,即认为合理化建议发布,搜索引擎后台数据收集程序被触发,开始数据收集处理,由于该动作是实时的,因此用户提交了建议后就可以被搜索到。如果没有提交,则说明用户并没有准备好发布建议,只是草稿状态,此时搜索引擎并不会收集该类建议,也就不会被其他用户搜索到。该模块负责采集OA系统的数据,按照每项的名称和内容存储。一条标准的合理化建议有41项数据,搜索引擎需要的项包括:建议名称,OA登录人,建议人,建议内容,改善方案,提出部门,实施部门,提案日期,审核日期,实施前状态,实施后状态。从OA系统中获取到各项的数据之后,需要对这些数据进行处理。按照实际需求及各项属性将其加入Field(域),这些域将组成一个文档。系统中每个域都对应一段数据,系统对这些数据的处理方式不完全相同,例如人名和日期不会被分析(或分词),只会被索引与存储,而建议名称与内容等项会被分析、索弓1、存储。分析就是将域中的文本转化为最基本的Term的过程,由分析器处理。分析器会对文本进行提取语汇单元,去除标点,移除停止词,词干还原等操作。数据收集处理及分析完成后,系统会开始建立索引。时序图如图2所示:其中,合理化建立流程和GatherAction在OA系统中实现,其他类在搜索引擎系统中。对输入数据分析处理完之后,系统将输入数据存储为Inverted Index (倒排索引)。这种倒排存储结构把从文档中抽取出的Token作为查找关键字,而不是将文档作为中心实体。系统调用Lucene的Index API来实现建立索引,将已经添加好Field的Document加入到索引中。搜索与结果展示系统使用Resin作为Web服务器,JSP页面接收到用户输入的查询关键字后,将其传递给系统后台进行搜索,搜索类直接返回TopDocs对象,结果处理类会根据TopDocs数据对结果进行处理与组装,传递给前端,JSP负责接收处理结果并返回给用户。显示结果界面遵循主流搜索引擎的样式,便于用户的习惯性操作和本文档来自技高网
...

【技术保护点】
一种合理化建议全文检索系统,其特征在于步骤如下:步骤1、数据收集处理:以一条合理化建议为一个流程,一条合理化建议数据为是一个Document文档;当该流程被提交后,搜索引擎后台数据收集程序被触发,开始数据收集处理;步骤2、按照搜索引擎需要项的名称索引建立:搜索引擎需要的项包括:建议名称,OA登录人,建议人,建议内容,改善方案,提出部门,实施部门,提案日期,审核日期,实施前状态和实施后状态;步骤3、内容存储:按照实际需求及各项属性将其加入Field域,这些域将组成一个文档;所述每个域都对应一段数据,系统将输入数据存储为Inverted?Index倒排索引;步骤4、搜索与结果展示:系统使用Resin作为Web服务器,JSP页面接收到用户输入的查询关键字后,将其传递给系统后台进行搜索,搜索类直接返回TopDocs对象,结果处理类会根据TopDocs数据对结果进行处理与组装,传递给前端,JSP负责接收处理结果并返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵婷张小民任茹波孙向东
申请(专利权)人:西安电子工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1