本发明专利技术提供了一种查询方法,包括:从用户接收查询请求;根据查询请求,在第一数据源中进行第一查询,获取第一查询结果和与第一查询结果相对应的关联信息参数;根据关联参数信息,在第二数据源中进行第二查询并获得第二查询结果;以及将第一查询结果与第二查询结果汇总成最终查询结果反馈给用户。根据通过第一次查询所获得的关联信息参数进行第二次查询,即,根据关联信息直接在第二数据源中获取查询结果,不仅大幅减少了检索结果,提高了检索的精确性而且大幅减少了检索时间,提高了检索速度和效率。而对于检索用户来说,由于最终检索结果少,精确度高,因此减少了浏览检索结果所需要的时间。
【技术实现步骤摘要】
本专利技术一般地涉及计算机
,更具体地来说,涉及。
技术介绍
信息通常可以划分为两大类,一类是能够用数据或统一的结构加以表示的结构化数据,诸如,数字、符号;而另一类是无法用数字或统一的结构表示的非结构化数据,诸如,文本、图像、声音、网页等。结构化数据是可以用二维逻辑表来实现的数据,因此可以方便地存储在数据库中。非结构化数据是不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。目前,结构化数据的查询通常通过结构化查询语言(Structured Query Language,简称SQL)实现,结构化查询语言能够存取数据以及查询、管理关系数据库系统。非结构化的文本检索通常通过Lucene实现,Lucene是一套用于全文检索和搜寻的开源程式库,提供了一个简单却强大的应用程式接口。一种结构化数据和非结构化数据综合检索的方法,其中,包括以下步骤对存放结构化数据的数据库进行扩展,并对不同类型的非结构数据文档采用过滤filter的方式进行处理,根据文档后缀实现相应的接口处理类,完成相应的配置,对该类文档进行解析,并建立索引,从而实现对该类型文档的查询;根据关键词对所述数据库和文档进行检索,并显示检索结果。该技术方案能够在一定程度上满足用户需求。然而,该技术方案仅实现了进行数据库和文档检索并将直接提供的查询结果。该系统进行文档检索和数据库检索时耗时较长,检索速度较低,并且提供的查询结果为数据检索结果和文档检索结果的简单叠加,对于查询信息的用户来说,检索结果不精确,需要在大量的检索结果中选择需要的信息,所以增加了用户浏览检索结果的时间。
技术实现思路
针对现有技术中的检索方法检索速度低和检索结果不精确的缺陷,本专利技术提出了能够解决上述缺陷的一种。本专利技术提供了一种,包括从用户接收查询请求;根据查询请求,在第一数据源中进行第一查询,获取第一查询结果和与第一查询结果相对应的关联信息参数;根据关联参数信息,在第二数据源中进行第二查询并获得第二查询结果;以及将第一查询结果与第二查询结果汇总成最终查询结果反馈给用户。优选地,关联信息为URL地址。优选地,第一数据源为文件系统,第二数据源为数据库;或者第一数据源为数据库,第二数据源为文件系统。优选地,数据库存储有记录信息,文件系统存储有文本信息,记录信息与文本信息通过URL地址相关联。优选地,当查询请求所包含的查询信息与数据库中的记录信息相对应时,第一查询为数据库查询,第二查询为文本检索,第一查询结果为记录信息,第二查询结果为文本信肩、O优选地,当查询请求所包含的查询信息不与数据库中的记录信息相对应时,第一查询为文本检索,第二查询为数据库查询,第一查询结果为文本信息,第二查询结果为记录信息。优选地,为数据库创建外部表,并将查询到文本信息和URL地址存储在外部表中。优选地,文本信息包括文本内容、主题和摘要等。优选地,记录信息包括人名、生平、简历和作品等。优选地,查询服务器将文本内容和数据库记录汇总成最终查询结果。利用本专利技术的技术方案能够克服现有技术的缺陷,根据通过第一次查询所获得的关联信息参数进行第二次查询,即,根据关联信息直接在第二数据源中获取查询结果,不仅大幅减少了检索结果,提闻了检索的精确性而且大幅减少了检索时间,提闻了检索速度和效率。而对于检索用户来说,由于最终检索结果少,精确度高,因此减少了浏览检索结果所需要的时间。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。在附图中附图说明图1为根据本专利技术的实施例的的流程图;图2为根据本专利技术的实施例的查询装置的结构图;以及图3为根据本专利技术的实施例的具体。具体实施例方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1为根据本专利技术的实施例的的流程图。通过以下步骤来描述100。在S102步骤中,从用户接收查询请求。在S104步骤中,根据查询请求,在第一数据源中进行第一查询,获取第一查询结果和与第一查询结果相对应的关联信息参数。具体地,关联信息为URL地址。在S106步骤中,根据关联参数信息,在第二数据源中进行第二查询并获得第二查询结果。具体地,第一数据源为文件系统,第二数据源为数据库;或者第一数据源为数据库,第二数据源为文件系统。其中,数据库存储有记录信息,文件系统存储有文本信息,记录信息与文本信息通过URL地址相关联。具体地,在建立文件系统和数据库时,通过URL地址将存储在数据库中的记录信息与存储在文本系统中的文本信息相关联。从而便于在查询时,第二查询根据与第一查询结果相关联的URL地址,在第二数据源中进行查询。在S108步骤中,将第一查询结果与第二查询结果汇总成最终查询结果反馈给用户。利用本专利技术的实施例的,根据与第一查询结果相关联的地址,在第二数据库中进行查询,减少了第二查询需要花费的时间,大大提高了第二查询的速度。此外,第二查询结果为与第一查询结果相关联地址URL处所存储的文本信息或记录信息,所以反馈给用户的结果根据关联程度从高至低的顺序进行排序,减少了用户查阅查询结果所需要的时间,从而提高了用户的查询效率。图2为根据本专利技术的实施例的查询装置的结构图。该查询系统包括多个数据库DB和多个文件系统。数据库存储有记录信息,文件系统存储有文本信息,存储在数据库中的记录信息与存储在文件系统中的文本信息通过URL地址相关联。图2所示虚线箭头表示首先进行数据库查询,然后进行文本检索的,而图2所示实线箭头表示首先进行文本检索,然后进行数据库查询的。当数据库DB和文件系统分别存储在多个服务器上时,即,当数据库DB存储在多个数据库服务器上,而文本系统存储在多个文本系统服务器上时,该还包括并行查询,即,对多个数据库服务器和/或多个文本系统服务器进行并行查询,从而大幅减少了查询时间,提高了查询效率。然后,查询服务器用于将文本内容和数据库记录汇总成最终查询结果。例如,当今社会,非结构化数据占数据总量的80%,所以从非结构化数据中挖掘出有用的信息就显得尤为重要,而很多我们所关心的已知的信息均记录在数据库系统中,较为迫切的需求是将从非结构化数据中提取的有用信息和存储在数据库系统的记录关联起来得到我们所关心的较为确切的查询结果,本专利技术是将社区网络中海量的结构化数据和非结构化数据(主要是文本)进行关联查询,并得到相应用户信息记录或是发布内容的一种实现装置。图3为根据本专利技术的实施例的具体。参照图3,将详细描述本专利技术的实施例的具体。在步骤302中,从用户接收查询请求。具体地,用户可以通过诸如键盘的输入装置输入查询请求或者通过鼠标的输入装置在列表中选择查询请求。在步骤304中,当查询请求所包含的查询信息与数据库中的记录信息相对应时,第一查询为数据库查询,第二查询为文本检索,第一查询结果为记录信息,第二查询结果为文本信息。具体地,文本信息可以包括文本内本文档来自技高网...
【技术保护点】
一种查询方法,其特征在于,包括:从用户接收查询请求;根据所述查询请求,在第一数据源中进行第一查询,获取第一查询结果和与所述第一查询结果相对应的关联信息参数;根据所述关联参数信息,在第二数据源中进行第二查询并获得第二查询结果;以及将第一查询结果与第二查询结果汇总成最终查询结果反馈给所述用户。
【技术特征摘要】
1.一种查询方法,其特征在于,包括 从用户接收查询请求; 根据所述查询请求,在第一数据源中进行第一查询,获取第一查询结果和与所述第一查询结果相对应的关联信息参数; 根据所述关联参数信息,在第二数据源中进行第二查询并获得第二查询结果;以及 将第一查询结果与第二查询结果汇总成最终查询结果反馈给所述用户。2.根据权利要求1所述的查询方法,其特征在于,所述关联信息为URL地址。3.根据权利要求2所述的查询方法,其特征在于,所述第一数据源为文件系统,所述第二数据源为数据库;或者 所述第一数据源为数据库,所述第二数据源为文件系统。4.根据权利要求3所述的查询方法,其特征在于,所述数据库存储有记录信息,所述文件系统存储有文本信息,所述记录信息与所述文本信息通过所述URL地址相关联。5.根据权利要求4所述的查询方法,其特征在于,当所述查询请求所包含的查询信息与所述数据库中的所述记录信息相...
【专利技术属性】
技术研发人员:狄静舒,宋怀明,王颖,苗艳超,刘新春,邵宗有,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。