基于模式图的关键字查询改进方法技术

技术编号：8387216 阅读：244 留言：0更新日期：2013-03-07 07:52

本发明专利技术公开了一种基于模式图的关键字查询改进方法，它包括以下步骤：步骤1．IR引擎模块借助于索引从数据库表导出需要的元组集，候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入，生成一组候选网络，并把候选网络作为输出；步骤2．查询日志挖掘模块使用已有的树挖掘算法来对用户的查询日志进行挖掘，以获取用户偏好的频繁模式树；步骤3．利用树编辑距离来定义步骤1生成的候选网络与步骤2挖掘得到的频繁模式树的相似度，生成频繁模式树的相似度；步骤4．跟据步骤1生成的候选网络与步骤3生成的频繁子树的相似度对生成的候选网络进行排序并优先求解排位靠前的候选网络，以此来改进查询的质量和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据库上的关键字查询，属于计算机应用领域，尤其涉及一种。
技术介绍
数据库系统是用来组织、存储和管理数据的仓库，它在企业、部门乃至个人的日常生产生活等诸多领域都得到了广泛的应用。随着现代互联网的迅速发展，信息呈现爆炸式增长，数据库系统存储的信息不断增多，用户搜索这些信息的需求也日益激增。传统的数据库访问方式需要用户掌握结构化的查询语言，了解并且熟悉底层的数据模式，而这对于大多数的普通用户来说是非常复杂的。受到关键字查询在Web搜索引擎上获得巨大成功的影响，近些年来在数据库支持关键字查询得到了来自数据库领域和信息检索领域研究人员的广泛关注并且成为新兴的研究热点。不同于传统的数据库查询方式，数据库上的关键字查询简单易用，查询没有固定的格式限制，极大地减轻了用户学习和记忆的压力。但是这也给如何开发一个高效健壮的关键字查询系统带来了巨大挑战。具体表现如下BI.传统的数据库查询的结果是一组孤立的元组，而关键字查询则需要从数据库的不同表中组合与关键字匹配的元组来形成最终结果，这会导致查询的搜索空间急剧膨胀。一般来讲，关键字查询的搜索空间与查询中的关键字数目成指数型关系。2、关键字查询经常是脏的，用户的查询中经常包含一些不相关或者不正确的词，而通常这些脏查询会对随后的查询处理的效率和准确性产生负面的影响。
技术实现思路
本专利技术的目的就是为了解决上述问题，提供了一种。为了实现上述目的，本专利技术采用如下技术方案，包括以下步骤步骤I. IR引擎模块借助于IR索引从数据库导出需要的元组集，候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入，生成...

【技术保护点】
基于模式图的关键字查询改进方法，其特征是，它包括以下步骤：步骤1.IR引擎模块借助于IR索引从数据库导出需要的元组集，候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入，生成一组候选网络并用自由树的形式表示，并把表示后的候选网络作为输出；步骤2．查询日志挖掘模块使用已有的树挖掘算法来对用户的查询日志进行挖掘，以获取用户偏好的频繁模式树；步骤3．利用树编辑距离来定义步骤1输出的候选网络与步骤2挖掘得到的频繁模式树的相似度，生成频繁模式树的相似度；步骤4、跟据步骤1输出的候选网络与步骤3生成的频繁子树的相似度对生成的候选网络进行排序并优先求解排位靠前的候选网络。

【技术特征摘要】

【专利技术属性】
技术研发人员：禹晓辉，高磊，彭朝晖，闫中敏，杨敏，
申请(专利权)人：山东大学，山东英佰德信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人