【技术实现步骤摘要】
本专利技术涉及一种,属于网络数据处理
技术介绍
传统的关系数据库和可扩展标记语言(eXtensible Markup Language,以下简称XML)文档数据库的查询处理方法主要是利用结构化查询语言(Structured Query Language,以下简称SQL)和XML查询语言(以下简称XQuery)进行查询。首先,对非专业的数据库用户来说,这些语言很难理解和掌握;第二,这些查询语言都需要复杂的数据库模式的支持。因此,传统的数据库查询方法虽然强大,但是对大多数用户来说并不友好。随着大量可扩展标记语言文档数据的出现,可扩展标记语言不再单纯的是为了增强应用程序对从网络上获得的文档的解释和操作能力,它已经逐步成为网上数据交换和数据表示的事实标准,而如何有效地存储和查询这些可扩展标记语言文档数据成为数据库界研究的一个热点问题。当前,关键字搜索已被广泛用于文本文档查询和万维网上的数据检索,数据库研究人员已经注意到了关键字搜索的便利之处,而且已经在关系数据库和可扩展标记语言文档数据库中引入了关键字搜索技术。目前,解决可扩展标记语言文档数据关键字搜索的有效方法之一就是在可扩展标记语言文档树中找出相关关键字的全部的最小共同祖先(Lowest Common Ancestor,简称LCA)。文献“L.Guo,F.Shao,C.Botev,and J.Shanmugasundaram.XRANKRanked KeywordSearch over XML Documents.In Proceedings of the 2003 ACM SIGMOD Inte ...
【技术保护点】
一种将可扩展标记语言文档树转化为紧凑查询树的方法,其特征在于该方法包括以下步骤:(1)根据用户给定的关键字集合遍历可扩展标记语言文档树,删除树中不包含用户给定关键字的内容结点和孤立结点,得到可扩展标记语言文档查询树;(2)遍 历上述可扩展标记语言文档查询树,删除其中只有一个孩子结点的结构结点,并保持该结构结点的孩子结点与该结构结点的父亲结点之间的连接路径。
【技术特征摘要】
1.一种将可扩展标记语言文档树转化为紧凑查询树的方法,其特征在于该方法包括以下步骤(1)根据用户给定的关键字集合遍历可扩展标记语言文档树,删除树中不包含用户给定关键字的内容结点和...
【专利技术属性】
技术研发人员:李国良,冯建华,王建勇,塔娜,周立柱,
申请(专利权)人:清华大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。