一种可扩展的XML数据节点标识号码的编码方法及装置制造方法及图纸

技术编号:7953658 阅读:217 留言:0更新日期:2012-11-08 23:03
本发明专利技术提供了一种可扩展的XML数据节点标识号码的编码方法及装置,其特征在于,包括:?存储一XML文档时,依照节点间关系为所述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID;当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的节点ID。本发明专利技术的技术方案可以支持XML节点标识编码的动态更新,通过小数位标识编码的产生和使用,在保持原有XML节点编码不变的情况下,实现了节点ID的可扩展,在节省存储空间的同时,提高了编码的效率。

【技术实现步骤摘要】

本专利技术涉及计算机
,特别涉及可扩展的XML数据节点标识号码的编码方法及装置
技术介绍
XML(全称 Extensible Markup Language),是一种专门为 internet 而设计的一种标记语言,且由于其具有有效的表达各种信息、数据和使各种应用协同工作的能力,业已成为数据发布和数据交换的事实标准,因此,XML在近几年得到了发展和广泛的应用。XML的重点不在于数据的形式本身,而在于管理数据信息,因此,XML使得不同数据库模式的统一成为可能,为异构数据库的集成问题提供了途径。XML数据库管理系统(XML数据库管理系统)也是近年来发展迅速的一种新型的数据库管理系统,它以存储和检索符合W3C标准的 XML文档数据为目标的数据库管理系统,并且可以更新XML文档。由于它存储的对象是XML文档库,因此XML数据库管理系统本质上就是一种XML文档库。XML数据库管理系统(XML数据库管理系统)是近年来快速发展的一种新型的数据库管理系统(DBMS),它存储和检索的数据是XML文档,并且支持更新XML文档。随着XML标准被越来越多的行业采纳为数据交换标准,XML数据的管理(存储,检索,更新等)需求会持续快速增长,特别是XML数据库管理系统比关系数据库管理系统更加适合处理文本类数据和XML文档数据。而关系数据库管理系统由于已经在IT行业广泛应用了几十年,不论在市场还是技术方面其主导地位不可撼动,并且相比XML数据库管理系统,关系数据库管理系统在处理关系数据时更加有优势。所以未来的DBMS市场上面,XML数据库管理系统将与关系数据库管理系统(关系数据库管理系统)长期并存。在各种企业和其他单位中,将出现XML数据库管理系统和关系数据库管理系统长期共存并且协同工作的状况。在XML数据库管理系统中,XML文档的存储方法主要有两种一种是直接将XML文档存储到XML数据库管理系统中。此种方法的优点在于操作上简单易行,但是如果要对XML文档进行节点级的操作则一般较为困难。另一种是将XML文档中的数据按照节点进行解析并存储。这种存储方法非常利于对XML文档进行节点级的操作,但实现起来比较复杂。针对节点级的存储方式,为了方便节点的查找和修改,在节点数据存储时,需要对节点进行标识和编码。每一个节点通过编码得到一个可唯一标识的代码(NODE-ID),在节点查找时就能快速辨别和定位。由于XML数据库管理系统中存储的XML文档内容可能非常巨大,所以节点的数目也就可能非常多。而且,通过XQUERY UPDATE,节点之间还可能增加新的节点。因此,对节点ID的编码方式的就要达到两个要求要尽量少的占用存储的空间;能在不改变现有节点的标识编码的情况下载两个节点之间方便的插入若干新的节点。
技术实现思路
为解决上述问题,本专利技术技术方案提供的一种可扩展的XML数据节点标识号码的编码方法,包括存储一 XML文档时,依照节点间关系为所述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID ;当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的节点ID。可选地,所述新增节点的节点ID为整数位字符串编码加上所述小数位字符串编码。可选地,所述新增节点的整数位字符串编码与同级的前一节点的整数位字符串编码相同。可选地,所述新增节点的整数位字符串编码与同级的后一节点的整数位字符串编 码相同。本专利技术还提供了一种XML数据节点标识号码的编码装置,包括整数位字符串编码模块,用于在存储一 XML文档时,依照节点间关系为所述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID ;小数位字符串编码模块,用于当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的节点ID。可选地,所述新增节点的节点ID为整数位字符串编码加上所述小数位字符串编码。可选地,所述新增节点的整数位字符串编码与同级的前一节点的整数位字符串编码相同。可选地,所述新增节点的整数位字符串编码与同级的后一节点的整数位字符串编码相同。与现有技术相比,上述技术方案具有下优点本专利技术的技术方案可以支持XML节点标识编码的动态更新,通过小数位标识编码的产生和使用,在保持原有XML节点编码不变的情况下,实现了节点ID的可扩展,在节省存储空间的同时,提高了编码的效率。附图说明图I是本专利技术实施方式的可扩展的XML数据节点标识号码的编码方法的的流程图;图2是本专利技术实施方式的可扩展的XML数据节点标识号码的编码装置的组成结构框架示意图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。在以下描述中阐述了具体细节以便于充分理解本专利技术。但是本专利技术能够以多种不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广。因此本专利技术不受下面公开的具体实施方式的限制。本领域的技术人员知道,一种是直接将XML文档存储到XML数据库管理系统中。另一种是将XML文档中的数据按照节点进行解析并存储。对于前一种方法来说,此种方法的优点在于操作上简单易行,但是如果要对XML文档进行节点级的操作则一般较为困难。对于后一种XML文档存储方法来说,其利于对XML文档进行节点级的操作,但实现起来比较复杂。针对节点级的存储方式,为了方便节点的查找和修改,在节点数据存储时,需要对节点进行标识和编码。每一个节点通过编码得到一个可唯一标识的代码(NODE-ID),在节点查找时就能快速辨别和定位。由于XML数据库管理系统中存储的XML文档内容可能非常巨大,所以节点的数目也就可能非常多。而且,通过XQUERY UPDATE,节点之间还可能增加新的节点。因此,对节点ID的编码方式的就要达到两个要求要尽量少的占用存储的空间;能在不改变现有节点的标识编码的情况下载两个节点之间方便的插入若干新的节点。为解决现有技术中的问题,本专利技术的专利技术人经过研究,提出了一种关系数据库管 理系统与XML数据库管理系统之间数据交换的方法。参阅图1,图I是本专利技术实施方式的关系数据库管理系统与XML数据库管理系统之间数据交换的方法的流程图。本专利技术实施方式的关系数据库管理系统与XML数据库管理系统之间数据交换的方法,包括存储一 XML文档时,依照节点间关系为所述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID ;当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的节点ID。下面结合具体的实例来对本专利技术进行进一步详细的阐述本专利技术提出的一种可扩展的XML数据节点标识号码的编码方法中所采用变长的的编码格式,具体如下 “整数位”字节长度η“整数位”字符串编码小数位字符串编码长度I字节 η字节编码总长度-η-1例如下面的XML文档< xml version="1.0" encoding="ISO-8859-l" >夺节点 I <book categoiy="COOKING">4-节点 2 〈title lang本文档来自技高网
...

【技术保护点】
一种可扩展的XML数据节点标识号码的编码方法,其特征在于,包括:??存储一XML文档时,依照节点间关系为所述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID;当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的节点ID。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵伟郑程光孙伟丰罗正海李泉李浩李书淦程仁波
申请(专利权)人:上海方正数字出版技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1