可扩展标记语言文件存储及插入关系数据库表的方法技术

技术编号：2863044 阅读：274 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种可扩展标记语言文件存储方法，包括步骤将模式间的依赖关系存放在关系数据库系统表中；为可扩展标记语言文件中的每一个名称空间创建一个映射文件；为映射文件中每一个复杂类型、全局元素以及出现不止一次的简单类型元素分别生成一个与其对应的关系数据库表；将可扩展标记语言文件的元素值及其属性值插入与其对应的数据库表中。一种可扩展标记语言文件元素值插入关系数据库表的方法包括步骤获取可扩展标记语言文件所属的可扩展标记语言文件模式；根据模式所定义的名称空间从数据库中读出可扩展标记语言文件的数据库映射文件；遍历可扩展标记语言文件，将可扩展标记语言文件元素值插入相应的关系数据库表中。占用存储空间小且高效查询。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及可扩展标记语言领域，尤指一种。
技术介绍
随着Internet的迅猛发展，xml(Extensible Markup Language，可扩展标记语言)作为Internet上数据表示的新标准，以其具有的自描述性、灵活性、扩展性和平台无关性等优势，正在被广泛的应用于各种Web应用中。如何对xml文件进行存储，才能有效地对其数据进行管理成为当今研究的热点。近年来许多研究工作致力于将数据库技术应用于xml文件的存储上，利用数据库成熟的技术来存储xml文件。目前主流的xml数据库形式是利用关系数据库来存储xml文件，例如Oracle9i、SQL Server 2000等关系数据库。当前用关系型数据库存储xml文件最常见的有两种方法一种就是将xmlSchema(xml模式)映射到关系数据库模式；另一种方法就是将整个文件保存为一个CLOB(character large obiect，字符大对象)字段。两种方法各有优劣，采用前一种方法，xml Schema被映射为数据库中多个相互关联的表存储xml文件后对其进行查询时将导致多表连接，使得查询效率很低，并且在重组xml层次结构时不仅效率较低而且很难恢复原样，没有很好的“往返”性(存储的xml文档和返回的xml文档的一致性)。采用后一种方法存储xml文件，由于xml文件中使用了大量的标签，大量的标签会占用很多存储空间，因而采用该方法会浪费大量的存储空间，据统计，平均在40％左右，同时该方法虽然保存了xml文件的数据内容和层次结构，但SQL查询不能深入到文件的字段，查询文件部分的唯一方法是将整个...

【技术保护点】
一种可扩展标记语言文件存储方法，其特征在于，包括下述步骤：１０）将模式间的依赖关系存放在关系数据库系统表中；２０）为可扩展标记语言文件中的每一个名称空间创建一个映射文件，所述映射文件包括该模式中所有的复杂类型、简单类型、全局元素以及相应子元素；　３０）为映射文件中每一个复杂类型、全局元素以及出现不止一次的简单类型元素分别生成一个与其对应的关系数据库表，其所包含子元素和出现小于等于一次的简单类型作为与其对应的关系数据库表中的字段；４０）将可扩展标记语言文件的元素值及其属性值插入与其对应的数据库表中。

【技术特征摘要】

【专利技术属性】
技术研发人员：李安渝，严兵，傅朝霞，秦良娟，丁蔚，耿建光，秦怀平，董胜涛，
申请(专利权)人：中国科学院软件研究所，神州数码软件有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人