基于语义和特征码的XML Schema生成方法技术

技术编号:23889783 阅读:24 留言:0更新日期:2020-04-22 05:59
本发明专利技术公开的基于语义和特征码的XML Schema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema。本发明专利技术基于语义和特征码的XML Schema生成方法,不需要考虑更新和维护,利用数据元和代码集的特性,只是改变了XML Schema生成的流程,却极大的优化了XML Schema生成的效率,减少了工作量,也不再需要专人维护XML Schema。

XML schema generation method based on semantics and signature

【技术实现步骤摘要】
基于语义和特征码的XMLSchema生成方法
本专利技术属于电子政务平台数据交换
,具体涉及一种基于语义和特征码的XMLSchema生成方法。
技术介绍
无论是用于交换的数据元还是代码集,最终都是要在数据交换XML中被使用,电子政务XML文档是以目前国内外通用的XML语言来描述数据交换的信息,它使用自定义的标签和树形结构,能够根据实际需要进行扩展;同时逻辑性也很强,对于人机都有很好的可读性。为了解决“信息孤岛”,各异构子系统能够无缝对接处理信息数据,XML交换文档中的内容必须有一定的约束。XMLSchema主要用于验证XML语言的描述从及属性,验证的条件来自于数据元和代码集,数据交换最重要的就是提出高效的XMLSchema生成方法。在传统的XMLSchema生成方式中,首先需要生成一套通用的XMLSchema,然后根据传输的内容人工对XMLSchema进行调整,所有将要交换的数据必须有定义,否则XMLSchema无法对其描述。送种方式生成的XMLSchema需要工作量大且效率很低,而且一旦成型后轻易不能更改,拓展性极差,一旦交换数据有了变化,XMLSchema需要重新制定。
技术实现思路
本专利技术的目的在于提供一种基于语义和特征码的XMLSchema生成方法,能够大幅优化XMLSchema的生成效率。本专利技术所采用的技术方案是:基于语义和特征码的XMLSchema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XMLSchema集合成总体的XMLSchema,从而生成XMLSchema。本专利技术的特点还在于,具体包括以下步骤:步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应的信息,然后跳转至步骤1;步骤6:将抽取到约束条件按照规则生成XMLSchema;步骤7:利用XMLSchema实现对该数据的验证。数据元的数据类型为表1所示。表1数据元类型数据元包括性别数据元,为表2所示。表2性别数据元中文名称:姓名数据类型:string数据长度:50值域:备注:代码集包括性别代码集,为表3所示。表3性别代码集本专利技术的有益效果是:本专利技术基于语义和特征码的XMLSchema生成方法,不需要考虑更新和维护,因为每一次数据传输都是生成新的XMLSchema,只要能够在XML数据和数据元、代码集中建立关联,就能够生成任意的XMLSchema。这种方法利用数据元和代码集的特性,只是改变了XMLSchema生成的流程,却极大的优化了XMLSchema生成的效率,减少了工作量,也不再需要专人维护XMLSchema。具体实施方式下面结合具体实施方式对本专利技术进行详细说明。本专利技术提供了一种基于语义和特征码的XMLSchema生成方法,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XMLSchema集合成总体的XMLSchema,从而生成XMLSchema。通过上述方式,本专利技术一种基于语义和特征码的XMLSchema生成方法不需要考虑更新和维护,因为每一次数据传输都是生成新的XMLSchema,只要能够在XML数据和数据元、代码集中建立关联,就能够生成任意的XMLSchema。这种方法利用数据元和代码集的特性,只是改变了XMLSchema生成的流程,却极大的优化了XMLSchema生成的效率,减少了工作量,也不再需要专人维护XMLSchema。本专利技术具体包括以下步骤:步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应的信息,然后跳转至步骤1;步骤6:将抽取到约束条件按照规则生成XMLSchema;步骤7:利用XMLSchema实现对该数据的验证。数据元是数据交换中最基本的交换内容,所有在交换中出现的内容都会在数据元中被描述,制定统一标准的数据元是解决异构电子政务平台最基础的措施。数据元是对所有内容的名、型、值属性进行了描述和约束,有了统一标准的数据元之后,所有的数据就不会因为数据格式的问题而无法交换,数据元一般由对象类词、特性类词和表示三部分组成。数据元的数据类型如表1所示。表1数据元类型数据元的制定必须遵守统一规划的原则,并将这些原则在数据交换的标准中体现出来。数据元的属性如果在国标中己经有涉及需要遵守国标的规定,否则会影响标准么间的兼容性和复用性。此外,制定数据元的标准还需参考行业内其他标准,尽量保持一致。为了在数据交换中不引起理解上的偏差,必须有唯一的标识,类似于数据库中的唯一索引,这样才能确保数据元的唯一性,在该电子政务系统中,唯一的标识就是数据元的英文名称,姓名这一数据元的示例如表2所示。表2性别数据元中文名称:姓名数据类型:string数据长度:50值域:备注:数据元只是对数据交换中出现的数据有了统一的描述,有些内容虽然能够用数据元描述,比如性别,但是性别的类别则需要代码集来表示。电子政务代码集主要用于描述在电子政务数据交换过程中使用到的代码,它是对应数据元值域范围的集合,通过代码集能够统一和规范电子政务信息共享中的数踞编码,提高数据交换的效率。表3性别代码集代码集与数据元一样,在制定的过程中同样要参考国家标准和行业标准,尽量与国标和行标保持一致,在此基础上进行进一步开发,保证与其他标准的兼容性。制定代码集的规范同样需要本文档来自技高网...

【技术保护点】
1.基于语义和特征码的XML Schema生成方法,其特征在于,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XML Schema集合成总体的XML Schema,从而生成XML Schema。/n

【技术特征摘要】
1.基于语义和特征码的XMLSchema生成方法,其特征在于,通过找出XML中元素的标签名称对应的数据元和代码集,然后将根据数据元和代码集的规范生成相应的每一个元素的XMLSchema集合成总体的XMLSchema,从而生成XMLSchema。


2.如权利要求1所述的基于语义和特征码的XMLSchema生成方法,其特征在于,具体包括以下步骤:
步骤1:确定将要进行交换的XML数据,同时在数据元和代码集中查询关于该XML数据的规定和解释;
步骤2:查询数据元中是否存在该数据的定义,如果存在则将定义抽取出来后跳转至步骤3,不存在则直接跳转至步骤3;
步骤3:查询代码集中是否存在该数据的编码,如果存在则将定义编码抽取出来后跳转至步骤4,不存在则直接跳转至步骤4;
步骤4:查看该XML是否至少存在定义或者编码中的某一种约束条件,如果结果为真,则跳转至步骤6,若果结果为假,则跳转至步骤5;
步骤5:XML数据在数据元和代码集中均不存在,则需要在数据元或者代码集中视情况添加相应...

【专利技术属性】
技术研发人员:孙涛
申请(专利权)人:西安鼎蓝通信技术有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1