对UOF文档进行转换的方法技术

技术编号:32771746 阅读:57 留言:0更新日期:2022-03-23 19:27
本发明专利技术提供了对UOF文档进行转换的方法,其包括对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出;对文档解析输出进行样式分析,从而得到关于ODF文档的文档属性数据;对文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对文档样式属性数据和文档分节属性数据进行转换处理,从而得到与所述ODF文档对应的UOF文档;并在文档外部接口的层面上,构建关于UOF文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对UOF文档的二次开发和转换处理;最后在用户界面上显示对所述UOF文档进行转换处理的实时信息,从而实现对UOF文档进行批量转换和二次开发。批量转换和二次开发。批量转换和二次开发。

【技术实现步骤摘要】
对UOF文档进行转换的方法


[0001]本专利技术涉及文档转换处理的
,特别涉及对UOF文档进行转换的方法。

技术介绍

[0002]UOF(Uified office document Format)文档是基于XML的开放式文档格式,其又被称作“标文通”文档。在对UOF文档进行转换的过程中存在文档解析出错以及转换内容无法打开的问题。同时现有的UOF文档转换技术存在转换速度慢且无法进行二次开发的问题,这导致无法对UOF文档进行批量转换和二次开发,从而严重影响UOF文档的转换体验感。

技术实现思路

[0003]针对现有技术存在的缺陷,本专利技术提供对UOF文档进行转换的方法,其包括对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出;对文档解析输出进行样式分析,从而得到关于ODF文档的文档属性数据;对文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对文档样式属性数据和文档分节属性数据进行转换处理,从而得到与所述ODF文档对应的UOF文档;并在文档外部接口的层面上,构建关于UOF文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对UOF文档的二次开发和转换处理;最后在用户界面上显示对所述UOF文档进行转换处理的实时信息,其在基础层、转换层、外部接口层和用户界面层这四个层面上对UOF文档进行转换,从而实现对UOF文档进行批量转换和二次开发。
[0004]本专利技术提供对UOF文档进行转换的方法,其特征在于,其包括如下步骤:
[0005]步骤S1,对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出;
[0006]步骤S2,对所述文档解析输出进行样式分析,从而得到关于所述ODF文档的文档属性数据;对所述文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对所述文档样式属性数据和所述文档分节属性数据进行转换处理,从而得到与所述ODF文档对应的UOF文档;
[0007]步骤S3,在文档外部接口的层面上,构建关于所述UOF文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对所述UOF文档的二次开发和转换处理;
[0008]步骤S4,在用户界面上显示对所述UOF文档进行转换处理的实时信息;
[0009]进一步,在所述步骤S1中,对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出具体包括:
[0010]步骤S101,基于开源代码Zip Utils设计形成文档解压缩模块,并利用所述文档解压缩模块对所述ODF文档进行解压处理,从而得到所述ODF文档包含XML文档;
[0011]步骤S102,基于开源项目Xerces C++设计形成SAX解析模块,并利用所述SAX解析模块对所述XML文档进行解析处理,从而得到相应的文档解析输出;
[0012]进一步,在所述步骤S102中,利用所述SAX解析模块对所述XML文档进行解析处理,从而得到相应的文档解析输出具体包括:
[0013]利用所述SAX解析模块对所述XML文档进行解析处理,以此对所述XML文档进行逐行扫描和解析处理,从而得到相应的XML文档解析结果和文档静态表,以此作为所述文档解析输出;
[0014]进一步,在所述步骤S2中,对所述文档解析输出进行样式分析,从而得到关于所述ODF文档的文档属性数据具体包括:
[0015]对所述文档解析输出进行样式分析,从而得到所述ODF文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;
[0016]再定义getID函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值;
[0017]进一步,在所述步骤S2中,对所述文档解析输出进行样式分析,从而得到所述ODF文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;再定义getID函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值具体包括:
[0018]所述文档中的不同属性的数据在进行连接时会在不同属性的数据中间存在一串连接符,根据所述连接符能够将所述文档解析输出分割成多个属性数据,接着根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,然后再定义getID函数以此根据归为一类的属性数据中每个字节的属性定义得到其对应的属性编号值,其具体过程为:
[0019]步骤S201,利用下面公式(1),根据所述连接符将所述文档解析输出分割成多个属性数据,
[0020]其中1≤i≤m

n+1
ꢀꢀꢀꢀ
(1)
[0021]在上述公式(1)中,μ
i
表示所述解析输出的文档中第i个字节处属于分割点的判定值;D
i+a
表示所述文档解析输出中第i+a个字节的二进制形式数值;P
1+a
表示所述连接符的第1+a个字节的二进制形式数值;n表示所述连接符的字节总数;m表示所述文档解析输出的字节总数;
[0022]将i的值从1取值到m

n+1得到所有满足μ
i
=0的i值,在所述所有满足μ
i
=0的i值处的字节与其上一个字节的中间处作为分割点,对所述文档解析输出进行分割,分割完成后得到多个属性数据;
[0023]步骤S202,通过上述步骤S201分割得到的多个属性数据,每个属性数据内部中每个字节的属性定义都是一致的,并且每个属性定义的名称也是由多个字节构成,利用下面公式(2),根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,
[0024]其中r1≠r2(2)
[0025]在上述公式(2)中,H(r1,r2)表示分割完成后的第r1个属性数据与第r2个属性数据能否归为一类的判定值;T
r1,e
表示分割完成后的第r1个属性数据的属性定义名称中的第e个字节的二进制形式数值;T
r2,e
表示分割完成后的第r2个属性数据的属性定义名称中的第e个字节的二进制形式数值;B
r1
表示分割完成后的第r1个属性数据的属性定义名称中的
字节总数;B
r2
表示分割完成后的第r2个属性数据文档的属性定义名称中的字节总数;min()表示求取括号内的最小值;
[0026]若H(r1,r2)≠0,表示分割完成后的第r1个属性数据与第r2个属性数据中字节的属性定义名称不同,即不能进行合并;
[0027]若H(r1,r2)=0,表示分割完成后的第r1个属性数据与第r2个属性数据中字节的属性定义名称相同,即能够进行合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.对UOF文档进行转换的方法,其特征在于,其包括如下步骤:步骤S1,对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出;步骤S2,对所述文档解析输出进行样式分析,从而得到关于所述ODF文档的文档属性数据;对所述文档属性数据进行预处理,从而得到相应文档样式属性数据和文档分节属性数据;再对所述文档样式属性数据和所述文档分节属性数据进行转换处理,从而得到与所述ODF文档对应的UOF文档;步骤S3,在文档外部接口的层面上,构建关于所述UOF文档的动态链接库、可执行文件库、注册表和日志系统,从而实现对所述UOF文档的二次开发和转换处理;步骤S4,在用户界面上显示对所述UOF文档进行转换处理的实时信息。2.如权利要求1所述的对UOF文档进行转换的方法,其特征在于:在所述步骤S1中,对ODF文档进行解压处理和解析处理,从而得到相应的文档解析输出具体包括:步骤S101,基于开源代码Zip Utils设计形成文档解压缩模块,并利用所述文档解压缩模块对所述ODF文档进行解压处理,从而得到所述ODF文档包含XML文档;步骤S102,基于开源项目Xerces C++设计形成SAX解析模块,并利用所述SAX解析模块对所述XML文档进行解析处理,从而得到相应的文档解析输出。3.如权利要求2所述的对UOF文档进行转换的方法,其特征在于:在所述步骤S102中,利用所述SAX解析模块对所述XML文档进行解析处理,从而得到相应的文档解析输出具体包括:利用所述SAX解析模块对所述XML文档进行解析处理,以此对所述XML文档进行逐行扫描和解析处理,从而得到相应的XML文档解析结果和文档静态表,以此作为所述文档解析输出。4.如权利要求1所述的对UOF文档进行转换的方法,其特征在于:在所述步骤S2中,对所述文档解析输出进行样式分析,从而得到关于所述ODF文档的文档属性数据具体包括:对所述文档解析输出进行样式分析,从而得到所述ODF文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;再定义getID函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值。5.如权利要求4所述的对UOF文档进行转换的方法,其特征在于:在所述步骤S2中,对所述文档解析输出进行样式分析,从而得到所述ODF文档包含的段落属性数据、文字属性数据、大纲属性数据、表格属性数据和图像属性数据;再定义getID函数对所述段落属性数据、所述文字属性数据、所述大纲属性数据、所述表格属性数据和所述图像属性数据进行处理,从而生成所述段落属性数据、所述文字属性数据、所述表格属性数据和所述图像属性数据各自对应的属性编号值具体包括:所述文档中的不同属性的数据在进行连接时会在不同属性的数据中间存在一串连接符,根据所述连接符能够将所述文档解析输出分割成多个属性数据,接着根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,然后再定义getID函数以此根据归为一类的属性数据中每个字节
的属性定义得到其对应的属性编号值,其具体过程为:步骤S201,利用下面公式(1),根据所述连接符将所述文档解析输出分割成多个属性数据,其中1≤i≤m

n+1(1)在上述公式(1)中,μ
i
表示所述解析输出的文档中第i个字节处属于分割点的判定值;D
i+a
表示所述文档解析输出中第i+a个字节的二进制形式数值;P
1+a
表示所述连接符的第1+a个字节的二进制形式数值;n表示所述连接符的字节总数;m表示所述文档解析输出的字节总数;将i的值从1取值到m

n+1得到所有满足μ
i
=0的i值,在所述所有满足μ
i
=0的i值处的字节与其上一个字节的中间处作为分割点,对所述文档解析输出进行分割,分割完成后得到多个属性数据;步骤S202,通过上述步骤S201分割得到的多个属性数据,每个属性数据内部中每个字节的属性定义都是一致的,并且每个属性定义的名称也是由多个字节构成,利用下面公式(2),根据每个属性数据中每个字节的属性定义将属性定义相同的属性数据归为一类,其中r1≠r2
ꢀꢀꢀꢀ
(2)在上述公式(2)中,H(r1,r2)表示分割完成后的第r1个属性数据与第r2个属性数据能否归为一类的判定值;T
r1,e
表示分割完成后的第r1个属性数据的属性定义名称中的第e个字节的二进制形式数值;T
r2,e
表示分割完成后的第r2个属性数据的属性定义名称中的第e个字节的二进制形式数值;B
r1
...

【专利技术属性】
技术研发人员:王丹星周韩钰余丹
申请(专利权)人:慧之安信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1