【技术实现步骤摘要】
文件的修复方法、装置、终端设备和可读存储介质
[0001]本申请属于修复
,尤其涉及一种文件的修复方法
、
装置
、
终端设备和可读存储介质
。
技术介绍
[0002]PDF(Portable Document Format)
,即可携带文件格式,是一种通用的文档格式,其具有格式稳定,兼容性好,体积小,方便网络传输等优点,因此受到广泛使用
。PDF
文件通常包括文件头
、
文件体
、
交叉引用表及文件尾等结构,其中,文件体是多个对象块的集合
。
在相关技术中,当
PDF
文件发生损坏时,无法对
PDF
文件进行修复,以使其能正常打开
。
技术实现思路
[0003]本申请实施例提供一种文件的修复方法
、
装置
、
终端设备和可读存储介质,可以解决相关技术无法对损坏的
PDF
文件进行修复的问题
。
[0004]第一方面,本申请实施例提供了一种文件的修复方法,包括:
[0005]获取待修复文件,待修复文件为损坏的
PDF
文件;
[0006]提取待修复文件中的缺失对象块集合,缺失对象块集合为待修复文件中剩余的对象块组成的集合;
[0007]对缺失对象块集合进行解析,得到缺失逻辑对象块集合和对应的缺失数据对象块集合,其中,缺失逻辑对象块集合与对缺失数 ...
【技术保护点】
【技术特征摘要】
1.
一种文件的修复方法,其特征在于,包括:获取待修复文件,所述待修复文件为损坏的
PDF
文件;提取所述待修复文件中的缺失对象块集合,所述缺失对象块集合为所述待修复文件中剩余的对象块组成的集合;对所述缺失对象块集合进行解析,得到缺失逻辑对象块集合和对应的缺失数据对象块集合,其中,所述缺失逻辑对象块集合与对所述缺失数据对象块集合中对应的对象块之间存在引用关系;对所述缺失逻辑对象块集合进行补充,得到完整逻辑对象块集合;修改所述完整逻辑对象块集合中的完整逻辑对象块的引用关系,得到修改后的完整逻辑对象块集合,并基于所述修改后的完整逻辑对象块集合以及所述缺失数据对象块集合得到完整对象块集合;基于所述完整对象块集合生成对应的交叉引用表和文件尾;基于新创建的文件头
、
所述完整对象块集合
、
所述交叉引用表以及所述文件尾生成修复文件,所述修复文件为修复好的
PDF
文件
。2.
如权利要求1所述的文件的修复方法,其特征在于,所述缺失逻辑对象块集合包括父亲逻辑对象块以及孩子逻辑对象块,所述对所述缺失逻辑对象块集合进行补充,得到完整逻辑对象块集合,包括:补充所述缺失逻辑对象块集合中的父亲逻辑对象块;补充所述缺失逻辑对象块集合中的孩子逻辑对象块;基于所述缺失逻辑对象块集合
、
所述父亲逻辑对象块以及所述孩子逻辑对象块得到完整逻辑对象块集合
。3.
如权利要求2所述的文件的修复方法,其特征在于,所述缺失逻辑对象块集合包括
page
对象块,所述补充所述缺失逻辑对象块集合中的父亲逻辑对象块,包括:基于所述
page
对象块的父亲引用关系寻找所述
page
对象块的父亲逻辑对象块;当所述缺失逻辑对象块集合中不存在所述
page
对象块的父亲逻辑对象块时,基于所述
page
对象块的父亲引用关系创建所述
page
对象块的父亲逻辑对象块
。4.
如权利要求2所述的文件的修复方法,其特征在于,所述缺失逻辑对象块集合包括
pages
对象块,所述补充所述缺失逻辑对象块集合中的父亲逻辑对象块,还包括:基于所述
pages
对象块的父亲引用关系寻找所述
pages
对象块的父亲逻辑对象块;当所述缺失逻辑对象块集合中不存在所述
pages
对象块的父亲逻辑对象块时,基于所述
pages
对象块的父亲引用关系创建所述
pages
对象块的父亲逻辑对象块
。5.
如权利要求2所述的文件的修复方法,其特征在于,所述缺失逻辑对象块集合包括
pages
对象块,所述补充所述缺失逻辑对象块集合中的孩子逻辑对象块,包括:基于所述
pages
...
【专利技术属性】
技术研发人员:孙丽,
申请(专利权)人:深圳软牛科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。