用于转换PDF文档的方法、装置、终端及介质制造方法及图纸

技术编号:26172116 阅读:52 留言:0更新日期:2020-10-31 13:47
本申请公开了一种用于转换PDF文档的方法、装置、终端及介质。其中方法包括:基于待转换处理的html页面,确定html页面对应的dom元素;将dom元素转换为html画布元素;将html画布元素转换为待转换图片;判断待转换图片是否需要进行分页处理;依据判断结果,将待转换图片转换为PDF文档。本申请通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。

【技术实现步骤摘要】
用于转换PDF文档的方法、装置、终端及介质
本申请涉及计算机
,具体涉及一种用于转换PDF文档的方法、装置、终端及介质。
技术介绍
随着web技术的快速发展,浏览器得到普遍应用,尤其是将网页页面转换为PDF文档的浏览器。相关的PDF转换方法因在后台完成转换,因此,转换得到的PDF文档并无法保留html页面的样式;同时,在html页面较为复杂时,转换得到的PDF文档易出现格式错误以及对PDF文档进行打印后的文件不符合用户观看习惯的问题。
技术实现思路
为了解决上述至少一个技术问题,本申请提供一种用于转换PDF文档的方法、装置、终端及介质。根据本申请的第一方面,提供了一种用于转换PDF文档的方法,该方法包括:基于待转换处理的html页面,确定html页面对应的dom元素;将dom元素转换为html画布元素;将html画布元素转换为待转换图片;判断待转换图片是否需要进行分页处理;依据判断结果,将待转换图片转换为PDF文档。根据本申请的第二方面,提供了一种用于转换PDF文档的装置,该装置包括:页面元素确定模块,用于基于待转换处理的html页面,确定html页面对应的dom元素;画布转换处理模块,用于将dom元素转换为html画布元素;图片转换处理模块,用于将html画布元素转换为待转换图片;图片分页判断模块,用于判断待转换图片是否需要进行分页处理;文档转换处理模块,用于依据判断结果,将待转换图片转换为PDF文档。根据本申请的第三方面,提供了一种终端,该终端包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时以实现上述用于转换PDF文档的方法。根据本申请的第四方面,提供了一种计算机可读存储介质,该介质存储有计算机可执行指令,该计算机可执行指令用于以执行上述用于转换PDF文档的方法。本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。图1为本申请实施例提供的一种用于转换PDF文档的方法的流程示意图;图2为本申请实施例提供的一种用于转换PDF文档的方法中进行PDF转换处理的流程示意图;以及图3为根据本申请实施例提供的一种用于转换PDF文档的装置的框图结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。根据本申请的一个实施例,提供了一种用于转换PDF文档的方法,如图1所示,该方法包括步骤S101至步骤S105。步骤S101:基于待转换处理的html页面,确定html页面对应的dom元素。具体地,浏览器基于待转换处理的html页面,确定html页面对应的dom元素。具体地,浏览器可以通过预设的交互界面或预设的转换控件来检测用户对html页面的操作。例如,若检测到将待转换处理的html页面转换为PDF文档的操作,则将该操作指向的html页面作为待处理的html页面。具体地,浏览器可以依据预设的dom模型来对html页面进行元素提取,得到html页面的各个元素,即得到html页面对应的dom元素。其中,html页面对应的dom元素一般以树形结构进行存储。步骤S102:将dom元素转换为html画布元素。具体地,浏览器可以采用html2canvas库对dom元素进行转换,以得到html画布元素。具体地,可以采用预设的画布参数,如高度height属性和宽度width属性,以依据这两个参数将dom元素转换为html画布元素。步骤S103:将html画布元素转换为待转换图片。具体地,浏览器可以采用html2canvas库提供的转换方法(如toDataURL)将html画布元素转换为待转换图片。具体地,可以根据预设的图片尺寸将html画布元素转换为待转换图片。步骤S104:判断待转换图片是否需要进行分页处理。具体地,可以预设多种打印参数来判断待转换图片是否需要进行分页处理。其中,打印参数一般根据打印纸张来确定。例如,若待打印纸张大小为A4纸,那么以A4纸的大小来判断待转换图片是否需要进行分页处理。步骤S105:依据判断结果对待转换图片进行PDF转换处理,得到PDF文档。具体地,根据预设的图片与PDF文档间的转换方法对待转换图片进行PDF转换处理。例如,采用JSPDF方法将待转换图片转换为PDF文档。具体地,已对待转换图片进行分页处理,那么PDF文档包括多个PDF分页,否则仅包括一个PDF分页。本申请实施例通过确定待转换处理的html页面对应的dom元素,将dom元素转换为html画布元素,从而将html画布元素转换为待转换图片,判断待转换图片是否需要进行分页处理,依据判断结果对待转换图片进行PDF转换处理,得到PDF文档,通过将html页面对应的dom元素经过两次转换,将html页面转换为图片,以图片形式保留html页面的特征,使得转换得到的PDF文档保留html页面的视图样式,避免了将html页面直接转换为PDF文档导致的信息遗漏甚至转换异常问题;同时,通过对待转换图片分页处理,使得PDF文档符合用户的查看习惯,方便了用户对PDF文档的打印。在一些实施例中,步骤S104进一步包括:确定待转换图片的图片尺寸;依据图片尺寸和预设的打印尺寸,判断待转换图片是否需要进行分页处理。具体地,可以依据多种纸张来提供多种打印尺寸。例如,根据A4纸的大小,确定预设的打印尺寸。在一些实施例中,如图2所示,步骤S105进一步包括:步骤S1051:若图片尺寸大于打印尺寸,则将待转换图片分割为至少两个子图片;步骤S1052:依据至少两个子图片,生成至少两个PDF本文档来自技高网...

【技术保护点】
1.一种用于转换PDF文档的方法,其特征在于,包括:/n基于待转换处理的html页面,确定所述html页面对应的dom元素;/n将所述dom元素转换为html画布元素;/n将所述html画布元素转换为待转换图片;/n判断所述待转换图片是否需要进行分页处理;/n依据判断结果对所述待转换图片进行PDF转换处理,得到PDF文档。/n

【技术特征摘要】
1.一种用于转换PDF文档的方法,其特征在于,包括:
基于待转换处理的html页面,确定所述html页面对应的dom元素;
将所述dom元素转换为html画布元素;
将所述html画布元素转换为待转换图片;
判断所述待转换图片是否需要进行分页处理;
依据判断结果对所述待转换图片进行PDF转换处理,得到PDF文档。


2.权利要求1所述的方法,其特征在于,所述判断所述待转换图片是否需要进行分页处理的步骤,包括:
确定所述待转换图片的图片尺寸;
依据所述图片尺寸和预设的打印尺寸,判断所述待转换图片是否需要进行分页处理。


3.权利要求2所述的方法,其特征在于,所述依据判断结果对所述待转换图片进行PDF转换处理的步骤,包括:
若所述图片尺寸大于所述打印尺寸,则将所述待转换图片分割为多个子图片;
依据多个所述子图片,生成多个PDF分页;
将多个所述PDF分页合并处理为所述PDF文档。


4.权利要求3所述的方法,其特征在于,所述依据多个所述子图片,生成多个PDF分页的步骤,包括:
基于所述dom元素,确定所述html页面的页头和页尾;
将所述页头和所述页尾插入至多个所述PDF分页。


5.权利要求1所述的方法,其特征在于,所述基于待转换处理的html页面,确定html画布元素的步骤之前,所述...

【专利技术属性】
技术研发人员:陈炼抄
申请(专利权)人:深圳市中农易讯信息技术有限公司深圳市中农网有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1