一种网页表格转PDF文件的方法技术

技术编号:37611598 阅读:10 留言:0更新日期:2023-05-18 12:03
本发明专利技术涉及网页内容转换技术领域,尤其涉及一种网页表格转PDF文件的方法,根据网页表格的表格线交点坐标的数量确定的网页表格的结构复杂度计算选取表格线交点坐标的坐标数量占比,根据结构复杂度和坐标数量占比确定的坐标间连线的连贯度检测参量选取合适的检测步长,以及根据坐标数量占比选取相邻的表格线交点坐标的检测交点坐标范围,提取检测交点坐标范围的表格线交点坐标的坐标间连线,并根据检测步长对坐标间连线进行检测,获得网页表格的坐标间连线的连贯度,并根据坐标间连线的连贯度确定的等比例缩放系数对网页表格进行等比例缩放,避免了网页浏览器不兼容导致的网页表格显示异常问题,从而提高了网页表格转PDF文件的格式准确率。文件的格式准确率。文件的格式准确率。

【技术实现步骤摘要】
一种网页表格转PDF文件的方法


[0001]本专利技术涉及网页内容转换
,尤其涉及一种网页表格转PDF文件的方法。

技术介绍

[0002]在当前的网络环境中,许多网络平台会收录并展示论文、报表、花名册等附带大量的表格数据信息,用户往往会选择将这些网页表格转为PDF文件以方便作为表格模板进而方便日后直接使用,但是不同的浏览器对网页的兼容性不同,浏览器打印的效果不尽相同,表格格式的准确性更是难以保证。

技术实现思路

[0003]本专利技术旨在至少解决相关技术中存在的技术问题之一。为此,本专利技术提供一种网页表格转PDF文件的方法,包括以下步骤:步骤S1,获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度G,并根据所述结构复杂度G与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比;步骤S2,根据所述结构复杂度G和坐标数量占比确定坐标间连线的连贯度检测参量W,根据所述坐标间连线的连贯度检测参量W与预设坐标间连线的连贯度检测参量的对比结果确定检测步长;步骤S3,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围;步骤S4,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度C;步骤S5,根据所述坐标间连线的连贯度C确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放;步骤S6,将调整后的所述网页表格转为PDF文件。
>[0004]进一步地,在所述步骤S1中,所述表格线交点坐标包括单向垂直交点坐标、双向垂直交点坐标以及十字交叉垂直交点坐标。进一步地,在所述步骤S1中,通过公式(1)计算所述结构复杂度G,
[0005]其中,Na表示所述单向垂直交点坐标数量,Na0表示单向垂直交点坐标数量的对比参量,Nb表示所述双向垂直交点坐标数量,Nb0表示双向垂直交点坐标数量的对比参量,Nc表示十字交叉垂直交点坐标数量,Nc0表示十字交叉垂直交点数量的对比参量。进一步地,在所述步骤S1中,所述坐标数量占比包括第一坐标数量占比P1、第二坐标数量占比P2以及第三坐标数量占比P3,所述预设结构复杂度包括第一预设结构复杂度G1和第二预设结构复杂度G2,设定P1<P2<P3且G1<G2,
若G<G1,确定所述坐标数量占比为P1;若G1≤G<G2,确定所述坐标数量占比为P2;
[0006]若G2≤G,确定所述坐标数量占比为P3。进一步地,在所述步骤S2中,通过公式(2)计算所述坐标间连线的连贯度检测参量W,
[0007]其中i=1,2,3。进一步地,在所述步骤S2中,所述预设坐标间连线的连贯度检测参量包括第一预设坐标间连线的连贯度检测参量W1和第二预设坐标间连线的连贯度检测参量W2,所述检测步长包括第一检测步长L1、第二检测步长L2以及第三检测步长L3,设定W1<W2且L1>L2>L3,若W<W1,确定所述检测步长为L1;若W1≤W<W2,确定所述检测步长为L2;
[0008]若W2≤W,确定所述检测步长为L3。进一步地,在所述步骤S4中,通过公式(3)计算所述坐标间连线的连贯度C,
[0009]其中,表示第k个所述坐标间连线的不连贯位置数量,表示第k个所述坐标间连线的长度,表示第k个所述坐标间连线的检测步长,j=1,2,3;表示所述坐标间连线的数量。
[0010]进一步地,在所述步骤S5中,根据所述坐标间连线的连贯度C与预设坐标间连线的连贯度的对比结果确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放。进一步地,所述预设坐标间连线的连贯度包括第一预设坐标间连线的连贯度C1和第二预设坐标间连线的连贯度C2,所述等比例缩放系数包括第一等比例缩放系数K1和第二等比例缩放系数K2,设定C1<C2且110%<K1<K2<120%,若C1≤C≤C2,确定所述等比例缩放系数为K1;若C<C1,确定所述等比例缩放系数为K2;
[0011]若C>C2,确定不对所述网页表格进行等比例缩放。
[0012]本专利技术实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度,并根据所述结构复杂度与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比,提高了对网页表格调整分析的准确性。
[0013]进一步地,根据所述结构复杂度和坐标数量占比确定坐标间连线的连贯度检测参量,根据所述坐标间连线的连贯度检测参量与预设坐标间连线的连贯度检测参量的对比结
果确定检测步长,进一步提高了对网页表格调整分析的准确性。
[0014]进一步地,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围,提高了所述检测交点坐标范围选取的精准度,从而进一步提高了对网页表格调整分析的准确性。
[0015]进一步地,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度,避免了网页浏览器不兼容导致的网页表格显示异常问题,保证了网页表格能够以正常表格形式导出成PDF,从而提高了网页表格转PDF文件的格式准确率。
[0016]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0017]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术提供的网页表格转PDF文件的方法的步骤流程图。
[0019]图2是本专利技术提供的网表格转PDF文件的方法中所述的表格线交点坐标位置示意图。
[0020]附图标记:1

单向垂直交点坐标,2

双向垂直交点坐标,3

十字交叉垂直交点坐标。
具体实施方式
[0021]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。以下实施例用于说明本专利技术,但不能用来限制本专利技术的范围。
[0022]在本专利技术实施例的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术实施例和简化描述,而不是指示或暗示所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种网页表格转PDF文件的方法,其特征在于,包括以下步骤:步骤S1,获取网页表格的表格线交点坐标,根据所述表格线交点坐标的数量确定所述网页表格的结构复杂度G,并根据所述结构复杂度G与预设结构复杂度的对比结果确定选取所述表格线交点坐标的坐标数量占比;步骤S2,根据所述结构复杂度G和坐标数量占比确定坐标间连线的连贯度检测参量W,根据所述坐标间连线的连贯度检测参量W与预设坐标间连线的连贯度检测参量的对比结果确定检测步长;步骤S3,根据所述坐标数量占比选取相邻的所述表格线交点坐标的检测交点坐标范围;步骤S4,提取所述检测交点坐标范围的所述表格线交点坐标的坐标间连线,根据所述检测步长对所述坐标间连线进行检测,获得所述网页表格的坐标间连线的连贯度C;步骤S5,根据所述坐标间连线的连贯度C确定所述网页表格的等比例缩放系数,并根据所述等比例缩放系数对所述网页表格进行等比例缩放;步骤S6,将调整后的所述网页表格转为PDF文件。2.根据权利要求1所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,所述表格线交点坐标包括单向垂直交点坐标、双向垂直交点坐标以及十字交叉垂直交点坐标。3.根据权利要求2所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,通过公式(1)计算所述结构复杂度G,其中,Na表示所述单向垂直交点坐标数量,Na0表示单向垂直交点坐标数量的对比参量,Nb表示所述双向垂直交点坐标数量,Nb0表示双向垂直交点坐标数量的对比参量,Nc表示十字交叉垂直交点坐标数量,Nc0表示十字交叉垂直交点数量的对比参量。4.根据权利要求3所述的网页表格转PDF文件的方法,其特征在于,在所述步骤S1中,所述坐标数量占比包括第一坐标数量占比P1、第二坐标数量占比P2以及第三坐标数量占比P3,所述预设结构复杂度包括第一预设结构复杂度G1和第二预设结构复杂度G2,设定P1<P2<P3且G1<G2,若G<G1,确定所述坐...

【专利技术属性】
技术研发人员:王心安
申请(专利权)人:智麟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1