模板数据的压缩方法、装置、设备及存储介质制造方法及图纸

技术编号:35974853 阅读:11 留言:0更新日期:2022-12-17 22:42
本申请实施例提供了一种模板数据的压缩方法、装置、设备及存储介质,该模板数据的压缩方法,包括:获取模板数据;通过预设数据转换算法对模板数据进行重复字符聚集转换,得到字符串;通过预设数据编码算法对字符串进行编码,得到数据序列串;根据预设索引压缩算法压缩存储数据序列串,得到压缩后的模板数据;本申请实施例能够解决现有技术中压缩后的模板数据所占存储空间较大的问题。所占存储空间较大的问题。所占存储空间较大的问题。

【技术实现步骤摘要】
模板数据的压缩方法、装置、设备及存储介质


[0001]本申请属于软件开发领域,尤其涉及一种模板数据的压缩方法、装置、设备及存储介质。

技术介绍

[0002]目前的软件开发多使用组件化、模板化的方式,对于一些输出可配置化模板的软件,比如海报编辑器、网页可视化编辑器等,往往需要存储大量的配置模板数据,现有的模板数据存储流程如图1所示。这类信息包含大量相同或相似的属性信息,同时对于冒号、逗号、分号等字符的使用率较高,具有大体量、高相似、高重复的特点。
[0003]现阶段,随着用户不断增加,自定义模板数据也会不断膨胀,软件必将面对海量数据所带来的较高存储空间需求。而目前现有技术并未针对模板数据特征设计出具备针对性的压缩方法,仍旧采用常规压缩软件对其进行压缩,如WinRar,WinZip等,导致压缩后的模板数据所占存储空间较大。

技术实现思路

[0004]本申请实施例提供一种模板数据的压缩方法、装置、设备及存储介质,能够解决现有技术中压缩后的模板数据所占存储空间较大的问题。
[0005]第一方面,本申请实施例提供一种模板数据的压缩方法,包括:
[0006]获取模板数据;
[0007]通过预设数据转换算法对模板数据进行重复字符聚集转换,得到字符串;
[0008]通过预设数据编码算法对字符串进行编码,得到数据序列串;
[0009]根据预设索引压缩算法压缩存储数据序列串,得到压缩后的模板数据。
[0010]进一步地,在一种实施例中,方法还包括:
[0011]根据预设后缀数组构造算法对数据序列串进行后缀数组构造,得到后缀数组;
[0012]每隔预设个数据对后缀数组进行采样,得到采样数组;
[0013]将采样数据确定为索引数据,用于在被查询时与查询输入数据比对。
[0014]进一步地,在一种实施例中,预设数据转换算法,包括:
[0015]Burrows Wheeler transform算法。
[0016]进一步地,在一种实施例中,预设数据编码算法,包括:
[0017]哈夫曼编码算法。
[0018]进一步地,在一种实施例中,预设索引压缩算法,包括:
[0019]RRR压缩索引结构。
[0020]第二方面,本申请实施例提供一种模板数据的压缩装置,包括:
[0021]获取模块,用于获取模板数据;
[0022]转换模块,用于通过预设数据转换算法对模板数据进行重复字符聚集转换,得到字符串;
[0023]编码模块,用于通过预设数据编码算法对字符串进行编码,得到数据序列串;
[0024]压缩存储模块,用于根据预设索引压缩算法压缩存储数据序列串,得到压缩后的模板数据。
[0025]进一步地,在一种实施例中,装置还包括:
[0026]构造模块,用于根据预设后缀数组构造算法对数据序列串进行后缀数组构造,得到后缀数组;
[0027]采样模块,用于每隔预设个数据对后缀数组进行采样,得到采样数组;
[0028]确定模块,用于将采样数据确定为索引数据,用于在被查询时与查询输入数据比对。
[0029]进一步地,在一种实施例中,预设数据转换算法,包括:
[0030]Burrows Wheeler transform算法。
[0031]第三方面,本申请实施例提供一种模板数据的压缩设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现如权利要求至中任一项的模板数据的压缩方法。
[0032]第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有信息传递的实现程序,程序被处理器执行时实现如权利要求至中任一项的模板数据的压缩方法。
[0033]本申请实施例的模板数据的压缩方法、装置、设备及存储介质,针对模板数据高相似、高重复的特点,采用预设数据转换算法对模板数据进行重复字符聚集转换,降低重复字节存储比例,有效提升原模板数据的可压缩性;结合预设数据编码算法、构建小波树、预设索引压缩算法对重复字符聚集转换后的模板数据进行压缩,进一步提升模板数据的可压缩性,压缩后的模板数据所占存储空间较小;并且由于预设数据转换算法和小波树的数据处理时间复杂度均较低,使得压缩耗时较少。
附图说明
[0034]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本申请实施例提供的一种现有的模板数据存储流程示意图;
[0036]图2是本申请实施例提供的一种模板数据的压缩方法的流程示意图;
[0037]图3是本申请实施例提供的一种小波树的结构示意图;
[0038]图4是本申请实施例提供的一种模板数据的压缩装置的结构示意图;
[0039]图5是本申请实施例提供的一种模板数据的压缩设备的结构示意图。
具体实施方式
[0040]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下
实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0041]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0042]现有模板数据压缩方法存在如下弊端:
[0043](1)通用数据压缩软件未能充分考虑模板数据高相似、高重复的特点,导致重复数据占用大量存储空间,压缩效率较低;
[0044](2)纯压缩软件无法在未解压情况下进行属性查询,简单的查询操作需要进行全文本解压,严重影响软件运行效率;
[0045](3)模板数据往往体量较大,且随软件发展会越增越多,如果不进行压缩必定会遇到存储有限的问题,进行压缩又会导致无法查询,无法保证软件的长期可用性。
[0046]为了解决现有技术问题,本申请实施例提供了一种模板数据的压缩方法、装置、设备及存储介质。本申请实施针对模板数据高相似、高重复的特点,采用预设数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模板数据的压缩方法,其特征在于,包括:获取模板数据;通过预设数据转换算法对所述模板数据进行重复字符聚集转换,得到字符串;通过预设数据编码算法对所述字符串进行编码,得到数据序列串;根据预设索引压缩算法压缩存储所述数据序列串,得到压缩后的所述模板数据。2.如权利要求1所述的模板数据的压缩方法,其特征在于,所述方法还包括:根据预设后缀数组构造算法对所述数据序列串进行后缀数组构造,得到后缀数组;每隔预设个数据对所述后缀数组进行采样,得到采样数组;将所述采样数据确定为索引数据,用于在被查询时与查询输入数据比对。3.如权利要求1所述的模板数据的压缩方法,其特征在于,所述预设数据转换算法,包括:BWT算法。4.如权利要求1所述的模板数据的压缩方法,其特征在于,所述预设数据编码算法,包括:哈夫曼编码算法。5.如权利要求1所述的模板数据的压缩方法,其特征在于,所述预设索引压缩算法,包括:RRR压缩索引结构。6.一种模板数据的压缩装置,其特征在于,包括:获取模块,用于获取模板数据;转换模块,用于通过预设数据转换算法对所述模板数据进行重复字符聚集转换,得到字...

【专利技术属性】
技术研发人员:李新娱熊笛杨翼驹
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1