文件压缩处理方法、装置、设备及介质制造方法及图纸

技术编号:38043780 阅读:10 留言:0更新日期:2023-06-30 11:10
本发明专利技术公开了文件压缩处理方法、装置、设备及介质。方法包括:若接收到用户输入的初始文件,根据预置的分段规则对初始文件包含的数据进行拆分,得到对应的多组拆分数据;计算各组拆分数据之间的文件字节相似度,得到相似度信息;根据预设的配置表获取与相似度信息相匹配的目标索引策略;根据目标索引策略对各组拆分数据分别进行数据压缩,得到对应的多组压缩数据;对多组压缩数据与目标索引策略的标识信息进行组合,得到压缩文件。通过上述方法,基于计算得到的相似度信息匹配最优的索引策略以对文件进行压缩处理,从而可大幅提高文件压缩处理的效率,缩短文件压缩处理耗时。缩短文件压缩处理耗时。缩短文件压缩处理耗时。

【技术实现步骤摘要】
文件压缩处理方法、装置、设备及介质


[0001]本专利技术涉及文件压缩
,尤其涉及一种文件压缩处理方法、装置、设备及介质。

技术介绍

[0002]为提高文件传输及存储效率,减小文件存储所需空间或减小文件传输所需时间,可对文件进行压缩处理。现有技术方法中通常针采用特定压缩处理方式对文件进行压缩处理,或根据用户选择的压缩方式对文件进行压缩处理。现有压缩方法由于通常选择特定压缩方式进行处理,导致压缩速率较慢。因此,现有的技术方法对文件进行压缩处理存在压缩效率较低的问题。

技术实现思路

[0003]本专利技术实施例提供了一种文件压缩处理方法、装置、设备及介质,旨在解决现有技术方法对文件进行压缩处理所存在的压缩效率较低的问题。
[0004]第一方面,本专利技术实施例提供了一种文件压缩处理方法,所述方法包括:若接收到用户输入的初始文件,根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据;计算各组所述拆分数据之间的文件字节相似度,得到相似度信息;根据预设的配置表获取与所述相似度信息相匹配的目标索引策略;根据所述目标索引策略对各组所述拆分数据分别进行数据压缩,得到对应的多组压缩数据;对所述多组压缩数据与所述目标索引策略的标识信息进行组合,得到压缩文件。
[0005]第二方面,本专利技术实施例提供了一种文件压缩处理装置,其中,所述装置包括:拆分单元,用于若接收到用户输入的初始文件,根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据;相似度信息获取单元,用于计算各组所述拆分数据之间的文件字节相似度,得到相似度信息;目标索引策略获取单元,用于根据预设的配置表获取与所述相似度信息相匹配的目标索引策略;数据压缩处理单元,用于根据所述目标索引策略对各组所述拆分数据分别进行数据压缩,得到对应的多组压缩数据;压缩文件获取单元,用于对所述多组压缩数据与所述目标索引策略的标识信息进行组合,得到压缩文件。
[0006]第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述计算机设备执行所述计算机程序时实现如上述第一方面所述的文件压缩处理方法。
[0007]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如上述第一方面所述的文件压缩处理方法。
[0008]本专利技术实施例提供了一种文件压缩处理方法、装置、设备及介质。方法包括:若接收到用户输入的初始文件,根据预置的分段规则对初始文件包含的数据进行拆分,得到对应的多组拆分数据;计算各组拆分数据之间的文件字节相似度,得到相似度信息;根据预设的配置表获取与相似度信息相匹配的目标索引策略;根据目标索引策略对各组拆分数据分别进行数据压缩,得到对应的多组压缩数据;对多组压缩数据与目标索引策略的标识信息进行组合,得到压缩文件。通过上述方法,基于计算得到的相似度信息匹配最优的索引策略以对文件进行压缩处理,从而可大幅提高文件压缩处理的效率,缩短文件压缩处理耗时。
附图说明
[0009]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本专利技术实施例提供的文件压缩处理方法的流程示意图;图2为本专利技术实施例提供的文件压缩处理装置的示意性框图;图3为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0011]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0012]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和
ꢀ“
包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0013]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0014]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0015]请参阅图1,图1为本专利技术实施例提供的文件压缩处理方法的流程示意图;该文件压缩处理方法应用于终端设备中,该文件压缩处理方法通过安装于终端设备中的应用软件进行执行;终端设备即是用于执行文件压缩处理方法以实现对文件进行压缩处理的设备,如台式电脑、笔记本电脑、平板电脑或手机等,终端设备还可以是企业内部所构建的服务器端。如图1所示,该方法包括步骤S110~S150。
[0016]S110、若接收到用户输入的初始文件,根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据。
[0017]若接收到用户输入的初始文件,根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据。用户可输入初始文件至终端设备,初始文件也即是未进行压缩处理的文件,初始文件可以是视频、图像、文本等类型的文件。终端设备可根据分段规则对初始文件包含的数据进行拆分,初始文件包含的数据信息在计算机的存储介质中均以“1”和“0”的二进制形式进行存储,则可对初始文件的数据信息进行拆分,从而得到多组拆分数据。
[0018]在一实施例中,步骤S110包括以下步骤:根据分段规则中的编码方式对所述初始文件包含的数据进行编码,得到编码数据;根据所述分段规则中的拆分长度对所述编码数据进行拆分,得到与所述拆分长度对应的多组拆分数据。
[0019]可首先根据分段规则中的编码方式对初始文件包含的数据进行编码,例如,编码方式为十六进制,则可将初始文件包含的二进制数据进行编码转换为十六进制的编码数据。
[0020]之后再根据拆分长度对编码数据进行拆分,则除最后一组拆分数据之外,每一组拆分数据所包含的数据量均与拆分长度相等。
[0021]例如,拆分长度为1000,则除最后一组拆分数据之外,每一组拆分数据中所包含的字符数量均为1000。
[0022]在一实施例中,步骤S110包括以下步骤:根据分段规则中的编码方式对所述初始文件包含的数据进行编码,得到编码数据;根据所述分段规则中的拆分长度及重叠系数对所述编码数据进行拆分,得到与所述拆分长度对应的多组拆分数据;相邻两组拆分数据之间包含的重叠数据量为拆分长度与重叠系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件压缩处理方法,其特征在于,所述方法包括:若接收到用户输入的初始文件,根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据;计算各组所述拆分数据之间的文件字节相似度,得到相似度信息;根据预设的配置表获取与所述相似度信息相匹配的目标索引策略;根据所述目标索引策略对各组所述拆分数据分别进行数据压缩,得到对应的多组压缩数据;对所述多组压缩数据与所述目标索引策略的标识信息进行组合,得到压缩文件。2.根据权利要求1所述的文件压缩处理方法,其特征在于,所述根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据,包括:根据分段规则中的编码方式对所述初始文件包含的数据进行编码,得到编码数据;根据所述分段规则中的拆分长度对所述编码数据进行拆分,得到与所述拆分长度对应的多组拆分数据。3.根据权利要求1所述的文件压缩处理方法,其特征在于,所述根据预置的分段规则对所述初始文件包含的数据进行拆分,得到对应的多组拆分数据,包括:根据分段规则中的编码方式对所述初始文件包含的数据进行编码,得到编码数据;根据所述分段规则中的拆分长度及重叠系数对所述编码数据进行拆分,得到与所述拆分长度对应的多组拆分数据;相邻两组拆分数据之间包含的重叠数据量为拆分长度与重叠系数的乘积值。4.根据权利要求1所述的文件压缩处理方法,其特征在于,所述计算各组所述拆分数据之间的文件字节相似度,得到相似度信息,包括:分别计算相邻两组拆分数据之间的文件字节相似度得到对应的相似度值;对得到的所述相似度值进行数值统计,得到相似度信息。5.根据权利要求1所述的文件压缩处理方法,其特征在于,所述根据预设的配置表获取与所述相似度信息相匹配的目标索引策略,包括:将所述相似度信息中各项统计值与所述配置表中的索引策略进行匹配;获取与各项统计值均相匹配的索引策略作为目标索引策略。6.根据权利要求1...

【专利技术属性】
技术研发人员:王恺
申请(专利权)人:深圳市东信时代信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1