用于存储器中数据压缩的基于内容的分段模式及包括等级分段表示的传输制造技术

技术编号：3908220 阅读：153 留言：0更新日期：2012-04-11 18:40

在一编码系统中，对系统中的输入数据编码。该输入数据可包括在输入数据中重复的或出现在系统中编码的其它输入数据中的符号序列。该编码包括确定一目标段尺寸，确定一窗口尺寸，在输入数据的偏移处标识符号窗口中的指纹，确定是否要将偏移指定成切割点并按该组切割点所指定的对输入数据分段。对这样标识的各段，编码器确定该段是否会是引用的段或未引用的段，必要时，用引用标签替换各引用的段的分段数据并将引用绑定存储在用于各引用的段的连续段存储器中。按等级，可以通过将引用分成组，用分组标签替换分组的引用，存储一个分组的引用和分组标签之间的绑定来重复该过程，如果一个没有呈现，并重复该过程。等级的级数可以预先固定或从编码的内容确定。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
用于存储器中数据压縮的基于内容的分段模式及包括等级分段表示的传输本专利技术专利申请是国际申请号为PCT/US2003/034327，国际申请日为2003 年10月28日，进入中国国家阶段的申请号为200380104909.1，名称为"用于存储器中数据压縮的基于内容的分段模式及包括等级分段表示的传输"的专利技术专利申请的分案申请。相关申请的交叉引用美国专利申请号10/285,315，名称"用于客户机一服务器通信系统的处理加速器"(以下为"McCanneI")和本申请同日递交，通过参考包括在此。
技术介绍
本专利技术通常涉及数据压縮，特别是涉及用于压縮的分段。数据压縮可用于更有效地存储和传输数据。数据压縮是将输入数据表示成压縮数据的过程，使压縮数据包括比输入数据更少的位或符号且可以将该压縮数据解压縮成至少是原始输入数据的合适的近似值。压缩允许更有效的数据传输，因为需要发送给接收方用来恢复原始的那组位(正好或近似地)的位更少了，且压縮允许更有效的存储，因为需要存储的位更少了。"压縮比"指原始数据中位或符号数与压縮数据中位或符号数的比。例如如果IOO字节的数据序列可由5字节的数据表示，则在该例中的压縮比为20:1。如果不需要确切地恢复输入数据，则可采用所谓的"有损压縮"，通常导致比"无损压縮"更大的压縮比。在压縮会是透明的典型应用中，压縮应为无损的。基于结构和输入内容的统计的压縮数据是常见的。典型的压縮器参考输入中的符号值、输入中特定符号值的位置、输入中各符号值之间的关系以及输入数据源的预期属性来接收输入数据流或数据块并生成压縮的数据流或数据块...

【技术保护点】
一种用于存储数据的方法，包括：　在服务器处从客户机接收一文件；　将所述文件分段为一个或多个段；　形成一列表，包括：　确定每一段是否存在于段存储器中，其中存在于所述段存储器中的段具有分配的引用标签；　对于存在于所述段存储器中的每一段，向所述列表中添加所述分配的引用标签；以及　对于不存在于所述段存储器中的每一段，将一引用标签分配给所述段，存储所述段和引用标签，并将所述引用标签添加到所述列表；以及　存储所述文件和所述列表之间的关联。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：S麦克坎尼，MJ德玛，
申请(专利权)人：河床技术股份有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人