一种图像编码方法、图像解压方法以及装置制造方法及图纸

技术编号：34838378 阅读：44 留言：0更新日期：2022-09-08 07:34

本申请提供了人工智能领域中涉及计算机视觉的一种图像编码方法、图像解压方法以及装置，用于结合自回归模型和自编码模型的输出进行编码，降低所需模型的大小，提高编解码效率。该图像编码方法包括：将输入图像作为自回归模型的输入，输出第一图像；获取第一图像和输入图像之间的残差，得到第一残差图像；并且，还将输入图像作为自编码模型的输入，输出隐变量和第一残差分布，隐变量包括从输入图像中提取到的特征，第一残差分布包括自编码模型输出的输入图像中各个像素点对应的残差值；对第一残差图像和第一残差分布进行编码，得到残差编码数据；对隐变量进行编码，得到隐变量编码数据，隐变量编码数据和残差编码数据用于解压后得到输入图像。输入图像。输入图像。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像编码方法、图像解压方法以及装置

[0001]本申请涉及图像处理领域，尤其涉及一种图像编码方法、图像解压方法以及装置。

技术介绍

[0002]图像在各个领域使用广泛，在大量场景中都可能涉及到图像的传输或保存等。且随着图像的分辨率越高，在保存图像时所需要的存储空间消耗也就越多，在传输图像时所需的带宽也就越高，传输效率也就越低。因此，通常，为了便于图像的传输或者保存，可以对图像进行压缩，从而降低图像所占的比特数量，进而减少保存图像所需的存储空间以及传输图像所需的带宽。
[0003]例如，在一些常用的图像压缩方式中，可以采用熵编码的方式来进行图像压缩，如常用的熵编码算法有霍夫曼编码，算术编码，ANS编码等来进行图像压缩。然而，多种熵编码方式的压缩率均已达到最优，很难再进一步提高压缩率。因此，如何提高编解码效率，成为亟待解决的问题。

技术实现思路

[0004]本申请提供一种图像编码方法、图像解压方法以及装置，用于结合自回归模型和自编码模型的输出进行编码，降低所需模型的大小，提高编解码效率。
[0005]有鉴于此，第一方面，本申请提供一种图像编码方法，包括：将输入图像作为自回归模型的输入，输出第一图像；获取第一图像和输入图像之间的残差，得到第一残差图像；将输入图像作为自编码模型的输入，输出隐变量和第一残差分布，隐变量包括从输入图像中提取到的特征，第一残差分布包括自编码模型预测的用于表示输入图像中各个像素点和第一残差图像中各个像素点对应的残差值；对第一残差图像和第一残差分布进行编码，得到残差...

【技术保护点】

【技术特征摘要】
1.一种图像编码方法，其特征在于，包括：将输入图像作为自回归模型的输入，输出第一图像；获取所述第一图像和所述输入图像之间的残差，得到第一残差图像；将所述输入图像作为自编码模型的输入，输出隐变量和第一残差分布，所述隐变量包括从所述输入图像中提取到的特征，所述第一残差分布包括所述自编码模型输出的用于表示所述输入图像中各个像素点和所述第一残差图像中对应的各个像素点之间的残差值；对所述第一残差图像和所述第一残差分布进行编码，得到残差编码数据；对所述隐变量进行编码，得到隐变量编码数据，所述隐变量编码数据和所述残差编码数据用于解压后得到所述输入图像。2.根据权利要求1所述的方法，其特征在于，所述对所述第一残差图像和所述第一残差分布进行编码，得到残差编码数据，包括：将所述第一残差图像和所述第一残差分布作为半动态熵编码器的输入，输出所述残差编码数据，所述半动态熵编码器用于使用第一预设类型的编码运算进行熵编码，所述第一预设类型的编码运算包括加、减或位运算，且所述半动态熵编码器中不包括第二预设类型的编码运算，所述第二预设类型包括乘、除或取余运算中的至少一种。3.根据权利要求1所述的方法，其特征在于，所述对所述隐变量进行编码，得到残差编码数据，包括：将所述隐变量作为静态熵编码器的输入，得到所述隐变量编码数据。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述自编码模型包括编码模型和解码模型，所述将所述输入图像作为自编码模型的输入，输出隐变量和第一残差分布，包括：将所述输入图像作为所述编码模型的输入，输出所述隐变量，所述编码模型用于从所述输入图形中提取特征；将所述隐变量作为所述解码模型的输入，得到所述第一残差分布，所述解码模型用于预测输入的图像与对应的像素分布之间的残差值。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述自回归模型用于使用已预测的像素点的像素值预测处于同一连线上的像素点的值。6.一种图像解压方法，其特征在于，包括：获取隐变量编码数据和残差编码数据，所述隐变量编码数据为编码端从输入图像中提取到的特征进行编码得到，所述残差编码数据包括对所述输入图像与自回归模型前向传播输出的图像之间的残差进行编码得到的数据；对所述隐变量编码数据进行解码，得到隐变量，所述隐变量包括所述输入图像中提取的特征；将所述隐变量作为自编码模型的输入，输出第二残差分布；结合所述第二残差分布和所述残差编码数据进行解码，得到第二残差图像；将所述第二残差图像作为自回归模型的反向传播的输入，输出解压图像。7.根据权利要求6所述的方法，其特征在于，所述对所述隐变量编码数据进行解码，得到隐变量，包括：将所述隐变量编码数据作为静态熵编码器的输入，输出所述隐变量。
8.根据权利要求6或7所述的方法，其特征在于，所述结合所述第二残差分布和所述残差编码数据进行解码，得到第二残差图像，包括：将所述第二残差分布和所述残差编码数据作为半动态熵编码器的输入，输出所述第二残差图像，所述半动态熵编码器用于使用第一预设类型的编码运算进行熵编码，所述第一预设类型的编码运算包括加、减或位运算，且所述半动态熵编码器中不包括第二预设类型的编码运算，所述第二预设类型包括乘、除或取余运算中的至少一种。9.根据权利要求6
‑
8中任一项所述的方法，其特征在于，所述将所述第二残差图像作为自回归模型的反向传播的输入，输出解压图像，包括：通过所述自回归模型，对所述第二残差图像中处于同一连线上的像素点进行并行解码，得到所述解压图像。10.一种图像编码装置，其特征在于，包括：自回归模块，用于将输入图像作为自回归模型的输入，输出第一图像，所述自回归模型；残差计算模块，用于获取所述第一图像和所述输入图像之间的残差，得到第一残差图像；自编码模块，用于将所述输入图像作为自编码模型的输入，输出隐变量和第一残差分布，所述隐变量包括从所述输入图像中提取到的特征，所述第一残差分布包括所述自编码模型输出的用于表示所述输入图像中各个像素点和所述第一残差图像中对应的各个像素点之间的残差值；残差编码模块，...

【专利技术属性】
技术研发人员：康宁，仇善召，张鸣天，张世枫，李震国，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人