System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 自适应纬度感知变换编码的360°图像压缩方法及装置制造方法及图纸_技高网

自适应纬度感知变换编码的360°图像压缩方法及装置制造方法及图纸

技术编号:44130268 阅读:4 留言:0更新日期:2025-01-24 22:49
本发明专利技术公开一种自适应纬度感知变换编码的360°图像压缩方法及装置,码率节省上有显著优势,能够有效解决ERP图像的失真冗余问题。方法包括:(1)设计自适应纬度感知模块;(2)构建多尺度门控卷积神经网络;(3)变换调制重要性特征激活图引导的空间特征;(4)构建学习的360°图像压缩整体框架。

【技术实现步骤摘要】

本专利技术涉及图像压缩的,尤其涉及一种自适应纬度感知变换编码的360°图像压缩方法,以及一种自适应纬度感知变换编码的360°图像压缩装置。


技术介绍

1、360°图像,也称为全景图像、全方位图像或球面图像,与仅覆盖有限平面的2d图像不同,它覆盖了视角为360°×180°的场景。观察者就像站在360°图像拍摄的中心位置一样,可以从不同的角度观看图像。近年来,随着虚拟现实(virtual reality,vr)的快速发展,作为vr载体的360°图像提供了一种沉浸式的体验,变得越来越流行。这导致了360°图像数量的大幅增加,并且这些图像为了确保质量需要较高的分辨率。数量庞大和超高分辨率的360°图像给存储和传输带了巨大的压力,因此,迫切需要开发一种高效的360°图像压缩技术来缓解这种压力。

2、在过去的十年中,360°图像被以各种格式表示,并随后使用hevc和vvc等传统编解码进行压缩。通常,360°图像被表示为等矩形投影(equirectangular projection,erp)格式图像,由于erp图像便于后续处理,称为最广泛使用的格式。然而,erp图像由于过采样,从赤道到两极会逐渐出现失真。一些方法已经被提出以缓解这些问题,包括采样密度校正方法,重投影方法,以及感知压缩方法。然而,这些方法取得的成功有限。此外,这些传统编解码使用非线性变换编码,使得难以实现最佳的率失真性能。

3、近年来,由于深度神经网络强大的学习能力,基于传统编解码架构的平面图像压缩(通常包括变换、量化和熵建模这三个步骤)在端到端的方式下取得了卓越的性能,并且已经超越了vvc等传统编解码。这些端到端压缩方法在建模结构信息和局部平滑的平面图像方面更为有效。然而,对于360°图像,为了利用端到端的平面图像压缩方法,必须首先将球面图像投影到平面上。无论使用何种投影方法,这都不可避免地会引入失真或破坏图像的结构内容。因此,直接将这些方法应用于投影后的erp图像会导致较低的压缩效率。考虑到erp图像的特点和端到端平面图像压缩的优势,li等人首次提出了一种基于学习的端到端360°图像压缩方法。该方法在量化和熵建模步骤中采用了基于神经网络的纬度自适应编码方案,根据球面上的纬度为不同区域分配不同的码字。除了量化和熵建模,端到端平面图像压缩相比于传统编解码方法取得巨大成功的原因还在于其利用了基于超先验的强大的非线性变换编码。这些非线性变换编码将图像转换为更紧凑的潜在表示,并通过超先验直接预测潜在表示的熵,从而实现了卓越的率失真性能。基于此,本专利技术从基于超先验的非线性变换编码的角度考虑来去除冗余。


技术实现思路

1、为克服现有技术的缺陷,本专利技术要解决的技术问题是提供了一种自适应纬度感知变换编码的360°图像压缩方法,其码率节省上有显著优势,能够有效解决erp图像的失真冗余问题。

2、本专利技术的技术方案是:这种自适应纬度感知变换编码的360°图像压缩方法,包括以下步骤:

3、(1)设计自适应纬度感知模块:先选择四个适当尺寸的矩形卷积核5×11、3×9、5×7、7×7来捕捉不同纬度区域的失真冗余,采用膨胀率为(2,5)、(1,4)、(2,3)和(3,3)的3×3卷积核来实现矩形卷积核的效果,并使用深度卷积进行特征提取;

4、(2)构建多尺度门控卷积神经网络:首先将归一化后的特征按通道分为三个大小相等的特征,然后将它们输入三个并行分支中的深度卷积网络,这些卷积核的大小分别为3×3、5×5、7×7,用于探索多尺度表示;然后将多尺度提取的特征表示进行拼接,并通过卷积进行通道融合;最后对融合后的特征应用gelu函数作为门控机制,并与原始特征进行按元素相乘;

5、(3)变换调制重要性特征激活图引导的空间特征:首先使用重要性特征激活网络,该网络包括三个残差块和一个sigmoid激活函数,以生成重要性特征激活图m;然后,使用m作为空间特征变换的外部条件,为潜在表示y的每个元素生成仿射参数α和β,y被量化为

6、另一方面y被传送到熵模型网络,以学习潜在表示的概率分布参数μ和σ;

7、(4)构建学习的360°图像压缩整体框架:为了训练稳定,在每个模块前嵌入了层归一化,通过卷积下采样和转置上采样,将alab渐进式地插入到分析变换和合成变换中,分析变换逐渐并自适应地感知不同纬度的失真冗余,而合成变换逐步促进原始失真erp图像的生成;

8、潜在表示y被建模为高斯分布,为了对y分布的均值μ和方差σ进行很好的估计,利用超先验和上下文模型所构成的熵模型进行估计;基于分析变换,合成变换和熵模型,构建学习的360°图像压缩整体框架,

9、用于端到端的训练。

10、本专利技术设计了自适应纬度失真感知模块来感知不同纬度的失真和冗余,多尺度门控卷积神经网络来抑制自适应纬度感知模块带来的特征冗余并提取多尺度丰富的上下文信息,结合自适应纬度感知模块和多尺度卷积门控神经网络,构建自适应纬度感知块,设计了重要性特征激活图引导的空间特征变换来对隐变量进行调制将码率分配给重要区域,通过所设计的模块和已有的熵模型,构建整个学习的360°图像压缩框架,因此该方法码率节省上有显著优势,能够有效解决erp图像的失真冗余问题。

11、还提供了一种自适应纬度感知变换编码的360°图像压缩装置,该装置包括:

12、自适应纬度感知模块,其配置来先选择四个适当尺寸的矩形卷积核5

13、×11、3×9、5×7、7×7来捕捉不同纬度区域的失真冗余,采用膨胀率为(2,5)、(1,4)、(2,3)和(3,3)的3×3卷积核来实现矩形卷积核的效果,并使用深度卷积进行特征提取;

14、多尺度门控卷积神经网络模块,其配置来首先将归一化后的特征按通道分为三个大小相等的特征,然后将它们输入三个并行分支中的深度卷积网络,这些卷积核的大小分别为3×3、5×5、7×7,用于探索多尺度表示;然后将多尺度提取的特征表示进行拼接,并通过卷积进行通道融合;最后对融合后的特征应用gelu函数作为门控机制,并与原始特征进行按元素相乘;

15、变换调制模块,其配置来首先使用重要性特征激活网络,该网络包括三个残差块和一个sigmoid激活函数,以生成重要性特征激活图m;

16、然后,使用m作为空间特征变换的外部条件,为潜在表示y的每个元素生成仿射参数α和β,y被量化为另一方面y被传送到熵模型网络,以学习潜在表示的概率分布参数μ和σ;

17、学习的360°图像压缩整体框架:其配置来为了训练稳定,在每个模块前嵌入了层归一化,通过卷积下采样和转置上采样,将alab渐进式地插入到分析变换和合成变换中,分析变换逐渐并自适应地感知不同纬度的失真冗余,而合成变换逐步促进原始失真erp图像的生成;

18、潜在表示y被建模为高斯分布,为了对y分布的均值μ和方差σ进行很好的估计,利用超先验和上下文模型所构成的熵模型进行估计;基于分析变换,合成变换和熵模型,构建学习的360°图像本文档来自技高网...

【技术保护点】

1.自适应纬度感知变换编码的360°图像压缩方法,其特征在于:该方法包括以下步骤:

2.根据权利要求1所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(1)中,

3.根据权利要求2所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(1)中,纬度自适应选择机制包括:

4.根据权利要求3所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(2)中,卷积核用于探索多尺度表示:

5.根据权利要求3所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(3)中,使用m作为空间特征变换的外部条件,为潜在表示y的每个元素生成仿射参数α和β,这一过程表示如下:

6.自适应纬度感知变换编码的360°图像压缩装置,其特征在于:该装置包括:

7.根据权利要求6所述的自适应纬度感知变换编码的360°图像压缩装置,其特征在于:所述自适应纬度感知模块中,

8.根据权利要求7所述的自适应纬度感知变换编码的360°图像压缩装置,其特征在于:所述自适应纬度感知模块中,纬度自适应选择机制包括:

9.根据权利要求8所述的自适应纬度感知变换编码的360°图像压缩装置,其特征在于:所述多尺度门控卷积神经网络模块中,卷积核用于探索多尺度表示:

10.根据权利要求9所述的自适应纬度感知变换编码的360°图像压缩装置,其特征在于:所述变换调制模块中,使用m作为空间特征变换的外部条件,为潜在表示y的每个元素生成仿射参数α和β,这一过程表示如下:

...

【技术特征摘要】

1.自适应纬度感知变换编码的360°图像压缩方法,其特征在于:该方法包括以下步骤:

2.根据权利要求1所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(1)中,

3.根据权利要求2所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(1)中,纬度自适应选择机制包括:

4.根据权利要求3所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(2)中,卷积核用于探索多尺度表示:

5.根据权利要求3所述的自适应纬度感知变换编码的360°图像压缩方法,其特征在于:所述步骤(3)中,使用m作为空间特征变换的外部条件,为潜在表示y的每个元素生成仿射参数α和β,这一过程表示如下:

6.自适...

【专利技术属性】
技术研发人员:施云惠胡慧王瑾尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1