利用多尺度自编码器进行数据压缩制造技术

技术编号:39126108 阅读:23 留言:0更新日期:2023-10-23 14:48
一种图像压缩的方法包括:接收图像。生成用以表示该图像的特征的多个经量化隐性表示。每个经量化隐性表示具有不同的分辨率,并且是以交错定时生成的。每个较晚生成的经量化隐性表示以每个先前生成的经量化隐性表示为条件。对该多个经量化隐性表示进行解码以重构该图像。像。像。

【技术实现步骤摘要】
【国外来华专利技术】利用多尺度自编码器进行数据压缩
[0001]相关申请的交叉引用
[0002]本申请要求于2021年3月12日提交的题为“DATA COMPRESSION WITH A MULTI

SCALE AUTOENCODER(利用多尺度自编码器进行数据压缩)”的美国专利申请No.17/200,694的优先权,其公开内容通过援引全部明确纳入于此。
[0003]背景
[0004]领域
[0005]本公开的各方面一般涉及利用人工神经网络进行数据压缩。

技术介绍

[0006]人工神经网络可包括诸群互连的人工神经元(例如,神经元模型)。人工神经网络可以是计算设备或表示为要由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)(诸如深度卷积神经网络(DCN))具有众多应用。具体而言,这些神经网络架构被用于各种技术,诸如图像识别、语音识别、声学场景分类、关键字检测、自动驾驶和其他分类任务。
[0007]人工神经网络在基于图像的视频或视频流处理方面也有众多应用,诸如人体姿态估计、对象检测、语义表义、以及视频压缩和去噪。遗憾的是,此类视频处理是计算密集型的,这可能会导致大量时间和能量消耗。
[0008]概述
[0009]在本公开的一方面,提供了一种图像压缩的方法。该方法包括:接收图像。该方法还包括:生成用以表示该图像的特征的多个经量化隐性表示。每个经量化隐性表示具有不同的分辨率,并且是以交错定时生成的。附加地,较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。此外,该方法包括:对该多个经量化隐性表示进行解码以重构该图像。
[0010]在本公开的另一方面,提供了一种用于图像压缩的装置。该装置包括存储器以及耦合到该存储器的一个或多个处理器。(诸)处理器被配置成:接收图像。(诸)处理器还被配置成:生成用以表示该图像的特征的多个经量化隐性表示。每个经量化隐性表示具有不同的分辨率,并且是以交错定时生成的。附加地,较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。此外,(诸)处理器被配置成:对该多个经量化隐性表示进行解码以重构该图像。
[0011]在本公开的另一方面,提供了一种用于图像压缩的设备。该设备包括用于接收图像的装置。该设备还包括用于生成用以表示该图像的特征的多个经量化隐性表示的装置。每个经量化隐性表示具有不同的分辨率,并且是以交错定时生成的。附加地,较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。此外,该设备包括用于对该多个经量化隐性表示进行解码以重构该图像的装置。
[0012]在本公开的进一步方面,提供了一种非瞬态计算机可读介质。该计算机可读介质
上编码有用于图像压缩的程序代码。该程序代码由处理器执行,并且包括用于接收图像的代码。该程序代码还包括用于生成用以表示该图像的特征的多个经量化隐性表示的代码。每个经量化隐性表示具有不同的分辨率,并且是以交错定时生成的。附加地,较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。此外,该程序代码包括用于对该多个经量化隐性表示进行解码以重构该图像的代码。
[0013]在又进一步方面,一种方法包括:接收与图像相对应的经量化隐性表示,这些经量化隐性表示中的每个经量化隐性表示是以交错定时接收的并且具有不同的分辨率。该方法还包括:对这些经量化隐性表示进行解码以重构针对这些不同分辨率中的每个分辨率的数据;以及将针对这些不同分辨率中的每个分辨率所重构的数据融合以生成经重构图像。
[0014]本公开的附加特征和优点将在下文描述。本领域技术人员应当领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。
[0015]附图简述
[0016]在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。
[0017]图1解说了根据本公开的某些方面的使用片上系统(SOC)(包括通用处理器)的神经网络的示例实现。
[0018]图2A、2B和2C是解说根据本公开的各方面的神经网络的示图。
[0019]图2D是解说根据本公开的各方面的示例性深度卷积网络(DCN)的示图。
[0020]图3是解说根据本公开的各方面的示例性深度卷积网络(DCN)的框图。
[0021]图4是解说根据本公开的各方面的用于图像压缩的示例多尺度自编码器的框图。
[0022]图5是解说根据本公开的各方面的示例编码器的示图。
[0023]图6是解说根据本公开的各方面的经量化的经缩放隐性表示之间的关系的框图。
[0024]图7是解说根据本公开的各方面的示例解码器的框图。
[0025]图8A和8B是解说根据本公开的各方面的自回归解码器的示例实现的框图。
[0026]图9A

9B是解说根据本公开的各方面的具有线性变换的示例多尺度自编码器的框图。
[0027]图9C是解说根据本公开的各方面的具有线性变换的示例多尺度解码器的框图。
[0028]图10是解说根据本公开的各方面的用于图像压缩的方法的流程图。
[0029]详细描述
[0030]以下结合附图阐述的详细描述旨在作为各种配置的描述,而无意表示可实践所描述的概念的仅有配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而,对于本领域技术人员将显而易见的是,没有这些具体细节也可实践这些概念。在一些实例中,以框图形式示出众所周知的结构和组件以避免湮没此类概念。
[0031]基于本教导,本领域技术人员应领会,本公开的范围旨在覆盖本公开的任何方面,不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如,可使用所阐述的任
何数目的方面来实现装置或实践方法。另外,本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解,所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。
[0032]措辞“示例性”用于意指“用作示例、实例、或解说”。描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。
[0033]尽管描述了特定方面,但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点,但本公开的范围并非旨在被限定于特定益处、用途或目标。相反,本公开的各方面旨在能宽泛地应用于不同的技术、系统配置、网络和协议,其中一些作为示例在附图以及以下对优选方面的描述中解说。详本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种图像压缩的方法,包括:接收图像;以及生成用以表示所述图像的特征的多个经量化隐性表示,每个经量化隐性表示具有不同的分辨率并且是以交错定时生成的,并且其中较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。2.如权利要求1所述的方法,进一步包括:对所述多个经量化隐性表示进行解码以重构所述图像。3.如权利要求1所述的方法,进一步包括:提供第一经量化隐性表示的量化误差作为反馈,所述量化误差被应用于生成下一后续经量化隐性表示。4.如权利要求1所述的方法,进一步包括:学习隐性表示跨不同分辨率的阶层式表示。5.如权利要求1所述的方法,其中用于生成所述多个经量化隐性表示的处理是并行执行的。6.如权利要求1所述的方法,其中对用于生成所述多个经量化隐性表示的计算的处理跨所述多个经量化隐性表示均匀分布。7.如权利要求1所述的方法,其中所述多个经量化隐性表示是基于分开的输入图像来分别生成的,所述分开的输入图像是通过重复地对所接收到的图像进行下采样而形成的。8.一种用于图像压缩的装置,包括:存储器;以及耦合到所述存储器的至少一个处理器,所述至少一个处理器被配置成:接收图像;以及生成用以表示所述图像的特征的多个经量化隐性表示,每个经量化隐性表示具有不同的分辨率并且是以交错定时生成的,并且其中较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。9.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成:对所述多个经量化隐性表示进行解码以重构所述图像。10.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成:提供第一经量化隐性表示的量化误差作为反馈,所述量化误差被应用于生成下一后续经量化隐性表示。11.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成:学习隐性表示跨不同分辨率的阶层式表示。12.如权利要求8所述的装置,其中所述至少一个...

【专利技术属性】
技术研发人员:H
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1