利用多尺度自编码器进行数据压缩制造技术

技术编号：39126108 阅读：23 留言：0更新日期：2023-10-23 14:48

一种图像压缩的方法包括：接收图像。生成用以表示该图像的特征的多个经量化隐性表示。每个经量化隐性表示具有不同的分辨率，并且是以交错定时生成的。每个较晚生成的经量化隐性表示以每个先前生成的经量化隐性表示为条件。对该多个经量化隐性表示进行解码以重构该图像。像。像。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】利用多尺度自编码器进行数据压缩
[0001]相关申请的交叉引用
[0002]本申请要求于2021年3月12日提交的题为“DATA COMPRESSION WITH A MULTI
‑
SCALE AUTOENCODER(利用多尺度自编码器进行数据压缩)”的美国专利申请No.17/200,694的优先权，其公开内容通过援引全部明确纳入于此。
[0003]背景
[0004]领域
[0005]本公开的各方面一般涉及利用人工神经网络进行数据压缩。

技术介绍

[0006]人工神经网络可包括诸群互连的人工神经元(例如，神经元模型)。人工神经网络可以是计算设备或表示为要由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合，其中每个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)(诸如深度卷积神经网络(DCN))具有众多应用。具体而言，这些神经网络架构被用于各种技术，诸如图像识别、语音识别、声学场景分类、关键字检测、自动驾驶和其他分类任务。
[0007]人工神经网络在基于图像的视频或视频流处理方面也有众多应用，诸如人体姿态估计、对象检测、语义表义、以及视频压缩和去噪。遗憾的是，此类视频处理是计算密集型的，这可能会导致大量时间和能量消耗。
[0008]概述
[0009]在本公开的一方面，提供了一种图像压缩的方法。该方法包括：接收图像。该方法还包括：生成用以表示该图像的特征的多个经量化隐性表示。每个经量化隐性表示具有不同的分辨率，并且...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种图像压缩的方法，包括：接收图像；以及生成用以表示所述图像的特征的多个经量化隐性表示，每个经量化隐性表示具有不同的分辨率并且是以交错定时生成的，并且其中较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。2.如权利要求1所述的方法，进一步包括：对所述多个经量化隐性表示进行解码以重构所述图像。3.如权利要求1所述的方法，进一步包括：提供第一经量化隐性表示的量化误差作为反馈，所述量化误差被应用于生成下一后续经量化隐性表示。4.如权利要求1所述的方法，进一步包括：学习隐性表示跨不同分辨率的阶层式表示。5.如权利要求1所述的方法，其中用于生成所述多个经量化隐性表示的处理是并行执行的。6.如权利要求1所述的方法，其中对用于生成所述多个经量化隐性表示的计算的处理跨所述多个经量化隐性表示均匀分布。7.如权利要求1所述的方法，其中所述多个经量化隐性表示是基于分开的输入图像来分别生成的，所述分开的输入图像是通过重复地对所接收到的图像进行下采样而形成的。8.一种用于图像压缩的装置，包括：存储器；以及耦合到所述存储器的至少一个处理器，所述至少一个处理器被配置成：接收图像；以及生成用以表示所述图像的特征的多个经量化隐性表示，每个经量化隐性表示具有不同的分辨率并且是以交错定时生成的，并且其中较晚生成的经量化隐性表示以先前生成的经量化隐性表示为条件。9.如权利要求8所述的装置，其中所述至少一个处理器被进一步配置成：对所述多个经量化隐性表示进行解码以重构所述图像。10.如权利要求8所述的装置，其中所述至少一个处理器被进一步配置成：提供第一经量化隐性表示的量化误差作为反馈，所述量化误差被应用于生成下一后续经量化隐性表示。11.如权利要求8所述的装置，其中所述至少一个处理器被进一步配置成：学习隐性表示跨不同分辨率的阶层式表示。12.如权利要求8所述的装置，其中所述至少一个...

【专利技术属性】
技术研发人员：H，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人