基于网络实现注意力机制的图像压缩方法技术

技术编号：23861149 阅读：36 留言：0更新日期：2020-04-18 13:55

本发明专利技术提供了一种基于网络实现注意力机制的图像压缩方法，能够提高了图像压缩比例，提升了图像压缩后视觉效果，包括：利用yolo3网络对原始图像进行检测，得到目标矩阵；将原始图像进行压缩并利用卷积神经网络对图像处理得到重构图像，处理包括原始图像进行卷积得到第一特征数据，对第一特征数据量化得离散值向量，离散值向量数据熵编码处理得到码流数据，码流数据解压后反量化的第二特征数据，第二特征数据进行反卷积得到重构图像；原始图像的三通道数值分别作为矩阵M做点乘得到新图像矩阵；新图像矩阵与重构图像计算MSE，并作为损失函数对网络参数进行优化。

Image compression method based on attention mechanism of network

全部详细技术资料下载

【技术实现步骤摘要】
基于网络实现注意力机制的图像压缩方法
本专利技术涉及一种图像压缩方法，具体涉及一种基于网络实现注意力机制的图像压缩方法，属于深度学习

技术介绍
图像压缩是图像处理分析的一个热门领域。图像压缩是通过图像编码改变图像内容格式的过程，目标是减少图像所占用的储存空间。随着数字化信息时代的到来和宽带移动通信技术的快速普及，移动互联网技术的应用深入到人们生活的各个方面。数字化信息的快速、有效传输将给人们的信息交流带来巨大便利，4G、5G移动通信技术的推广普及使得高清图像的实时传输在个人移动通信中的应用也越来越普遍。尽管如今网络传输速率大大提高，对于公共网络来说，实现高清图像的实时传输，仍是十分困难的事情，因此需要考虑如何在不失真的情况下更好的对图像进行压缩，以减小图像存储空间，加快图片传输速率。传统的图像压缩操作以线型转换为基础，通过线性转换方式将数据向量转换为合适的连续值表示形式，然后对这些连续值进行量化并通过熵编码方式进行编码。
技术实现思路
本专利技术提供了一种基于网络实现注意力机制的图像压缩方法，能够提高了图像压缩比例，提升了图像压缩后视觉效果。本专利技术为实现上述目的，通过以下技术方案实现：一种基于网络实现注意力机制的图像压缩方法，包括：（1）利用yolo3网络对原始图像进行检测，得到目标矩阵；（2）将原始图像进行压缩并利用卷积神经网络对图像处理得到重构图像，处理包括原始图像进行卷积得到第一特征数据，对第一特征数据量化得离散值向量，离散值向量...

【技术保护点】
1.一种基于网络实现注意力机制的图像压缩方法，其特征在于，包括：/n（1）利用yolo3网络对原始图像进行检测，得到目标矩阵；/n（2）将原始图像进行压缩并利用卷积神经网络对图像处理得到重构图像，处理包括原始图像进行卷积得到第一特征数据，对第一特征数据量化得离散值向量，离散值向量数据熵编码处理得到码流数据，码流数据解压后反量化的第二特征数据，第二特征数据进行反卷积得到重构图像；/n（3）原始图像的三通道数值分别作为矩阵M做点乘得到新图像矩阵；/n（4）新图像矩阵与重构图像计算MSE，并作为损失函数对网络参数进行优化。/n

【技术特征摘要】
1.一种基于网络实现注意力机制的图像压缩方法，其特征在于，包括：
（1）利用yolo3网络对原始图像进行检测，得到目标矩阵；
（2）将原始图像进行压缩并利用卷积神经网络对图像处理得到重构图像，处理包括原始图像进行卷积得到第一特征数据，对第一特征数据量化得离散值向量，离散值向量数据熵编码处理得到码流数据，码流数据解压后反量化的第二特征数据，第二特征数据进行反卷积得到重构图像；
（3）原始图像的三通道数值分别作为矩阵M做点乘得到新图像矩阵；
（4）新图像矩阵与重构图像计算MSE，并作为损失函数对网络参数进行优化。

2.根据权利要求1所述基于网络实现注意力机制的图像压缩方法，其特征在于：目标矩阵获得具体过程如下：初始化一w×h矩阵M，其中w为图像宽度，h为图像高度，对检测到目标区域，设置矩阵M的值为1，对其他区域，设置矩阵M的值为0.1。

3.根据权利要求1所述基于网络实现注意力机制的图像压缩方法，其特征在于：卷积处理中是将图像数据连接四个卷积层，卷积核大小为3×3，通道数为128，同时进行下采样，步长为2。

4.根据权利要求3所述基于网络实现注意力机制的图像压缩方法，其特征在于：对卷积后数据连接四个反卷积重制图片，卷积核大小为3×3，前四层反卷积层通道数为128，第五...

【专利技术属性】
技术研发人员：汝佩哲，李锐，金长新，
申请(专利权)人：山东浪潮人工智能研究院有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人