基于补丁匹配与合成的视频去模糊方法技术

技术编号：32527625 阅读：10 留言：0更新日期：2022-03-05 11:20

本发明专利技术提出一种基于补丁匹配与合成的视频去模糊方法，本方法设计了多尺度补丁匹配模块和补丁合成模块，首先利用多尺度补丁匹配模块将输入的多个视频帧特征离散为不同尺度、部分重叠的特征补丁，然后从特征补丁集合中匹配相似、可用的锐利补丁，为目标特征补丁的复原提供关键的纹理细节。然后利用补丁合成模块融合多尺度补丁匹配模块得到的锐利补丁，帮助目标补丁的去模糊。本方法通过直接匹配、融合视频帧序列中任意相似补丁来获取视频帧间时空依赖，从而有效改善视频去模糊的效果。从而有效改善视频去模糊的效果。从而有效改善视频去模糊的效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于补丁匹配与合成的视频去模糊方法

[0001]本专利技术属于视频图像处理

技术介绍

[0002]现今各领域(如安防领域的视频监控、卫星的气象监控等)随时随刻都产生着大量的视频数据。但由于拍摄过程中设备抖动、对象运动、景深变换等原因，所得到的视频不可避免包含不同程度的模糊，这严重影响了视频的后续处理任务(如视觉跟踪、同步定位与建图、3D重建等)。因此，视频去模糊技术被广泛地应用到天文观测、医学成像、视频多媒体、刑事侦察等领域。目前基于深度学习的视频去模糊方法受网络参数量与感受野限制，但存在视频复原效果较差及复原耗时等问题。
[0003]由于模糊视频的连续特性，对目标的连续拍摄过程中，部分视频帧存在显著边缘纹理信息，而这些锐利信息对于相似模糊区域的去模糊处理是至关重要的。可见，准确有效的利用视频帧间的锐利纹理，是视频去模糊的关键所在。从技术上讲，相邻视频帧间相应的锐利纹理有利于视频模糊帧中的模糊目标的恢复，也就是说，捕获视频的长距离时空依赖非常重要。
[0004]为了利用视频的长距离时空依赖性，现有技术提出了多种有效的帧间像素映射建模方法，如3D卷积、循环神经网络、帧间对齐等方法。其中，3D卷积与循环神经网络通过卷积自身的时空特性，聚合相邻帧的信息，可实现视频去模糊。然而，这种方法受网络参数量限制，在学习较远处视频帧的图像信息时，计算量大，耗时长。基于帧间对齐的方法，对齐精度越高，捕获的视频时空依赖越长。但由于视频中往往目标运动复杂且细节丰富，很难准确估计目标像素点运动轨迹，因此，对齐精度低，...

【技术保护点】

【技术特征摘要】
1.一种基于补丁匹配与合成的视频去模糊方法，其特征在于，包括以下步骤：(1)通过编解码网络初步提取图像特征，作为多尺度补丁匹配模块的输入特征；(2)在多尺度补丁匹配模块中，首先利用三个不同参数的可变形卷积对所述输入特征进行卷积处理，提取出能够作为图像关键基准的查询特征、键特征与值特征；然后在通道维度将特征均分，分别在不同尺度下进行补丁匹配；在不同尺度下匹配到相似、可用的锐利补丁后，再将其聚合为锐利特征；(3)以不同尺度下的锐利特征与值特征作为补丁合成模块的输入，将锐利特征与值特征有效融合，同时在值特征指导下合成融合特征，最后将不同尺度所得融合特征聚合形成视频图像复原特征，作为补丁合成模块的最终输出，用于复原视频图像。2.根据权利要求1所述的基于补丁匹配与合成的视频去模糊方法，其特征在于，所述步骤3中，在不同尺度下匹配到相似、可用的锐利补丁后的具体方法是：通过展开操作，将查询特征补丁与键特征补丁重塑为一维向量，计算出补丁间的相似度s
i,j
，其中，1≤i,j≤N，N为图像特征离散为补丁后的补丁数量，s
i,j
表示第i补丁与第j补丁之间的相似度，q
i
表示第i块查询补丁，k
j
表示第j块键补丁，“·”表示矩阵相乘，C为通道数，patch_size为特征补丁空间大小。3.根据权利要求1所述的基于补丁匹配与合成的视频去模糊方法，其特征在于，所述步骤2中对锐利特征的聚合是：对所有空间补丁的深度对应进行建模，然后通过相关值补丁的加权总和，获得每个补丁匹配后的锐利补丁：其中，o
i
表示图像中第i个补丁匹配后所得的锐利补丁，v
j
表示第j个值...

【专利技术属性】
技术研发人员：张超，李伟红，杨利平，王欣然，侯俊岭，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人