视频特征提取方法及应用该方法的视频量化方法技术

技术编号：26259419 阅读：14 留言：0更新日期：2020-11-06 17:53

本发明专利技术涉及计算机视觉技术领域，尤其涉及视频特征提取方法及应用该方法的视频量化方法，提供了一种视频特征提取方法，以解决有效获得包含丰富上下文信息的视频特征的技术问题，同时提供了一种应用上述视频特征提取方法的视频量化方法。视频特征提取方法包括：从目标视频中提取原始视觉特征并构建原始特征矩阵，所述原始特征矩阵包含每帧采样图像的空间信息和每帧采样图像之间的时序信息；根据原始特征矩阵生成采样图像空间注意力热度图和采样图像时序注意力热度图；以及将原始特征矩阵、采样图像空间注意力热度图、采样图像时序注意力热度图相加融合得到目标特征矩阵。

全部详细技术资料下载

【技术实现步骤摘要】
视频特征提取方法及应用该方法的视频量化方法
本专利技术涉及计算机视觉
，尤其涉及视频特征提取方法及应用该方法的视频量化方法。
技术介绍
视频检索是计算机视觉中的一个基础又富有挑战性的问题，其目的是从海量的视频库中检索出与输入视频最相似的视频。而无监督的视频量化检索则是通过将原始无标签的视频的视觉特征压缩成紧凑的二进制码来实现视频的快速检索。目前已知的一种无监督的视频量化检索方法是先使用卷积神经网络提取视频每帧图片的视觉特征信息，再使用循环神经网络处理这些帧的特征得到视频特征，然后使用哈希算法将特征信息压缩至极短的二进制编码，以此缩减数据库体积，加快检索速度。上述方法存在两方面问题。第一，通过卷积神经网络和循环神经网络的方式难以获取长时间范围的信息，因此难以保留视频的上下文信息，无法获取更好的视频特征。第二，在大规模的视频库下，视频特征十分复杂，哈希算法难以获得好的准确率。专利技术创造内容本专利技术所要解决的技术问题是：提供一种视频特征提取方法，以解决有效获得包含丰富上下文信息的视频特征的技术问题，以及提供一种应用上述视频特征提取方法的视频量化方法。本专利技术解决上述技术问题所采用的技术方案是：一种视频特征提取方法，包括：从目标视频中提取原始视觉特征并构建原始特征矩阵，所述原始特征矩阵包含每帧采样图像的空间信息和每帧采样图像之间的时序信息；根据原始特征矩阵生成采样图像空间注意力热度图和采样图像时序注意力热度图；以及将原始特征矩阵、采样图像空间注意力热度图、采样图像时...

【技术保护点】
1.视频特征提取方法，其特征在于，包括：/n从目标视频中提取原始视觉特征并构建原始特征矩阵，所述原始特征矩阵包含每帧采样图像的空间信息和每帧采样图像之间的时序信息；/n根据原始特征矩阵生成采样图像空间注意力热度图和采样图像时序注意力热度图；以及/n将原始特征矩阵、采样图像空间注意力热度图、采样图像时序注意力热度图相加融合得到目标特征矩阵。/n

【技术特征摘要】
1.视频特征提取方法，其特征在于，包括：
从目标视频中提取原始视觉特征并构建原始特征矩阵，所述原始特征矩阵包含每帧采样图像的空间信息和每帧采样图像之间的时序信息；
根据原始特征矩阵生成采样图像空间注意力热度图和采样图像时序注意力热度图；以及
将原始特征矩阵、采样图像空间注意力热度图、采样图像时序注意力热度图相加融合得到目标特征矩阵。

2.如权利要求1所述的视频特征提取方法，其特征在于，
A)根据原始特征矩阵生成采样图像空间注意力热度图包括：
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一行的其他所有像素点之间信息依赖关系的行维度注意力热度图；和
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一列的其他所有像素点之间信息依赖关系的列维度注意力热度图；
并且/或者，
B)根据原始特征矩阵生成采样图像时序注意力热度图包括：
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一时序的其他所有像素点之间信息依赖关系的时序维度注意力热度图。

3.如权利要求2所述的视频特征提取方法，其特征在于：
若设目标视频的原始特征矩阵oi∈RT′×h×w×c，其中h为视频每帧图像的高度、w为视频每帧图像的宽度、c为视频每帧图像的通道数、T′为采样图像帧数，则
A)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一行的其他所有像素点之间信息依赖关系的行维度注意力热度图包括：
将原始特征矩阵重塑为{T′×h}×w×c；分别采用三个尺寸为c*1*1的卷积核对重塑后的矩阵进行卷积操作，得到三个维度均为{T′×h}×w×c的特征矩阵rθ，rρ，rγ，其中c*1*1为通道数*高度*宽度；将所述三个特征矩阵rθ，rρ，rγ按公式进行运算，得到行维度注意力热度图r，其中是特征矩阵rγ的转置矩阵；
并且/或者，
B)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一列的其他所有像素点之间信息依赖关系的列维度注意力热度图包括：
将原始特征矩阵重塑为{T′×w}×h×c；分别采用三个尺寸为c*1*1的卷积核对重塑后的矩阵进行卷积操作，得到三个维度均为{T′×w}×h×c的三个特征矩阵cθ，cρ，cγ，其中c*1*1为通道数*高度*宽度；将所述三个特征矩阵cθ，cρ，cγ按公式进行运算，得到列维度注意力热度图c，其中为特征矩阵cγ的转置矩阵；
并且/或者，
C)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一时序的其他所有像素点之间信息依赖关系的时序维度注意力热度图包括：
将原始特征矩阵重塑为{w×h}×T′×c；分别采用三个1*1的卷积核对重塑后的矩阵进行卷积操作，得到维度均为{w×h}×T′×c的三个特征矩阵tθ，tρ，ty；将所述三个特征矩阵tθ，...

【专利技术属性】
技术研发人员：宋井宽，郎睿敏，朱筱苏，高联丽，
申请(专利权)人：成都井之丽科技有限公司，电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人