基于多径时空特征强化融合的三支流网络行为识别方法技术

技术编号：25757396 阅读：52 留言：0更新日期：2020-09-25 21:06

基于多径时空特征强化融合的三支流网络行为识别方法。该方法采用一种基于时空双流网络的网络框架，称为多径时空特征强化融合网络。针对双流网络仅融合顶层时空特征导致的双流信息利用不充分、特征融合阶段位于全局采样层之后导致特征融合交互不够的问题，本发明专利技术利用压缩双线性算法，对来自双流网络多层对应时空特征进行降维，然后进行融合，在减少融合特征所需内存的同时，增加融合特征之间的交互，增强融合效果。此外，本发明专利技术在融合流中提出多尺度通道‑空间注意力模块，对融合特征中有效特征进行增强，对无效特征进行抑制。最后，本发明专利技术还结合时间分段网络TSN的思想对视频中长期时间信息进行捕捉，进一步提高了行为识别模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多径时空特征强化融合的三支流网络行为识别方法
本专利技术属于机器视觉领域，特别涉及一种基于多径时空特征强化融合的三支流网络行为识别方法。
技术介绍
随着社会的发展，机器视觉领域的知识越来越多地被应用到实际生活中，而行为识别是机器视觉领域中一个重要的研究方向。行为识别可以应用于人机交互、医疗监护、视频智能监控等场景中，但由于光照条件、物体遮挡、复杂背景、穿着衣物等因素的影响，行为识别还有许多需要解决的问题。目前存在的行为识别方法主要有(1)基于RGB视频；(2)基于骨骼节点；(3)基于RGB+D视频。由于RGB视频数据获取途径较多，获取成本较低，所以本专利技术选择以RGB视频为研究对象，以提取融合视频中时间特征和空间特征为目的，提出包含独特融合流的三支流网络方法来有效识别人体行为。目前，以RGB视频作为数据进行行为识别的方法主要使用双流网络。在双流网络中，通过两个分离卷积神经网络中卷积操作的堆积来提取RGB图像中的空间特征和光流图片中的时间特征，最后对两个网络提取的顶层特征进行加权融合，得到最终的结果。但是传统的双流网络仍然存在以下三个问题：(1)双流网络融合阶段位于全局平均采样层之后，而提取的特征经过全局平均采样层之后存在信息损失的情况，如何最大化保留融合特征中的有效的信息是一个值得解决的问题；(2)双流网络仅融合网络顶层的特征，而卷积神经网络顶层特征虽然包含丰富的全局信息，但是缺少对行为分类也有帮助的局部信息；(3)双流网络对待融合特征上的各个部分使用相同的优先级，即使用相同的权重对特征的各个部分进行加...

【技术保护点】
1.基于多径时空特征强化融合的三支流网络行为识别方法，其特征在于，步骤如下：/n步骤一、获取RGB帧：对于数据集中的每个视频进行取帧处理，获得RGB原始帧

【技术特征摘要】
1.基于多径时空特征强化融合的三支流网络行为识别方法，其特征在于，步骤如下：
步骤一、获取RGB帧：对于数据集中的每个视频进行取帧处理，获得RGB原始帧N+1为视频总帧数；
步骤二、计算光流图：应用TVL1算法对按时序排序的RGB原始帧frgb两两进行计算得到光流图
步骤三、将视频在时间尺度上分为k段：按时间顺序将RGB原始帧frgb及光流图fopt各分为等长的k份，分别为和其中j＝{1,2,…,k},floor(·)表示向下取整函数，特别地，N0＝0；
步骤四、构建包括k个并行时间分段网络在内的多时间分段融合网络，每个分段网络包括一个空间流网络、一个时间流网络和一个融合流网络；
步骤五、对每个分段融合网络分别计算空间流预测概率分布:针对第k个时间分段融合网络，从第k段视频原始帧中随机选取一帧RGB图片输入双流网络中的空间流网络中，从空间流网络中最后M个卷积模块输出中得到多层空间特征空间流网络最后输出的结果就是空间流预测概率分布
步骤六、对每个分段融合网络分别计算时间流预测概率分布:针对第k个时间分段融合网络，从第k段视频光流图中选取时间上对应于步骤五中RGB图片的连续五张光流图片，输入双流网络中的时间流网络中，从时间流网络中最后M个卷积模块输出中得到多层时间特征时间流网络最后输出的结果就是时间流预测概率分布
步骤七、时空特征融合：使用M个多径压缩双线性融合模块DCBF分别融合M对时间流网络、空间流网络对应层特征，得到M个压缩时空特征；
步骤八、多径特征融合：使用多径压缩双线性融合模块DCBF融合M个压缩时空特征得到多径压缩时空特征；
步骤九、使用注意力机制增强多径压缩时空特征：使用多尺度通道-空间注意力模块对多径压缩时空特征进行特征权重调整，最后经过全局平均采样层和全连接层，得到融合流预测概率分布
步骤十、重复上述步骤五到步骤九k次获得对应视频不同时间分段的k段预测结果
步骤十一、计算空间流最终概率预测分布Pspa、时间流最终概率预测分布Ptem和融合流最终概率预测分布Pfus：对三个流的各个时间分段结果进行融合，计算方法为加和平均；
步骤十二、计算加权融合三个流的预测概率分布P：使用加权平均融合方法对三个最终概率预测分布进行融合。

2.根据权利要求1所述的基于多径时空特征强化融合的三支流网络行为识别方法，其特征在于，所述的空间流网络和时间流网络使用的是InceptionV3网络，融合流网络使用的多层特征来自于InceptionV3的...

【专利技术属性】
技术研发人员：孔军，邓浩阳，蒋敏，
申请(专利权)人：江南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人