一种利用ReCNN融合上下文信息的行人检测方法技术

技术编号：17008542 阅读：595 留言：0更新日期：2018-01-11 04:32

本发明专利技术提供了一种利用ReCNN融合上下文信息的行人检测方法，包括以下步骤：步骤A：提取输入图像中包含上下文信息的特征；步骤B：利用ReCNN对输入图像中的行人位置进行预测，获取预测行人位置的掩码图；步骤C：确定输入图像中行人的位置；步骤D：训练融合上下文信息的ReCNN网络的参数；本发明专利技术所述的一种利用ReCNN融合上下文信息的行人检测方法利用ReCNN融合了视频中连续多张帧的图像信息，与利用单张图像信息相比可以获得更加准确的掩码图，进而提高行人位置检测的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用ReCNN融合上下文信息的行人检测方法
本专利技术涉及污水处理站格栅机监测领域，尤其涉及一种利用ReCNN融合上下文信息的行人检测方法。
技术介绍
视频监控场景下的行人检测是智慧城市的重要组成部分，也是计算机视觉的重要组成部分。但是，由于光照、视角、遮挡等因素的影响，监控场景下的行人检测仍亟需进一步提高。当前，在视频监控下的行人检测主要有两大类方法，一种是传统的行人检测方法，一种是基于深度学习的行人检测方法。传统的行人检测，主要是利用手工特征和分类模型进行行人检测。例如，DOT特征+SVM、HOG特征+Boosting、HOG+LBP联合特征+SVM等等。该类方法主要利用人为设计的低层特征，进行行人表征的刻画，缺乏抗干扰性和准确性。基于深度学习的行人检测主要指利用卷积神经网络(ConvolutionalNeuralNetwork，简称CNN)直接从大量图像中提取更高层的数据抽象，自动学习表达能力强和判别能力好的行人特征。但该类方法主要利用单张检测图像的信息进行行人检测，而忽略了视频中多帧图像的上下文信息。为此，本方案提出了一种利用递归卷积神经网络(RecurrentConvolutionalNeuralNetwork，简称ReCNN)融合上下文信息的行人检测方法，该方法利用ReCNN学习视频中连续帧的上下文信息，提高掩码图中行人位置预测的准确度，相较于当前方法，利用了视频多帧形成的上下文信息，从而进一步提高了行人检测的准确性。
技术实现思路
本专利技术的目的在于提供一种利用ReCNN融合上下文信息的行人检测方法，能够实时监控格栅机是否正常工作，防止出现...

【技术保护点】
一种利用ReCNN融合上下文信息的行人检测方法，其特征在于，包括以下步骤：步骤A：提取输入图像中包含上下文信息的特征；步骤B：利用ReCNN对输入图像中的行人位置进行预测，获取预测行人位置的掩码图；步骤C：确定输入图像中行人的位置；步骤D：训练融合上下文信息的ReCNN网络的参数。

【技术特征摘要】
1.一种利用ReCNN融合上下文信息的行人检测方法，其特征在于，包括以下步骤：步骤A：提取输入图像中包含上下文信息的特征；步骤B：利用ReCNN对输入图像中的行人位置进行预测，获取预测行人位置的掩码图；步骤C：确定输入图像中行人的位置；步骤D：训练融合上下文信息的ReCNN网络的参数。2.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法，其特征在于，所述的步骤A包括以下步骤：步骤A1：定义监控视频图像总共包含N帧图像，第t帧图像表示为I(t)，其中，t＝1，2...，N；步骤A2：利用一个截断的卷积神经网络提取I(t-2)、I(t-1)和I(t)连续三帧输入图像的三个特征图组，分别表示为X(t-2)、X(t-1)和X(t)，其中，X(t)＝{x1(t)，x2(t)，...，xM(t)}，其中，M表示特征图的数量。3.根据权利要求1所述的一种利用ReCNN融合上下文信息的行人检测方法，其特征在于，所述的步骤C包括以下步骤：步骤C1：按比例将掩码图y放大，直至掩码图y的尺寸与输入图像的尺寸相...

【专利技术属性】
技术研发人员：李涛，李冬梅，赵雪专，裴利沈，朱晓珺，赵俊彬，汪伟，邹香玲，郭航宇，
申请(专利权)人：盐城禅图智能科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人