一种基于级联多级卷积神经网络的人群密度估计方法技术

技术编号：10486936 阅读：391 留言：0更新日期：2014-10-03 16:00

本发明专利技术公开了一种基于级联多级卷积神经网络的人群密度估计方法，1)采用多级卷积神经网络，提取由低层到高层的特征，并且将低层和高层特征组合在一起形成多阶段的特征，从而增强了人群密度特征的可分性；2)根据多级卷积神经网络降采样层中特征图的相似性，去掉卷积神经网络中冗余神经元的连接，从而加快特征提取的速度；3)依据人群密度样本可分性的难易程度，训练了两种不同结构的多级卷积神经网络，并采用由简单到复杂的顺序级联这两种多级卷积神经网络，形成级联的多级卷积神经网络的人群密度估计模型，对视频终端实时获取的检测图像快速地进行人群密度等级的估计。本发明专利技术的实时性，检测准确度方面较之以前的方案都有了更好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于级联多级卷积神经网络的人群密度估计方法
本专利技术属于数字图像处理
，更为具体地讲，涉及一种视频智能监控系统中，对公共区域人群密度进行实时准确估计的方法。
技术介绍
随着计算机视觉技术和相关硬件的发展以及人类安全意识的不断提高，基于公共场合的智能监控技术越来越引起社会的广泛关注，也是实现数字化城市的重要组成部分。特别是针对公共场合中的人群管理能够有效地提高人身安全，防止因为过度拥堵导致的群体性践踏事件的发生，同时根据人群密度的区域分布实现对公共资源合理配置。因此针对公共场合的人群密度估计及其相关技术也得到了广泛应用。当前基于视频图像的人群密度估计主要通过以下两个步骤实现：人群特征提取、人群特征分类。人群特征提取主要是从监控设备采集到的视频图像上获取人群特征描述，从而刻画人群密度。当前人群特征描述主要集中在手工设计的纹理特征上，如：基于小波分析、基于LBP和基于灰度共生矩阵的GLDM纹理特征。人群特征分类主要集中在选择一个什么样的分类模型来拟合人群密度，从而获得相应人群密度等级。当前基于人群密度估计的分类器选择主要集中在支持向量机SVM和BP神经网络。然而由于公共场合的人群密度估计多为非约束的开放性环境，复杂多变，存在光照变化，视角变换，远近变换等，使用当前手工设计的人群特征和人群特征分类器，不能准确刻画人群密度的本征表示，对不同密度等级缺乏较强的可分性。另外，当前人群特征分类器由于自身较高的复杂性也降低了系统的处理速度，因此，需要一种准确、实时、且在复杂场合具有高适应性的人群密度估计方法。1、与本专利技术相关的现有技术一在中山大学和广州中大南...
一种基于级联多级卷积神经网络的人群密度估计方法

【技术保护点】
一种基于级联多级卷积神经网络的人群密度估计方法，其特征在于，包括以下步骤：(1)、离线训练和优化阶段1.1)、对于一个应用场景，将人群密度分为M个密度等级，然后，从视频终端监控视频中收集每个密度等级的人群密度样本各N1张组成训练集，收集每个密度等级的人群密度样本各N2张组成验证集；1.2)、人群密度估计模型的设计构造一个两阶段特征提取器和一个分类器的多级卷积神经网络作为人群密度估计模型，其中，每个阶段的特征提取器均包含一个卷积层和降采样层，执行卷积、降采样，分类器是一个不含隐藏层的全连接神经网络，依据第一阶段以及第二阶段输出的特征图进行人群密度等级进行估计，输出各密度等级的估计值，并根据估计值得到密度等级分类；在第一阶段的特征提取器中，输入为视频图像，输出为多张特征图，在卷积层，其计算公式为：yi1=f(x1⊗wi1+bi1)---(1),]]>其中，下标i表示卷积层特征图的索引，上标1表示参数属于第一阶段特征提取器的参数，yi表示第i个卷积层特征图，x表示输入的视频图像，wi表示第i个卷积核，bi表示第i个偏移量，表示卷积操作；在降采样层，无重叠地用一个均值核...

【技术特征摘要】
1.一种基于级联多级卷积神经网络的人群密度估计方法，其特征在于，包括以下步骤：(1)、离线训练和优化阶段1.1)、对于一个应用场景，将人群密度分为M个密度等级，然后，从视频终端监控视频中收集每个密度等级的人群密度样本各N1张组成训练集，收集每个密度等级的人群密度样本各N2张组成验证集；1.2)、人群密度估计模型的设计构造一个两阶段特征提取器和一个分类器的多级卷积神经网络作为人群密度估计模型，其中，每个阶段的特征提取器均包含一个卷积层和降采样层，执行卷积、降采样，分类器是一个不含隐藏层的全连接神经网络，依据第一阶段以及第二阶段输出的特征图进行人群密度等级进行估计，输出各密度等级的估计值，并根据估计值得到密度等级分类；在第一阶段的特征提取器中，输入为视频图像，输出为多张特征图，在卷积层，其计算公式为：其中，下标i表示卷积层特征图的索引，上标1表示参数属于第一阶段特征提取器的参数，yi表示第i个卷积层特征图，x表示输入的视频图像，wi表示第i个卷积核，bi表示第i个偏移量，表示卷积操作；在降采样层，无重叠地用一个均值核扫描卷积层特征图，输出与卷积层等数量的特征图；在第二阶段的特征提取器中，卷积层的输入为第一阶段输出的特征图和输出为多张特征图，在卷积层，其计算公式为：其中，上标2表示参数属于第二阶段特征特征提取器的参数，Gj为输入特征图即第一阶段输出的特征图与第二阶段输出的第j个卷积特征图的连接关系，wij表示第二阶段输出的第j卷积特征图与第i个第一阶段输出的特征图的卷积核，bj表示第j个偏移量；在降采样层，同第一阶段一样，无重叠地用一个均值核扫描卷积层特征图，输出与卷积层等数量的特征图；1.3)、采用BP算法训练简单结构的人群密度估计模型利用步骤1.2)的方法构建一个人群密度估计模型作为简单结构的人群密度估计模型，其采用经典的BP算法进行学习，学习速率设定为恒定值0.01；在训练集中，每个密度等级选出p1张人群密度样本，然后按张作为视频图像输入到简单结构的人群密度估计模型，计算每张人群密度样本经过简单结构的人群密度估计模型后的输出即各密度等级的估计值与自身样本标签中对应密度等级值的误差，然后进行平均，用平均误差来更新简单结构的人群密度估计模型的参数，包括特征提取器中的卷积核和偏移量，以及分类器中的权重和偏移量；其中，样本标签为各个密度等级的值，其中人群密度样本所属的密度等级1，其余密度等级的值为0；更新完毕后，在验证集上，每个密度等级选取p2张人群密度样本输入到简单结构的人群密度估计模型进行验证，如果每一个密度等级的分类正确率不再提高，则终止简单结构的人群密度估计模型的训练，否则重新选出p1张人群密度样本，继续简单结构的人群密度估计模型的训练，直到满足每一个密度等级分类正确率不再提高为止；1.4)、采用BP算法训练复杂结构的人群密度估计模型利用步骤1.2)的方法构建一个人群密度估计模型作为复杂结构的人群密度估计模型，其第一阶段特征提取器输出的特征图数量以及第二阶段特征提取器输出的特征...

【专利技术属性】
技术研发人员：李涛，叶茂，李旭冬，付敏，唐宋，向涛，黄仁杰，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人