一种基于编码-解码结构多尺度卷积神经网络的人群计数方法技术

技术编号：24411430 阅读：109 留言：0更新日期：2020-06-06 09:23

本发明专利技术公开了一种基于编码‑解码结构多尺度卷积神经网络的人群计数方法，其特征在于，包括以下步骤：考虑图像的视角扭曲，采用自适应高斯滤波器，计算图像的真值密度图；采用编码‑解码结构，搭建多尺度卷积神经网络模型，所述多尺度卷积神经网络模型的损失函数包括像素空间损失和计数误差描述；对搭建的多尺度卷积神经网络模型进行训练和测试，获得训练好的多尺度卷积神经网络模型；将待估图像输入训练好的多尺度卷积神经网络模型，预测获得人群密度图；对人群密度图进行回归估计，获得待估图像的人员数量。本发明专利技术的方法，能够保留尺度特征和图像的上下文信息；可提升密度图的输出质量。

A population counting method based on multi-scale convolutional neural network with coding decoding structure

全部详细技术资料下载

【技术实现步骤摘要】
一种基于编码-解码结构多尺度卷积神经网络的人群计数方法
本专利技术属于图像处理
，特别涉及一种基于编码-解码结构多尺度卷积神经网络的人群计数方法。
技术介绍
随着国民经济迅猛发展及城市化进度不断加快，城市人口数量急剧增加，由此带来的社会问题也不断增加；例如，人员拥挤导致踩踏等不安全事故的发生；候车大厅人员的增加对交通调度带来的压力等。解决上述问题需要准确预测出场景下的人群数量，而图像可以清晰直观的反映出实际场景中的人群变化情况，因此基于图像信息的人群密度估计与计数有重要的研究意义。卷积神经网络(ConvolutionalNeuralNetwork，CNN)模型因具有获取深层次特征的能力，在语义分割、目标检测与识别等领域发展迅速，研究人员也将其应用于人群计数领域并取得了较好的效果。Zhang(ZHANGY,ZHOUD,CHENS,etal.Single-ImageCrowdCountingviaMulti-ColumnConvolutionalNeuralNetwork[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).LasVegas，NV，USA:IEEE,2016:589-597.)等首次提出一种多列卷积神经网络(Multi-ColumnConvolutionalNeuralNetwork，MCNN)模型，其通过多列CNN结构并行提取多尺度信息，一定程度上解决了多尺度特征提取问题，大大提升了人群计数的精度。受到...

【技术保护点】
1.一种基于编码-解码结构多尺度卷积神经网络的人群计数方法，其特征在于，包括以下步骤：/n步骤1，采集场景的图像，考虑图像的视角扭曲，采用自适应高斯滤波器，计算图像的真值密度图；/n步骤2，采用编码-解码结构，搭建多尺度卷积神经网络模型，用于计算人群的人员数量；其中，所述多尺度卷积神经网络模型的损失函数包括像素空间损失和计数误差描述；/n步骤3，根据步骤1采集的图像以及其对应的真值密度图，对步骤2搭建的多尺度卷积神经网络模型进行训练和测试，获得训练好的多尺度卷积神经网络模型；/n步骤4，将待估图像输入步骤3训练好的多尺度卷积神经网络模型，预测获得人群密度图；对人群密度图进行回归估计，获得待估图像的人员数量。/n

【技术特征摘要】
1.一种基于编码-解码结构多尺度卷积神经网络的人群计数方法，其特征在于，包括以下步骤：
步骤1，采集场景的图像，考虑图像的视角扭曲，采用自适应高斯滤波器，计算图像的真值密度图；
步骤2，采用编码-解码结构，搭建多尺度卷积神经网络模型，用于计算人群的人员数量；其中，所述多尺度卷积神经网络模型的损失函数包括像素空间损失和计数误差描述；
步骤3，根据步骤1采集的图像以及其对应的真值密度图，对步骤2搭建的多尺度卷积神经网络模型进行训练和测试，获得训练好的多尺度卷积神经网络模型；
步骤4，将待估图像输入步骤3训练好的多尺度卷积神经网络模型，预测获得人群密度图；对人群密度图进行回归估计，获得待估图像的人员数量。

2.根据权利要求1所述的一种基于编码-解码结构多尺度卷积神经网络的人群计数方法，其特征在于，步骤1中具体包括：
步骤1.1，采集的图像x中第i个坐标为xi的人头标记点，表示为函数δ(x-xi)；对于一张具有N个人头标记点的图像，表示为H(x)函数，表达式为：

步骤1.2，考虑图像的视角扭曲，采用自适应高斯滤波器Gσ与H(x)函数进行卷积，获得密度图方程，表达式为：

第i个坐标为xi的人头标记点的自适应高斯核表达式为：

式中，是标记点xi与其最近的K个人头之间的平均距离。

3.根据权利要求2所述的一种基于编码-解码结构多尺度卷积神经网络的人群计数方法，其特征在于，步骤1.2中，参数β＝0.3。

4.根据权利要求1所述的一种基于编码-解码结构多尺度卷积神经网络的人群计数方法，其特征在于，步骤2搭建的多尺度卷积神经网络模型中：
编码器通过多尺度卷积模块捕获多尺度特征，用于从原始图像中学习与尺度相关的特征，实现多尺度信息的有效获取；
采用空洞空间金字塔池化模块聚合尺度特征，用于避免细节信息的丢失；
解码器对编码器的输出进行上采样，并与前半层的输出特征图经1x1卷积匹配通道数后融合，再经一个3x3的卷积核微调，进行输出，获得预测密度图。

【专利技术属性】
技术研发人员：孟月波，刘光辉，徐胜军，纪拓，
申请(专利权)人：西安建筑科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人