【技术实现步骤摘要】
一种基于特征聚合网络的人群区域监控方法
[0001]本专利技术涉及机器学习
,主要涉及一种基于特征聚合网络的人群区域监控方法。
技术介绍
[0002]视频中的语义分割和区域定位计算机视觉领域中的一个重要研究课题,具有重要的理论意义与实际应用价值。
[0003]近年来,随着城市安全问题的日渐突出,监控定位人群显得尤其的重要。人群区域定位是一项基于计算机视觉技术、机器学习,可以对监控范围内的人群进行监视、可以自主定位监控范围内的人群的现代化监控技术。随着深度学习的发展,越来越多的人群定位方法融入语义分割技术。语义分割技术是利用神经网络将图片中的每一个像素点进行分类,从而得到目标位于图中的位置和标签信息。
[0004]语义分割技术可以感知路面,行人,街道,建筑物等。但是目前的语义分割技术分割速度较慢,大多数研究者都只重视分割的准确度,这导致语义分割技术难以运用到其他应用邻域例如人群定位邻域中,对于这个问题,采用更加轻量级的Unet算法,将语义分割技术运用到人群定位中。
技术实现思路
[0005]专利技术目的:本专利技术提供了一种基于特征聚合网络的人群区域监控方法,采集视频中人群区域信息与图像信息,将场景信息与人群信息进行提取并进行二者信息的融合,并使用神经网络算法提高对人群区域识别的准确度。
[0006]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0007]一种基于特征聚合网络的人群区域监控方法,包括以下步骤:
[0008]步骤S1、对输入的人群分 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征聚合网络的人群区域监控方法,其特征在于,包括以下步骤:步骤S1、对输入的人群分布不均匀的图像进行标签化处理,获取特征标签图像,生成包括人群区域信息的yaml文件;设置过滤阈值,对特征区域进行过滤如下:当输入图像中某一块特征区域的像素点数量小于时,过滤掉所述特征区域;其中S
i
为第i块标签图像的像素点个数,N为当前特征标签图像的总的标签个数,e为自然常数;步骤S2、将所述特征标签图像输入至MobileNet网络中,使用Unet网络进行网络训练并提取特征;在池化操作时对网络提取的特征图像做无监督的K
‑
means操作,并向对等层的特征还原网络做特征向量的复制和剪切,实现特征向量的提取;具体地,步骤S2.1、特征提取模块获取规格为n*m的特征标签图像信息,通过对视频场景进行预处理与场景识别来描述场景底层特征;步骤S2.2、将特征标签图像输入至MobileNet网络模型中;对于每次可分离卷积,首先将I个k*k的卷积核遍历I通道的数据,获取I通道的特征图谱;接着采用O个1x1大小的卷积核遍历这I个特征图谱,网络所需要的特征参数量为K2I+IO,其中K表示卷积核的大小,I表示输入特征图谱,O表示1x1大小的卷积核;步骤S2.3、采用Unet网络模型对特征标签图像进行特征提取;损失函数如下:其中ω(x)表示标签为x的权值,log(p(x))表示x标签出现概率的自然对数;对于每一块像素区域添加该区域的权重值如下:其中w
c
(x)为类别频率的权重,d1,d2依次代表像素点距离各聚类中心的距离中最短的2个距离;步骤S2.4、通过聚类算法,对所述特征标签图像中每个像素增加权重值;对每个特征向量X
i
,找出最相邻的k个特征向量,并将X
i
改写成所述k个特征向量的线性表示;对于每一个样例k,计算所属标签类如下:其中u
j
表示每个类所在的中心,c
k
表示每个像素点到聚类中心的欧式距离;步骤S2.5、采用迭代更新法重新计算每个标签类的聚类中心如下:其中u
j
为每个类的中心,表示属于第j类卷积上的像素点第i维度上的值,
表示第j类的到聚类中心的距离总和;更新每个标签类里面特征向量的值如下:其中x
k
为当前的特征值,d
k
为当前特征向量所属的标签类;步骤S2.6、使用卷积核大小为2x2的下采样进行特征提取,最终得到输入图像的特征向量信息;步骤S3、将步骤S2中获取的特征向量信息输入至UNet还原...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。