本发明专利技术涉及一种街道垃圾识别方法。一种复杂环境下的街道垃圾识别方法,步骤如下:(1)首先获取街道图片并对有垃圾和没有垃圾的区域进行裁剪,构建样本集来训练深层卷积神经网络DCNN;(2)对于要检测的实时街道图片,将其与干净街道图片进行配准以及像素级作差,得到图像的变化区域,根据深层卷积神经网络DCNN的输出向量来判断该区域是否为垃圾,如果是垃圾,则在实时图像上进行标记。本发明专利技术能在尽量不遗漏垃圾目标的同时,有效抑制复杂环境以及光照变化等干扰因素所导致的误检测,实现复杂环境下的全天候街道垃圾识别。
【技术实现步骤摘要】
一种复杂环境下的街道垃圾识别方法
本专利技术属于计算机视觉与机器学习领域,尤其涉及一种街道垃圾识别方法。
技术介绍
随着社会经济水平的迅速发展,居民生活水平明显提高,商品消费量迅速增加,垃圾的排出量也随之增加,不仅污染环境,也影响城市美观。目前,针对街道垃圾的处理方式主要是环卫工人定时巡视与清扫,由于垃圾的产生没有固定的时间和空间规律,所以这种方法容易造成清扫不及时或者巡视一番并没有发现垃圾,从而浪费人力,并且不能保障城市卫生和形象。因此采用一种能够远程实时监视街道垃圾情况并实现垃圾定位的方法显得格外迫切并且有价值。现有的街道垃圾识别方法,例如中国专利文献号CN106203498A,公开了一种基于深度学习框架的城市场景垃圾检测方法:具体包括构建数据集,使用深度学习框架caffe选择并训练模型,最后利用训练好的模型对城市图像进行自动垃圾识别。该方法实现了全天候地监测和检测城市无序垃圾情况,但这种方法是对整个图像进行检测,由于深度学习网络错误率始终不可能为0,因此检测非垃圾的对象越多,出现误检测的几率越大,且城市场景极其复杂,经常会有类似垃圾但不是垃圾的静态物体出现在背景中,无疑会给这种方法带来大量误检测。因此,在复杂环境下的街道垃圾识别的过程中,有效地分离目标与背景,尽可能缩小检测范围,是非常有效且必要的。
技术实现思路
本专利技术的目的是公开一种尽量不遗漏垃圾目标的同时,有效抑制复杂环境以及光照变化等干扰因素所导致的误检测,实现复杂环境下的全天候街道垃圾识别的方法。本专利技术通过以下技术方案来实现上述目的:一种复杂环境下的街道垃圾识别方法,步骤如下:(1)首先获取街道图片并对有垃圾和没有垃圾的区域进行裁剪,构建样本集来训练深层卷积神经网络DCNN;(2)对于要检测的实时街道图片,将其与干净街道图片进行配准以及像素级作差,得到图像的变化区域,实现目标与背景的分离并缩小检测范围,采用R-CNN算法框架,在作差后的图片上使用图像分割算法获取局部视觉突出区域,即可能出现垃圾的位置,然后将实时图像上每一个可能出现垃圾的区域内的图像数据输入训练好的深层卷积神经网络DCNN进行识别,根据深层卷积神经网络DCNN的输出向量来判断该区域是否为垃圾,如果是垃圾,则在实时图像上进行标记。进一步地,所述构建样本集是指将图像中标记过的垃圾区域裁切出来,在裁切下来的图像块中垃圾面积要超过50%,作为正样本,同时裁切图像中的典型非垃圾区域,作为负样本,将正负样本图片归一化到相同大小。更进一步地,所述配准做差是指使用SIFT算法对实时图像与同一个街道场景的干净图像进行特征点提取、匹配并解出变换矩阵,利用变换矩阵将两幅图像调整到同一基准面上,然后将对应位置像素的R、G、B三个通道进行做差,获取作差图片。SIFT算法所提取的特征点具有旋转,缩放,亮度不变性,对视角变化也具有一定的稳定性,保证了图像抖动时垃圾识别功能的稳定运行。更进一步地,所述图像分割算法采用的是selectivesearch,通过该算法直接得到可能出现垃圾的局部视觉突出区域,大幅缩小了检测范围,与传统的使用滑动窗口对整幅图像进行检测的策略相比,本专利技术中首先通过selectivesearch获得可能区域,再对可能区域进行检测的方法,计算量更小,更节省时间。更进一步地,训练DCNN模型的具体步骤如下:A1:构建DCNN模型,所述DCNN模型由四个卷积层,两个平均池化层,一个最大池化层以及一个全连接层组成,每个卷积层采用RELU函数作为激活函数。A2:对DCNN模型的连接权值进行随机初始化。A3:将正、负样本混合在一起,并随机打乱顺序。将混合之后的数据集分成两份,分别为训练集和测试集。训练集数据量占总数据量的80%,测试集数据量占总数据量的20%。A4:将训练集输入DCNN模型,设置学习率和最大迭代次数,使用反向传播算法,调整网络中神经元之间的连接权值,使损失函数的值最小。每调整一次网络权值,使用测试集进行验证,保留测试精度最高的网络权值参数,作为DCNN模型最终的连接权值。更进一步地,所述DCNN模型第一、三、五、七层均为卷积层,第二、四层为平均池化层,第六层为最大池化层,第八层为全连接层,第一至八层依次正向级联。更进一步地,selectivesearch目标面积参数设置为100至2000之间,目标长宽比阈值设置为3,高斯滤波参数设置为1.0。面积参数以及长宽比参数的设置尽量宽松,具有普适性,能够适应日常的街道垃圾。更进一步地,RELU激活函数表示为f(x)=max(0,x),与传统的sigmoid激活函数和tanh激活函数相比,使用RELU激活函数可以使DCNN模型的收敛速度更快。本专利技术的有益效果在于:本专利技术包括训练样本获取部分,配准做差部分以及R-CNN算法框架三个部分,其中将训练样本获取部分的样本集输入DCNN模型,将DCNN模型训练成一个能够识别垃圾图像的分类器,再对要检测的实时图片进行变化检测,即将其与干净街道图像进行配准做差,该操作实现了背景的分离,缩小检测范围。最后对做差后的图片使用图像分割算法得到局部视觉突出区域,获得可能出现垃圾的位置,并排除了因为光照变化等干扰因素所造成的大面积图像变化区域,然后利用前面训练好的DCNN模型来对上述局部视觉突出区域进行识别。与现有技术相比,这种方法通过变化检测与局部视觉突出区域提取,逐步剔除了图像背景区域与光照变化等干扰因素造成的大面积变化区域,因此能在尽量不遗漏垃圾目标的同时,有效抑制复杂环境以及光照变化等干扰因素所导致的误检测,实现复杂环境下的全天候街道垃圾识别。附图说明图1是本专利技术所述复杂环境下的街道垃圾识别方法的流程图;图2是本专利技术所述DCNN模型的示意图。具体实施方式下面结合附图对本专利技术作进一步说明。本专利技术中的一些术语解释。R-CNN算法:R-CNN算法包含selectivesearch部分和DCNN部分,前者首先使用基于图的高效分割算法对整幅图像进行过分割,产生大量的子区域,再通过颜色、纹理、形状等指标将相似度较高的子区域两两合并,从而尽量保证物体的完整性,最后将面积超过设定范围的区域剔除,得到图像中的局部视觉突出区域,即疑似目标区域;DCNN是分类器,在本专利技术中的作用是判别疑似目标的类别是否为垃圾。SIFT算法:SIFT是一种检测局部尺度不变性特征点的算法,是当今计算机视觉领域中特征描述方面最热门的算法之一,它主要包括多尺度极值检测、关键点定位、计算方向、添加描述四个部分。在本专利技术中,通过检测实时街道图像与干净街道图像的局部尺度不变性特征点并且匹配,再使用RANSAC算法能够计算出两幅图像之间的变换矩阵,从而可以将两幅图像变换到同一个基准面上。如图1所示,本专利技术通过获取街道图片构建样本集,对DCNN模型进行训练,DCNN输入为RGB三波段图像,输入尺寸为61×61×3。对于要检测的实时街道图片,将其与干净街道图片进行配准以及像素级作差,获取变化区域,采用R-CNN算法框架,在作差后的图片上使用图像分割算法得到局部视觉突出区域,即可能出现垃圾的位置,然后将实时图像上每一个可能出现垃圾的区域内的图像数据归一化到61×61×3后输入到训练好的DCNN模型进行识别,根据DCNN模型的输出向量来判断推荐框内是否为垃圾,如本文档来自技高网...
【技术保护点】
一种复杂环境下的街道垃圾识别方法,其特征在于步骤如下:(1)首先获取街道图片并对有垃圾和没有垃圾的区域进行裁剪,构建样本集来训练深层卷积神经网络DCNN;(2)对于要检测的实时街道图片,将其与干净街道图片进行配准以及像素级作差,得到图像的变化区域,实现目标与背景的分离并缩小检测范围,采用R‑CNN算法框架,在作差后的图片上使用图像分割算法获取局部视觉突出区域,即可能出现垃圾的位置,然后将实时图像上每一个可能出现垃圾的区域内的图像数据输入训练好的深层卷积神经网络DCNN进行识别,根据深层卷积神经网络DCNN的输出向量来判断该区域是否为垃圾,如果是垃圾,则在实时图像上进行标记。
【技术特征摘要】
1.一种复杂环境下的街道垃圾识别方法,其特征在于步骤如下:(1)首先获取街道图片并对有垃圾和没有垃圾的区域进行裁剪,构建样本集来训练深层卷积神经网络DCNN;(2)对于要检测的实时街道图片,将其与干净街道图片进行配准以及像素级作差,得到图像的变化区域,实现目标与背景的分离并缩小检测范围,采用R-CNN算法框架,在作差后的图片上使用图像分割算法获取局部视觉突出区域,即可能出现垃圾的位置,然后将实时图像上每一个可能出现垃圾的区域内的图像数据输入训练好的深层卷积神经网络DCNN进行识别,根据深层卷积神经网络DCNN的输出向量来判断该区域是否为垃圾,如果是垃圾,则在实时图像上进行标记。2.根据权利要求1所述的一种复杂环境下的街道垃圾识别方法,其特征在于所述构建样本集是指将图像中标记过的垃圾区域裁切出来,在裁切下来的图像块中垃圾面积要超过50%,将其作为正样本,同时裁切图像中的典型非垃圾区域,作为负样本,将正负样本图片归一化到相同大小。3.根据权利要求1所述的一种复杂环境下的街道垃圾识别方法,其特征在于所述配准是指使用SIFT算法对实时图像与同一个街道场景的干净图像进行特征点检测,并匹配两幅图像中相同的特征点,通过RANSAC算法求得两幅图像之间的变换矩阵,利用变换矩阵把两幅图像调整到同一基准面上。4.根据权利要求1所述的一种复杂环境下的街道垃圾识别方法,其特征在于所述做差是指在同一基准面上的两幅图像中,对应位置像素的R、G、B三个通道分别进行做差并取绝对值,获取作差图片。5.根据权利要求1所述的一种复杂环境下的街道垃圾识别方法,其特征在于所述图像分割算法采用的是selectivese...
【专利技术属性】
技术研发人员:黄正,谭敦茂,
申请(专利权)人:浙江联运知慧科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。