本发明专利技术涉及机器学习、图像识别领域,具体涉及一种基于SSD网络的水面漂浮物多相机实时检测方法,包括以下步骤:步骤1:通过视频录制、相机拍摄和网络收集来采集水面漂浮物数据;步骤2:采用数据降噪和数据增强算法进行水面漂浮物数据扩增;步骤三:采用Labelimg工具对水面漂浮物数据集标注;步骤四:采用迁移学习对SSD网络模型进行训练获取最优权重模型;步骤五:基于SSD网络最优权重模型的多相机水面漂浮物目标实时检测。本发明专利技术基于SSD网络对水面漂浮物进行多相机实时检测,能够有效降低光照、天气和动态背景对实时检测造成的干扰,同时弥补单一相机检测的缺陷,满足实时性和精度的要求。的要求。的要求。
【技术实现步骤摘要】
一种基于SSD网络的水面漂浮物多相机实时检测方法
[0001]本专利技术属于机器学习、图像识别领域,涉及一种基于SSD网络的水面漂浮物多相机实时检测方法。
技术介绍
[0002]随着经济和社会的快速发展,我国城镇化建设步伐日益加快,大量的人口聚集到城市生活,给城市周边的环境和生态造成了严重的影响,许多饮水水源、城市内河、周边湖泊、水库等水面上出现大量的污染物,水面上的漂浮垃圾一般无法被溶解及自然稀释、且具有分布不均性,水面漂浮物的存在不仅影响了水体观感和城市的生活环境质量,也造成了水体的污染及生态平衡的破坏,甚至威胁到了航运和饮用水的安全。如何快速有效识别水面漂浮物,为水面安全规避、污染物清洁、水面交通安全等领域提供早期预警及实时监控等信息,成为了智能识别、信息化以及传感器领域的重要课题之一。
[0003]针对水面漂浮物的检测问题,目前虽然部分水域场景安装了实时监控设备,但是由于检测设备大多分布密度低且固定,只能监控到一定区域内的水面污染物,存在投入成本高、周期长且检测效率低下等问题。同时,现有的水域视频监控依托的设备多是单一相机,而单相机系统存在着视野范围小、获取信息少、可靠性较弱的缺陷,仍需有人对水面漂浮物监控画面进行人工监管,此管理方式不仅耗时费力,而且无法准确和实时监控水面漂浮物。
[0004]基于实际的水面污染物监管的需求,目前国内外相关研究成果大多存在图像识别精度低、图像信息量处理效率低、动态背景处理以及水面目标检测与识别算法问题,无法有效保证水面漂浮物检测实时性和准确性两者的平衡。针对目前水面漂浮物检测中存在的实际问题,本专利技术在人工智能和深度学习应用领域不断拓展的基础上,提出基于SSD(Single Shot MultiBox Detector,单发多目标检测器)网络对水面漂浮物进行多相机视频目标检测方法。
技术实现思路
[0005]本专利技术基于SSD网络,通过多相机对河流水面漂浮物进行实时监测,能够达到对漂浮物的坐标信息、类别和数量进行动态监测。基于水面漂浮物检测的信息数据判断是否对水面漂浮物进行处理,能够协助解决水污染问题。
[0006]为了达到上述目的,本专利技术采用的技术方案为:
[0007]一种基于SSD网络的水面漂浮物多相机实时检测方法,包括以下步骤:
[0008]第一步:采集数据,以视频录制、相机拍摄和网络资源收集为主要途径
[0009]运用多相机对河流水面进行全天候的录制获取视频资料,并利用Free Video to JPEGConverter将视频文件按照每帧为单位转换为图片,生成图片资料库A。利用相机实地对水面漂浮物图片进行拍摄采集,生成图片资料库B。通过百度搜集水面漂浮物图片,生成图片资料库C。最终得到用于训练SSD网络模型的数据集D,该数据集包含了图片资料库A、B
和C。
[0010]第二步:数据降噪增强
[0011]由于摄像机在室外录制漂浮物视频的过程中会受到光照、天气等不确定性因素的影响,造成恶劣条件下摄像机视觉系统获取的漂浮物图像质量较差。低对比度、噪声和不均匀或弱光条件不利于图像分析,并且可能携带用于漂浮物检测的潜在错误信息。利用数据降噪算法对数据集D进行降噪处理,提高水面漂浮物图像信息的精度。同时,利用数据增强算法对数据集D进行数据增强,对数据进行扩充生成数据集E(数据集E不包括数据集D),再将第一步得到的数据集D和生成的数据集E合并构成数据集F。通过10倍扩增训练数据集的规模,构造出更多的不同形状和大小的目标,有效避免由于水面漂浮物数据过少所造成的过拟合问题,提高了水面漂浮物识别性能和泛化能力。
[0012]进一步的,所述的数据增强算法包括随机旋转、反转、裁剪、缩放、平移、高斯噪声、模糊处理、颜色变换、擦除和填充10种。
[0013]第三步:图像目标标注,采用Labelimg工具对漂浮物数据集标注
[0014]为了保证标注工作的效率,针对漂浮物分布的特点确定区域标注的标注标准:
①
选择边界框的形式,对有明显漂浮物聚集的区域进行标注,边界框尽可能贴近聚集区范围;
②
选择大范围目标物(倾向聚集的大范围区域)进行标注,对多个分散小目标不进行单独标注。
[0015]通过人工标注的形式利用Labelimg工具对数据集F的水面漂浮物采用上述标注标准进行边界框标注,通过矩形区域表示漂浮物的坐标位置、范围和种类。具体包括:矩形框的中心点坐标、矩形框的长度和宽度、矩形框的类别。通过Labelimg工具对数据集F标注后形成数据集M。
[0016]第四步:训练SSD网络获取最优权重模型,预训练模型采用迁移学习进行模型训练
[0017]将水面漂浮物数据集M随机分成3个部分:训练集、验证集和测试集。其中训练集用于模型拟合的数据样本;验证集用于调整模型的超参数和用于对模型的能力进行初步评估;测试集用来评估模最终模型的泛化能力。三个数据集所占比例为:6:2:2。模型训练主要包括以下步骤:
[0018](1)模型训练:训练集主要作为SSD网络的初始训练数据。
[0019]将训练集作为SSD网络的初始数据,训练时使用SSD在PASCAL VOC数据集上的预先训练好的VGG16模型网络权重作为初始化,网络训练时采用随机梯度下降Adam算法进行优化,学习率(Learningrate)设定为0.001,权重衰减系数(Weightdecay)设置为0.0005,学习率的衰减因子(Learningratedecayfactor)设定为0.94,批量尺寸大小(Batchsize)设置为32,将模型保存的时间(Saveintervalsecs)设定为600s,模型迭代次数(epoch)设置为150000次。模型在完成迭代上限次数后保存为多个权重模型。
[0020](2)模型超参数调整:验证集主要用于网络模型超参数的调整。
[0021]①
在步骤(1)中得到多个权重模型的基础上,将验证集输入到多个权重模型中,各个权重模型通过验证集数据可以得到预测准确率,预测准确率是预测框与真实框的比值,获取预测准确率最高的权重模型。
②
选出预测准确率最高的权重模型对应的超参数,包括学习率(learning rate)、批量尺寸大小(batch size),迭代次数(epoch)、激活函数的选择、部分损失函数的可调系数以及正则化系数等,用以上超参数通过反向传播方式训练生
成最优权重模型。
[0022](3)模型泛化能力评估:测试集用来评估最终模型的泛化能力,不作为调参、选择特征等算法相关的选择的依据。
[0023]在步骤(1)和步骤(2)得到最优网络权重模型之后,将测试集输入到最优权重模型中,评估最优权重模型的性能和分类能力,性能指标包括准确率、召回率、平均精确度、每秒帧率等,将获得最优网络权重模型用于检测水面漂浮物的视频目标检测。
[0024]第五步:将SSD网络模型应用于多相机水面漂浮物视频目标实时检测
[本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于SSD网络的水面漂浮物多相机实时检测方法,其特征在于,包括以下步骤:第一步:采集数据运用多相机对河流水面进行全天候的录制获取视频资料,并将视频文件按照每帧为单位转换为图片,生成图片资料库A;利用相机实地对水面漂浮物图片进行拍摄采集,生成图片资料库B;通过百度搜集水面漂浮物图片,生成图片资料库C;最终得到用于训练SSD网络模型的数据集D,该数据集包含了图片资料库A、B和C;第二步:数据降噪增强利用数据降噪算法对数据集D进行降噪处理,提高水面漂浮物图像信息的精度;同时,利用数据增强算法对数据集D进行数据增强,对数据进行扩充生成数据集E,其中数据集E不包括数据集D,再将第一步得到的数据集D和生成的数据集E合并构成数据集F;通过扩增训练数据集的规模,能够有效避免由于水面漂浮物数据过少所造成的过拟合问题,提高水面漂浮物识别性能和泛化能力;第三步:图像目标标注,对漂浮物数据集标注为了保证标注工作的效率,针对漂浮物分布的特点确定区域标注的标注标准:
①
选择边界框的形式,对有明显漂浮物聚集的区域进行标注,边界框尽可能贴近聚集区范围;
②
选择大范围目标物进行标注,对多个分散小目标不进行单独标注;通过人工标注的形式,利用Labelimg工具对数据集F的水面漂浮物采用上述标注标准进行边界框标注,通过矩形区域表示漂浮物的坐标位置、范围和种类;具体包括:矩形框的中心点坐标、矩形框的长度和宽度、矩形框的类别;通过Labelimg工具对数据集F标注后形成数据集M;第四步:训练SSD网络获取最优权重模型,预训练模型采用迁移学习进行模型训练将水面漂浮物数据集M按照6:2:2的比例随机分成3个部分:训练集、验证集和测试集;其中训练集用于模型拟合的数据样本;验证集用于调整模型的超参数和...
【专利技术属性】
技术研发人员:彭勇,陈任飞,李昱,欧阳文宇,吴剑,岳廷秀,王浅宇,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。