本发明专利技术公开了一种基于深度学习模型识别结果的区域检测修正方法,具体涉及人工智能领域,修正设备;所述修正设备包括运行设备,所述运行设备的连接端设有深度卷积神经网络模型存储器,所述运行设备包括电脑,所述深度卷积神经网络模型存储器内部存储有深度卷积神经网络模型。本发明专利技术利用图像中的纹理信息、边缘信息和颜色信息预先找出图中目标可能出现的位置,可以保证在选取较少窗口的情况下保持较高的召回率,大大降低了后续操作的时间复杂度,并且获取的候选窗口相较于滑动窗口质量更高,进而实现对目标物体检测的最优识别,检测效率较高的同时检测结果更加准确,鲁棒性较好,在计算机视觉领域实际应用中有重要的应用前景。
A Region Detection and Modification Method Based on the Recognition Result of Deep Learning Model
【技术实现步骤摘要】
一种基于深度学习模型识别结果的区域检测修正方法
本专利技术涉及人工智能
,更具体地说,本专利技术涉及一种基于深度学习模型识别结果的区域检测修正方法。
技术介绍
传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类;具体包括以下步骤:1、区域选择:利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;2、特征提取:提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征;行人检测和普通目标检测常用的HOG特征等。由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易,然而提取特征的好坏直接影响到分类的准确性;3、分类器:利用分类器进行识别,比如常用的SVM模型。传统的目标检测中,多尺度形变部件模型DPM实际使用效果较好,DPM把物体看成了多个组成的部件,如人脸的鼻子、嘴巴和眼睛等,用部件间的关系来描述物体。但是在实际运用过程中,DPM还是存在一些缺点,一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有较好好的鲁棒性。
技术实现思路
为了克服现有技术的上述缺陷,本专利技术的实施例提供一种基于深度学习模型识别结果的区域检测修正方法,通过基于深度卷积神经网络模型存储器中的深度卷积神经网络模型进行目标识别,检测任意两个区域之间的IoU,选择最适合的区域,即候选区域,相较于现有技术,对于滑动窗口存在的问题,候选区域利用了图像中的纹理信息、边缘信息和颜色信息预先找出图中目标可能出现的位置,可以保证在选取较少窗口的情况下保持较高的召回率,大大降低了后续操作的时间复杂度,并且获取的候选窗口相较于滑动窗口质量更高,进而实现对目标物体检测的最优识别,检测效率较高的同时检测结果更加准确,鲁棒性较好,在计算机视觉领域实际应用中有重要的应用前景,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于深度学习模型识别结果的区域检测修正方法,包括修正设备;所述修正设备包括运行设备1,所述运行设备1的连接端设有深度卷积神经网络模型存储器2,所述运行设备1包括电脑3,所述深度卷积神经网络模型存储器2内部存储有深度卷积神经网络模型4;具体包括以下步骤:S1:首先,以运行设备1中的电脑3为载体并基于深度卷积神经网络模型存储器2中的深度卷积神经网络模型4进行目标识别,即利用深度卷积神经网络模型4识别目标物体,需要识别的目标物体包括车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报告和机动车排气污染物检测报告;S2:其次,针对所识别的物体,即车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报告和机动车排气污染物检测报告,逐一生成对应的目标区域集;S3:然后,针对生成的目标区域集,计算出其所有可能的组合形式;S4:然后,求出每个组合中候选框和原标记框的比例,即IoU;S5:然后,将IoU与设定的阈值进行匹配,若IoU小于阈值,则返回继续求出各个组合的IoU,反之则删除小于阈值的组合;S6:最后,依此遍历所有组合,最终得出最合适的区域并输出,进而预先找出图中目标可能出现的位置,可以保证在选取较少窗口的情况下保持较高的召回率,大大降低了后续操作的时间复杂度,并且获取的候选窗口相较于滑动窗口质量更高。在一个优选地实施方式中,所述运行设备1的连接端还设有用于进行加速计算的CUDAGPU5。在一个优选地实施方式中,所述运行设备1的连接端还设有用于实时存储区域检测修正进度的云端存储器6。本专利技术的技术效果和优点:1、本专利技术通过基于深度卷积神经网络模型存储器中的深度卷积神经网络模型进行目标识别,检测任意两个区域之间的IoU,选择最适合的区域,即候选区域,相较于现有技术,对于滑动窗口存在的问题,候选区域利用了图像中的纹理信息、边缘信息和颜色信息预先找出图中目标可能出现的位置,可以保证在选取较少窗口的情况下保持较高的召回率,大大降低了后续操作的时间复杂度,并且获取的候选窗口相较于滑动窗口质量更高,进而实现对目标物体检测的最优识别,检测效率较高的同时检测结果更加准确,鲁棒性较好,在计算机视觉领域实际应用中有重要的应用前景;2、通过设有CUDAGPU,以便于当运行设备中的电脑作为载体并基于深度卷积神经网络模型存储器中的深度卷积神经网络模型进行目标识别时,CUDAGPU对电脑进行辅助,从而进行加速运算,进而提高运算效率,优化资源配置;3、通过设有云端存储器,以便于当运行设备中的电脑作为载体并基于深度卷积神经网络模型存储器中的深度卷积神经网络模型进行目标识别时,云端存储器实时接收电脑工作过程中产生的工作数据,并对其进行存储,当发生意外情况导致电脑断电或死机时,当电脑恢复后,使用者可以通过电脑对云端存储器中的数据进行读取,从而恢复原先进度,避免造成进度丢失的情况发生,数据安全性更高。附图说明图1为本专利技术的修正设备系统结构示意图。图2为本专利技术的流程结构示意图。附图标记为:1运行设备、2深度卷积神经网络模型存储器、3电脑、4深度卷积神经网络模型、5CUDAGPU、6云端存储器。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如附图1与附图2所示的一种基于深度学习模型识别结果的区域检测修正方法,包括修正设备;所述修正设备包括运行设备1,所述运行设备1的连接端设有深度卷积神经网络模型存储器2,所述运行设备1包括电脑3,所述深度卷积神经网络模型存储器2内部存储有深度卷积神经网络模型4;所述深度卷积神经网络模型4为一种神经网络算法,用于识别所需的目标物体,作为神经网络的一种,深度卷积神经网络模型4通过多层特征提取层的叠加得到比较复杂的网络结构,得到卷积层、下采样层、全连接层以及分类器构成了深度神经网络结构;所述深度卷积神经网络模型4具体包括:1、局部感知:即图像的空间联系中局部的像素联系比较紧密,而距离较远的像素相关性则较弱,因此,每个神经元其实只需对局部区域进行感知,而不需要对全局图像进行感知;2、权值共享:在局部连接中,每个神经元都对应25个参数,一共10000个神经元,如果这10000个神经元的25个参数都是相等的,那么参数数目就变为25了,把这25个参数对应的卷积操作,看成是特征提取的方式,与图像区域的位置无关,卷积神经网络中相同的卷积核的权值和偏置值是一样的,同一种卷积核按照某种顺序对图像进行卷积操作,卷积后得到的所有神经元都是使用同一个卷积核区卷积图像的,都是共享连接参数,因此,权值共享减少了卷积神经网络的参数数量;3、卷积:利用卷积核对图像进行特征提取,卷积过程就是一个减少参数数量的过程,卷积过程最重要的就是卷积核的大小步长设计和数量的选取,个数越多提取的特征越多,但网络的复杂度也在增加,易出现过拟本文档来自技高网...
【技术保护点】
1.一种基于深度学习模型识别结果的区域检测修正方法,其特征在于,包括修正设备;所述修正设备包括运行设备(1),所述运行设备(1)的连接端设有深度卷积神经网络模型存储器(2),所述运行设备(1)包括电脑(3),所述深度卷积神经网络模型存储器(2)内部存储有深度卷积神经网络模型(4);具体包括以下步骤:S1:首先,以运行设备(1)中的电脑(3)为载体并基于深度卷积神经网络模型存储器(2)中的深度卷积神经网络模型(4)进行目标识别,即利用深度卷积神经网络模型(4)识别目标物体,需要识别的目标物体包括车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报告和机动车排气污染物检测报告;S2:其次,针对所识别的物体,即车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报告和机动车排气污染物检测报告,逐一生成对应的目标区域集;S3:然后,针对生成的目标区域集,计算出其所有可能的组合形式;S4:然后,求出每个组合中候选框和原标记框的比例,即IoU;S5:然后,将IoU与设定的阈值进行匹配,若IoU小于阈值,则返回继续求出各个组合的IoU,反之则删除小于阈值的组合;S6:最后,依此遍历所有组合,最终得出最合适的区域并输出,进而预先找出图中目标可能出现的位置,可以保证在选取较少窗口的情况下保持较高的召回率,大大降低了后续操作的时间复杂度,并且获取的候选窗口相较于滑动窗口质量更高。...
【技术特征摘要】
1.一种基于深度学习模型识别结果的区域检测修正方法,其特征在于,包括修正设备;所述修正设备包括运行设备(1),所述运行设备(1)的连接端设有深度卷积神经网络模型存储器(2),所述运行设备(1)包括电脑(3),所述深度卷积神经网络模型存储器(2)内部存储有深度卷积神经网络模型(4);具体包括以下步骤:S1:首先,以运行设备(1)中的电脑(3)为载体并基于深度卷积神经网络模型存储器(2)中的深度卷积神经网络模型(4)进行目标识别,即利用深度卷积神经网络模型(4)识别目标物体,需要识别的目标物体包括车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报告和机动车排气污染物检测报告;S2:其次,针对所识别的物体,即车辆号牌号码、车辆识别代码、车辆前后灯光亮灭状态、汽车座椅安全带、车辆车身颜色、机动车行驶证、机动车牌证申请表、机动车安全技术检测报...
【专利技术属性】
技术研发人员:吴祥淼,葛武,张家豪,王勇,
申请(专利权)人:广州华工邦元信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。