The present invention relates to a method of object detection based on semantic segmentation enhancement, which includes: preparing labeled images; partitioning image sets; designing a structure of depth convolution neural network based on semantic segmentation enhancement for object detection. The depth convolution neural network based on semantic segmentation enhancement includes three main parts: backbone subnetwork, segmentation subnetwork and detection subnetwork. The backbone sub-network is used to extract the general features of images, which are category-independent features; the segmentation sub-network extracts the features of semantic segmentation based on the backbone sub-network extracting features, and then extracts the features of semantic segmentation and predicts the thermal maps of each class of objects; the thermal maps of each class of objects are used as the prior knowledge of this class, and are fused with the features extracted by the detection sub-network to generate the thermal maps. Class-related features, each type of object has the corresponding category characteristics, which significantly reflects the characteristics of this type of object; model training.
【技术实现步骤摘要】
一种基于语义分割增强的物体检测方法
本专利技术涉及计算机视觉领域中高性能的物体检测方法,特别是涉及采用深度学习方法进行图像物体检测的方法。
技术介绍
深度学习技术作为人工智能发展过程中的关键技术,已经广泛的应用于智能监控、人机交互、辅助驾驶以及自动驾驶等多个领域,实现对场景中人、车以及其他类物体的实时检测与识别。作为深度学习技术中的重要实现方法,深度卷积神经网络在物体检测任务上已经取得了显著成果。以自动驾驶系统为例,如图1所示,在物体检测任务中,首先通过车载相机捕获现实场景中的视频/图像;进一步地,将相机捕获的视频/图像输入到物体检测算法中;通过物体检测算法的运行,输出所检测到的物体的位置以及物体的类别;经过决策层,根据检测到的物体信息进行自动驾驶的决策,实现安全的自动驾驶。作为自动驾驶中的关键技术,物体检测的精度直接关乎自动驾驶的安全程度,因此提升物体检测的精度,能够有效保证自动驾驶的安全性,进一步推动自动驾驶的发展。现有的性能较优的物体检测算法是基于深度卷积神经网络的物体检测算法。Girshick等人[1][2]提出一种基于深度卷积神经网络的物体检测算法,首先通过卷积神经网络提取特征并生成候选窗口,然后将候选窗口通过检测子网络得出最终的预测结果。Liu等人[3]为进一步提升物体检测的效率,提出一种单阶段的物体检测算法,即将图像直接输入到深度卷积神经网络中,通过网络直接输出对物体框的回归和分类结果,略去了双阶段物体检测算法中候选窗口生成的阶段,一定程度上提升了物体检测的速度,但是物体检测的精度有所下降。Dvornik等人[4]提出将语义分割和物体检测任务 ...
【技术保护点】
1.一种基于语义分割增强的物体检测方法,包括下列步骤:1)准备标注好的图像,收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容为每个物体的位置、每个物体的类别以及每个像素点的所属物体类别,以其作为图像标签信息;2)图像集划分,将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络,验证集用于选择最佳的训练模型,测试集为后续测试模型效果或者实际应用时使用;3)设计基于语义分割增强的深度卷积神经网络结构,以适用于物体检测,基于语义分割增强的深度卷积神经网络包含三个主要部分:主干子网络,分割子网络和检测子网络,主干子网络用来提取图像的通用特征,该特征是类别无关的特征;分割子网络基于主干子网络提取特征的基础上,进一步提取语义分割的特征并预测每一类物体的分割的热图,每一类的热图中,存在该类物体的位置响应值显著,而其他所有类别物体的位置响应值不显著,能够有效的反映出不同类别物体之间的差异;将每一类物体的热图作为该类的先验知识,并与检测子网络提取的特征相融合,进而产生类别相关的特征,每一类物体有对应类别的特征,该特征显著反映该类物体的特性,在检测子网络中,基于类 ...
【技术特征摘要】
1.一种基于语义分割增强的物体检测方法,包括下列步骤:1)准备标注好的图像,收集包含各种不同类别物体的图像,并标注每张图像中的所有感兴趣物体,标注内容为每个物体的位置、每个物体的类别以及每个像素点的所属物体类别,以其作为图像标签信息;2)图像集划分,将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络,验证集用于选择最佳的训练模型,测试集为后续测试模型效果或者实际应用时使用;3)设计基于语义分割增强的深度卷积神经网络结构,以适用于物体检测,基于语义分割增强的深度卷积神经网络包含三个主要部分:主干子网络,分割子网络和检测子网络,主干子网络用来提取图像的通用特征,该特征是类别无关的特征;分割子网络基于主干子网络提取特征的基础上,进一步提取语义分割的特征并预测每一类物体的分割的热图,每一类的热图中,存在该类物体的位置响应值显著,而其他所有类别物体的位...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。