图像中目标对象的识别方法、装置、终端设备及存储介质制造方法及图纸

技术编号:31572265 阅读:31 留言:0更新日期:2021-12-25 11:12
本发明专利技术公开了一种图像中目标对象的识别方法、装置、终端设备及存储介质,所述方法包括:获取待识别图像;将所述待识别图像输入至预设的图像目标识别模型中,以使所述图像目标识别模型识别所述待识别图像中是否包含预设目标对象;其中,所述图像目标识别模型基于原始图像中预设目标对象的第一主体图像、预设目标对象的第一边缘过渡区域图像、与所述第一主体图像对应的语义标注图像以及与所述第一边缘过渡区域图像对应的语义标注图像,通过预设的神经网络训练而成。通过实施本发明专利技术实施例能够提高在少样本的情况下,提高图像中目标对象识别的准确性。识别的准确性。识别的准确性。

【技术实现步骤摘要】
图像中目标对象的识别方法、装置、终端设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像中目标对象的识别方法、装置、终端设备及存储介质。

技术介绍

[0002]在人工智能图像识别领域中,现有的图像目标识别模型在训练时,需要采集目标对象在不同场景、不同角度下的图像,然后对各图像中的目标对象与背景进行分割后,基于所分割的目标对象的主体图像进行训练。采用上述方案需要采集大量的样本,在缺少大量样本数据的情况所构建图像目标识别模型,在目标识别时准确性较差。

技术实现思路

[0003]本专利技术实施例提供一种图像中目标对象的识别方法、装置、终端设备及存储介质,能够提高在少样本的情况下,提高图像中目标对象识别的准确性。
[0004]本专利技术一实施提供了一种图像中目标对象的识别方法,包括:
[0005]获取待识别图像;
[0006]将所述待识别图像输入至预设的图像目标识别模型中,以使所述图像目标识别模型识别所述待识别图像中是否包含预设目标对象;
[0007]其中,所述图像目标识别模型基于原始图像中预设目标对象的第一主体图像、预设目标对象的第一边缘过渡区域图像、与所述第一主体图像对应的语义标注图像以及与所述第一边缘过渡区域图像对应的语义标注图像,通过预设的神经网络训练而成。
[0008]在这一实施例中,将目标对象的主体图像以及边缘过渡区域图像进行提取作为训练样本,目标对象的主体图像可以表征目标对象本身的颜色、形状以及纹理等特征,而边缘过渡区域图像可以表征目标对象的边缘与图像背景接壤部分所体现的特征,进而使得即使在少样本甚至单样本的情况下所训练出来的模型依旧能够根据目标对象本身的特征,以及目标对象的边缘与图像背景接壤部分的特征,基于这两方面的特征实现对目标对象的精准识别,提高在少样本甚至单样本的情况下图像目标识别的准确性。
[0009]在一个优选的实施例中,所述图像目标识别模型的构建方法包括:
[0010]获取所述原始图像中预设目标对象的第一主体图像以及第一边缘过渡区域图像;
[0011]获取与所述第一主体图像对应的语义标注图像,得到第二主体图像;获取与所述第一边缘过渡区域图像对应的语义标注图像,得到第二边缘过渡区域图像;
[0012]将所述第一主体图像、所述第一边缘过渡区域图像、所述第二主体图像以及所述第二边缘过渡区域图像,输入至预设的GAN神经网络中,对所述GAN神经网络中的生成器和判别器进行交替迭代训练,并将训练完成后的生成器作为所述图像目标识别模型。
[0013]在这一实施例中,基于GAN神经网络进行对抗训练,相比与其他生成模型只用到了反向传播,而不需要复杂的马尔科夫链,从而降低了模型的训练难度。
[0014]在一个优选的实施例中,所述生成器包括:若干层级的隐藏层;
[0015]在训练所述生成器时,从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的特征向量,生成特征向量集;将所述特征向量集分别输入至各层级的隐藏层中,对所述生成器中的各隐藏层进行训练;
[0016]其中,当待训练的隐藏层为第一层隐藏层时,根据所述特征向量集以及所述特征向量集在第一层隐藏层的影响权重,对所述待训练的隐藏层进行训练;
[0017]当所述待训练的隐藏层不为第一层隐藏层时,根据所述特征向量集、所述特征向量集在所述待训练的隐藏层的影响权重以及上一层隐藏层的输出结果,对所述待训练的隐藏层进行训练。
[0018]与传统的GAN神经网络不同,在传统的GAN神经网络中,第一层隐藏层根据输入样本进行训练,并将生成的结果传递至第二层隐藏层,紧接着第二层隐藏层根据第一层隐藏层的生成结果进行训练,然后将生成的结果传递至第三层隐藏层,依次类推;采样这种方式进行训练,在少样本的场景下,中间层级的隐藏层会出现训练不充分或过拟合的问题。为此,在本专利技术这一实施例中,对GAN神经网络中生成器的网络结构进行更改,将输入层所提取的样本的特征向量按各预设的影响权重输入至各个隐藏层中,中间各个隐藏层可以根据上一隐藏层的输出结果以及样本的特征向量进行训练,解决了少样本或单样本的情况下,中间隐藏层由于缺乏训练样本导致训练不充分或过拟合的问题,进一步提高了模型的效果。
[0019]在一个优选的实施例中,所述从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的特征向量,生成特征向量集,具体包括:
[0020]从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的颜色像素矩阵,生成颜色像素矩阵集,将所述颜色像素矩阵集作为所述特征向量集。
[0021]在一个优选的实施例中,所述获取与所述第一主体图像对应的语义标注图像,得到第二主体图像;获取与所述第一边缘过渡区域图像对应的语义标注图像,得到第二边缘过渡区域图像,具体包括:
[0022]按预设的颜色对所述第一主体图像以及所述第一边缘过渡区域图像进行语义标注,获得所述第二主体图像以及所述第二边缘过渡区域图像。
[0023]在一个优选的实施例中,通过预设的图像分割模型,对所述原始图像中预设目标对象进行分割,获得所述第一主体图像。
[0024]在一个优选的实施例中,通过预设的图像分割模型,对所述原始图像中预设目标对象进行分割,获得所述第一主体图像,可降低了人工动分割的复杂性。
[0025]在一个优选的实施例中,将所述预设目标对象沿对象边缘,按所述预设目标对象的面积向外扩展第一预设比例后所增加的图像区域,与将所述预设目标对象沿对象边缘,按所述预设目标对象的面积向内收缩第二预设比例后所减少的图像区域进行组合,获得所述预设目标对象的第一边缘过渡区域图像。
[0026]在一优选的实施例中,所述第一预设比例的取值范围为[10%,50%];所述第二预设比例的取值范围为[10%,50%]。
[0027]在这一实施例中,取目标对象边缘向外扩展至少10%以及向内收缩不大于50%的区域,作为边缘过渡区域;图像背景与预设目标对象边缘接壤部分的特征,在这个区域内能够得到很好体现,因此提取这一范围内的图像区域作为第一边缘过渡区域,使得训练出来
模型能够更加精准的识别出目标对象,进一步提高目标对象的识别效果。
[0028]在上述方法项实施例的基础上,本专利技术对应提供了装置项实施例;
[0029]本专利技术一实施例提供了一种图像中目标对象的识别装置,包括:待识别图像获取模块以及目标对象识别模块;
[0030]所述待识别图像获取模块,用于获取待识别图像;
[0031]所述目标对象识别模块,用于将所述待识别图像输入至预设的图像目标识别模型中,以使所述图像目标识别模型识别所述待识别图像中是否包含预设目标对象;其中,所述图像目标识别模型基于原始图像中预设目标对象的第一主体图像、预设目标对象的第一边缘过渡区域图像、与所述第一主体图像对应的语义标注图像以及与所述第一边缘过渡区域图像对应的语义标注图像,通过预设的神经网络训练而成。
[0032]在一个优选的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像中目标对象的识别方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入至预设的图像目标识别模型中,以使所述图像目标识别模型识别所述待识别图像中是否包含预设目标对象;其中,所述图像目标识别模型基于原始图像中预设目标对象的第一主体图像、预设目标对象的第一边缘过渡区域图像、与所述第一主体图像对应的语义标注图像以及与所述第一边缘过渡区域图像对应的语义标注图像,通过预设的神经网络训练而成。2.如权利要求1所述的图像中目标对象的识别方法,其特征在于,所述图像目标识别模型的构建方法包括:获取所述原始图像中预设目标对象的第一主体图像以及第一边缘过渡区域图像;获取与所述第一主体图像对应的语义标注图像,得到第二主体图像;获取与所述第一边缘过渡区域图像对应的语义标注图像,得到第二边缘过渡区域图像;将所述第一主体图像、所述第一边缘过渡区域图像、所述第二主体图像以及所述第二边缘过渡区域图像,输入至预设的GAN神经网络中,对所述GAN神经网络中的生成器和判别器进行交替迭代训练,并将训练完成后的生成器作为所述图像目标识别模型。3.如权利要求2所述的图像中目标对象的识别方法,其特征在于,所述生成器包括:若干层级的隐藏层;在训练所述生成器时,从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的特征向量,生成特征向量集;将所述特征向量集分别输入至各层级的隐藏层中,对所述生成器中的各隐藏层进行训练;其中,当待训练的隐藏层为第一层隐藏层时,根据所述特征向量集以及所述特征向量集在第一层隐藏层的影响权重,对所述待训练的隐藏层进行训练;当所述待训练的隐藏层不为第一层隐藏层时,根据所述特征向量集、所述特征向量集在所述待训练的隐藏层的影响权重以及上一层隐藏层的输出结果,对所述待训练的隐藏层进行训练。4.如权利要求3所述的图像中目标对象的识别方法,其特征在于,所述从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的特征向量,生成特征向量集,具体包括:从所述第一主体图像以及所述第一边缘过渡区域图像中提取各图像的颜色像素矩阵,生成颜色像素矩阵集,将所述颜色像素矩阵集作为所述特征向量集。5.如权利要求2所述的图像中目标对象的识别方法,其特征在于,所述获取与所述第一主体图像对应的语义标注图像,得到第二主体图像;获取与所述第一边缘过渡区域图像对应的语义标注图像,得到第二边缘过渡区域图像,具体包括:按预设的颜色对所述第一主体图像以及所述第一边缘过渡区域图像进行语义标注,获得所述第二主体图像以及所述第二边缘过渡区域图像。6.如权利要求2所述的图像中目标对象的识别方法,其特征在于,通过预设的图像分割模型,对所述原始图像中预设目标对象进行分割,获得所述第一主体图像。7.如权利要求2所述的图像中目标对象的识别方法,其特征在于,将所述预设目标对象沿对象边缘,按所述预设目标对象的面积向外扩展第一预设比例后所增加的图像区域,与
将所述预设目标对象沿对象边缘,按所述预设目标对象的面积向内收缩第二预设比例后所减少的图像区域进行组合,获得所述预设目标对象的第一边缘过渡区域图像。8.如权利要求7所述的图像中目标对象的识别方法,其特征在于,所述第一预设比例的取值范围为[10%,50%];所述第二预设比例的取值范围为[10%,50%]。9.一种图像中目标对象的识别装置,其特征在于,包括:待识别图像获取模块以及目标对象识别模块;所述待识别图像获取模块,用于获取待识别图像;所述目标对象识别模块,用于将所述待识别图像输入至预设的图像目标识别模型中,以使所述图像目标识别模型识别所述待识别图像中是否包含预设目标对象;其中,所...

【专利技术属性】
技术研发人员:邓立邦
申请(专利权)人:广东智媒云图科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1