图像识别方法技术

技术编号:39799480 阅读:18 留言:0更新日期:2023-12-22 02:30
本申请涉及一种图像识别方法

【技术实现步骤摘要】
图像识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及图像处理领域,特别是涉及一种图像识别方法

装置

计算机设备及存储介质


技术介绍

[0002]图像分割技术是目前预测图像领域最热门的一项技术,在过去的十年中发生了巨大的变化

今天,它被广泛用于图像分类

人脸识别

物体检测

视频分析以及机器人及自动驾驶汽车中的图像处理等领域

[0003]在工业生成中,常常会需要定位图像的目标区域,以及计算目标区域的数量,图像分割技术的实例分割很好地解决了这个问题

然而,传统的技术在利用实例分割进行目标区域定位时,若图像中的目标区域是重叠在一起时,实例分割无法准确识别出图像中的目标区域的位置,进而无法计算目标区域的面积,导致图像识别效率低下


技术实现思路

[0004]基于此,本申请的目的在于提供一种图像识别方法,通过将图像信息输入至训练后的神经网络中来定位图像中重叠在一起的目标区域,进而结合漫水填充来识别得到各个目标区域,提高图像识别效率

[0005]在一个实施例中,本申请提供了一种图像识别方法,包括:获取图像信息;所述图像信息中包括多个目标区域,所述多个目标区域之间有重叠;将所述图像信息输入至已经训练好的神经网络模型,输出得到各个目标区域的关键点位置信息;以各个目标区域为正样本,以背景区域为负样本,以各个目标区域所确定的关键点位置信息以及背景区域任意设置的起始位置信息作为扩张起点同时进行扩张,在像素值改变的各个目标区域之间的交汇处以及目标区域与背景区域之间分别形成边界信息,以识别得到所述图像信息中的各个目标区域

[0006]相对于现有技术,本申请所提供的上述图像识别方法,利用训练得到的神经网络模型,基于所输出的关键点位置信息先定位得到图像信息中的目标区域,在定位了目标区域之后,利用漫水填充方法对目标区域以所得到的关键点位置信息进行灌水扩张,以背景区域以任意的起始位置信息进行灌水扩张而得到各个目标区域之间以及目标区域与背景区域之间的边界

因此本申请中的方案对于有重叠的目标区域,利用关键点检测以及漫水填充方式能够识别得到有重叠的各个目标区域的实际大小,提高了图像的识别效率

[0007]进一步地,对初始神经网络模型进行训练得到已经训练好的神经网络模型,具体包括如下步骤:获取第一图像信息,所述第一图像信息中包括多个目标区域,所述多个目标区域之间有重叠;
对所述第一图像信息中各个目标区域中的关键点位置信息进行标注,得到第二图像信息;其中,所述第二图像信息中标注了各个目标区域的关键点位置信息;将所述第二图像信息输入至初始神经网络模型进行训练,得到训练好的神经网络模型

[0008]进一步地,将所述第二图像信息输入至初始神经网络模型进行训练,得到训练好的神经网络模型包括:对所述第二图像信息进行特征提取,得到所述第二图像信息的图像特征信息;基于多层网络对所述图像特征信息进行计算,得到所述第二图像信息中各个目标区域的关键点位置信息;输出所述各个目标区域的关键点位置信息;利用损失函数计算得到的所述各个目标区域的关键点位置信息与实际的关键点位置信息的损失,若损失大于阈值,则将损失回传至所述初始神经网络模型的网络参数对所述网络参数进行更新,计算每个网络参数对损失的贡献程度;不断修正网络参数,循环执行上述步骤实现对初始神经网络的训练,直至损失小于所述阈值时得到训练后的神经网络

[0009]进一步地,所述以各个目标区域为正样本,以背景区域为负样本,以各个目标区域所确定的关键点位置信息以及背景区域任意设置的起始位置信息作为扩张起点同时进行扩张,在像素值改变的各个目标区域之间的交汇处以及目标区域与背景区域之间分别形成边界信息,以识别得到所述图像信息中的各个目标区域包括:获取各个所述关键点位置信息所在的目标区域的像素值,将像素值最低的目标区域对应的像素值作为第一像素值;以第一像素值所在目标区域的所述关键点位置信息作为第一扩张起点向外扩张,直至扩张后的像素值达到与当前所述关键点位置信息所在的目标区域相邻的目标区域的第二像素值,并在当前目标区域与所述第二像素值所在的相邻目标区域交汇处形成第一边界信息;以所述第二像素值所在的目标区域中的所述关键点位置信息作为新的第一扩张起点继续向外扩张,直至完成在所有的目标区域之间形成多个第一边界信息;获取背景区域的第三像素值,以所述背景区域中任意设置的起始位置信息为第二扩张起点向外扩张,直至扩张后的第四像素值达到各个目标区域对应的第一像素值,在所述背景区域与所有的目标区域交汇处形成多个第二边界信息;基于多个所述第一边界信息和第二边界信息,识别得到各个所述关键点位置信息所在的目标区域

[0010]进一步地,所述基于多个所述第一边界信息和第二边界信息,识别得到各个所述关键点位置信息所在的目标区域包括:基于识别得到的各个所述关键点位置信息所在的目标区域的像素数,得到所述目标区域的面积

[0011]在另一实施例中,本申请还提供了一种图像识别装置,包括:获取模块,用于获取图像信息;所述图像信息中包括多个目标区域,所述多个目标区域之间有重叠;
输出模块,用于将所述图像信息输入至已经训练好的神经网络模型,输出得到各个目标区域的关键点位置信息;识别模块,用于以各个目标区域为正样本,以背景区域为负样本,以各个目标区域所确定的关键点位置信息以及背景区域任意设置的起始位置信息作为扩张起点同时进行扩张,在像素值改变的各个目标区域之间的交汇处以及目标区域与背景区域之间分别形成边界信息,以识别得到所述图像信息中的各个目标区域

[0012]进一步地,所述识别模块包括:第一获取单元,用于获取各个所述关键点位置信息所在的目标区域的像素值,将像素值最低的目标区域对应的像素值作为第一像素值;第一扩张单元,用于以第一像素值所在目标区域的所述关键点位置信息作为第一扩张起点向外扩张,直至扩张后的像素值达到与当前所述关键点位置信息所在的目标区域相邻的目标区域的第二像素值,并在当前目标区域与所述第二像素值所在的相邻目标区域交汇处形成第一边界信息;第二扩张单元,用于以所述第二像素值所在的目标区域中的所述关键点位置信息作为新的第一扩张起点继续向外扩张,直至完成在所有的目标区域之间形成多个第一边界信息;第二获取单元,用于获取背景区域的第三像素值,以所述背景区域中任意设置的所述起始位置信息为第二扩张起点向外扩张,直至扩张后的第四像素值达到各个目标区域对应的第一像素值,在所述背景区域与所有的目标区域交汇处形成多个第二边界信息;识别单元,用于基于多个所述第一边界信息和第二边界信息,识别得到各个所述关键点位置信息所在的目标区域

[0013]在另一实施例中,本申请还提供了一种计算机设备,所述计算机设备包括:处理器;存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图像识别方法,其特征在于:包括:获取图像信息;所述图像信息中包括多个目标区域,所述多个目标区域之间有重叠;将所述图像信息输入至已经训练好的神经网络模型,输出得到各个目标区域的关键点位置信息;以各个目标区域为正样本,以背景区域为负样本,以各个目标区域所确定的关键点位置信息以及背景区域任意设置的起始位置信息作为扩张起点同时进行扩张,在像素值改变的各个目标区域之间的交汇处以及目标区域与背景区域之间分别形成边界信息,以识别得到所述图像信息中的各个目标区域
。2.
根据权利要求1所述的图像识别方法,其特征在于:所述已经训练好的神经网络模型,基于如下方式得到:获取第一图像信息,所述第一图像信息中包括多个目标区域,所述多个目标区域之间有重叠;对所述第一图像信息中各个目标区域中的关键点位置信息进行标注,得到第二图像信息;其中,所述第二图像信息中标注了各个目标区域的关键点位置信息;将所述第二图像信息输入至初始神经网络模型进行训练,得到训练好的神经网络模型
。3.
根据权利要求2所述的图像识别方法,其特征在于:将所述第二图像信息输入至初始神经网络模型进行训练,得到训练好的神经网络模型包括:对所述第二图像信息进行特征提取,得到所述第二图像信息的图像特征信息;基于多层网络对所述图像特征信息进行计算,得到所述第二图像信息中各个目标区域的关键点位置信息;输出所述各个目标区域的关键点位置信息;利用损失函数计算得到的所述各个目标区域的关键点位置信息与实际的关键点位置信息的损失,若损失大于阈值,则将损失回传至所述初始神经网络模型的网络参数对所述网络参数进行更新,计算每个网络参数对损失的贡献程度;不断修正网络参数,循环执行上述步骤直至损失小于所述阈值时得到训练后的神经网络
。4.
根据权利要求1所述的图像识别方法,其特征在于:所述以各个目标区域为正样本,以背景区域为负样本,以各个目标区域所确定的关键点位置信息以及背景区域任意设置的起始位置信息作为扩张起点同时进行扩张,在像素值改变的各个目标区域之间的交汇处以及目标区域与背景区域之间分别形成边界信息,以识别得到所述图像信息中的各个目标区域包括:获取各个所述关键点位置信息所在的目标区域的像素值,将像素值最低的目标区域对应的像素值作为第一像素值;以第一像素值所在目标区域的所述关键点位置信息作为第一扩张起点向外扩张,直至扩张后的像素值达到与当前所述关键点位置信息所在的目标区域相邻的目标区域的第二像素值,并在当前目标区域与所述第二像素值所在的相邻目标区域交汇处形成第一边界信息;以所述第二像素值所在的目标区域中的所述关键点位置信息作为新的第一扩张起点继续向外扩张,直至完成在所有的目标区域之间形成多个第一边界信息;
获取背景区域的第三像素值,以所述背景区域中任意设置的所述起始位置信息为第二扩张起点向外扩张,直至扩张后的第四像素值达到各个目标区域对应...

【专利技术属性】
技术研发人员:张权王刚赵哲吕炎州肖圣端伍绍桂
申请(专利权)人:广州市易鸿智能装备股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1