一种可定位目标物质心的目标识别方法和系统技术方案

技术编号:27433143 阅读:14 留言:0更新日期:2021-02-25 03:10
本发明专利技术涉及一种可定位目标物质心的目标识别方法,所述目标识别方法包括:建立含目标物质心信息的数据集;构建目标识别系统,并通过所述数据集训练所述目标识别系统;使用训练后的所述目标识别系统识别目标物质心;本发明专利技术还包括一种可定位目标物质心的目标识别系统,所述目标识别系统包括:前端提取网络、目标检测网络和质心检测网络。通过本发明专利技术的目标识别方法和目标识别系统,同步检测目标物的位置边框、种类及质心,从而提高目标质心识别的精度,检测结果方便快速。检测结果方便快速。检测结果方便快速。

【技术实现步骤摘要】
一种可定位目标物质心的目标识别方法和系统


[0001]本专利技术属于图像信息处理
,特别涉及一种可定位目标物质心的目标识别方法和系统。

技术介绍

[0002]目标识别是指在图像中定位出目标物位置并确定目标物类型的过程。随着计算机视觉、人工智能技术的发展,目标识别在工业领域得到广泛应用。现有的目标识别方法主要有基于传统的机器学习方法和深度学习方法两类。传统的机器学习方法主要通过利用人为设计的特征算子(Sift、Harr等)从图像中提取出特征之后利用Adaboost、PLSA等模型实现目标物的分类。但是该方法具有局限性,人为设计的特征算子往往不具备好的尺度不变性、旋转不变性,同时对于环境中的噪声、光线等不具备好的抵抗性。
[0003]基于深度学习的目标检测网络可从输入样本中自学学习海量的特征,具有多尺度、平移不变性及旋转不变性等优点。但是现有的基于深度学习的目标检测网络只能检测出目标物的位置边框以及其种类,作为图像重要特征之一的目标物质心难以明确识别。
[0004]质心指的是其在二维图像中的形状中心,也是一个重要的图像特征信息。例如,医学图像中需要获取染色体、细胞等目标物的质心或基于质心的视频跟踪算法也依赖于高精度的质心位置预测。传统的目标质心算法主要是依据图像连通域的几何矩计算,传统方法对于形状不规则的图形计算出的质心位置会有较大的偏差。也有一些方法通过对二值化图像进行灰度统计计算质心位置,但此类方法存在计算量大、可行性不高等缺点。
[0005]因此需要一种与深度学习方法的优点相结合,能够快速便捷识别目标物质心的方法。

技术实现思路

[0006]针对上述问题,本专利技术提供了一种可定位目标物质心的目标识别方法。
[0007]一种可定位目标物质心的目标识别方法,所述目标识别方法包括:
[0008]建立含目标物质心信息的数据集;
[0009]构建目标识别系统,并通过所述数据集训练所述目标识别系统;
[0010]使用训练后的所述目标识别系统识别目标物质心;
[0011]所述目标识别系统识别目标物质心包括:
[0012]输入待检测图像,所述目标识别系统提取所述待检测图像的图像特征;
[0013]依据所述图像特征,计算候选边框的坐标,并采用非极大值抑制法从所述候选边框中筛选出目标物边框坐标;
[0014]依据所述目标物边框和所述图像特征,对所述目标物边框内的图像栅格分割,确认所述目标物的质心位置。
[0015]进一步地,所述数据集为图像集,所述图像集的图像信息包括:目标物的位置边框、种类和质心位置。
[0016]进一步地,所述数据集的建立包括:
[0017]通过在不同的光照环境下拍摄目标物图像,手动标注出拍摄的目标物图像内目标物的位置边框、种类及质心位置;
[0018]将所述数据集化分为训练集和测试集,所述训练集用于训练所述目标识别系统,所述测试集用于评估所述目标识别系统的有效性。
[0019]进一步地,所述图像特征包括初次图像特征和二次图像特征;
[0020]初次图像特征,用于计算所述候选边框的坐标;
[0021]二次图像特征,用于筛选目标物边框和确认目标物质心。
[0022]进一步地确认所述目标物的质心位置包括:
[0023]接收所述目标物边框,从所述图像特征的二次图像特征中,获取所述目标物边框的边框特征图;
[0024]所述边框特征图通过降低所述边框特征图的维度至预设维度,进行栅格分割;
[0025]继续降低栅格分割后所述边框特征图的维度,至所述边框特征图的维度为最终维度;
[0026]将最终维度内置信度最高的栅格位置标记为质心位置。
[0027]进一步地,所述最终维度包括:质心的置信度、质心的横坐标和质心纵坐标。
[0028]进一步地,所述质心的置信度通过sigmoid函数的回归计算获得。
[0029]进一步地,所述通过所述数据集训练所述目标识别系统包括:
[0030]预处理所述数据集中的训练集图像;
[0031]将预处理后的所述训练集图像输入所述目标识别系统中进行前向传播,并在前向传播过程中,通过损失函数获得传输路径中所述目标识别系的输出损失值后,将所述训练集图像通过Adam优化器进行反向传播;
[0032]在所述反向传播中将所述输出损失值按训练集图像的传输路径返回,对所述目标识别系统的参数进行更新,收敛所述目标识别系统的输出损失值;
[0033]当所述输出损失值收敛降低至预设收敛值后,将所述数据集中的测试集图像输入所述目标识别系统中进行质心位置判断,得出所述测试集图像质心判断的平均准确率;
[0034]若所述平均准确率大于或等于预设准确率,则所述目标识别系统训练成功,否则继续训练所述目标识别系统,直至所述平均准确率大于或等于预设准确率。
[0035]进一步地,所述损失函数由(1)式表示:
[0036]L=L
rpn
+L
cls
+L
conf
+L
loc
ꢀꢀ
(1),
[0037](4)式中,L为目标识别系统的总损失函数,L
rpn
为候选边框位置和候选边框置信度损失,L
cls
为目标物种类损失,L
conf
为质心预测概率损失,L
loc
为质心位置损失。
[0038]进一步地,所述损失函数中候选边框位置和候选边框置信度损失L
rpn
为:
[0039][0040](5)式中,p
i
为预测的候选边框中含有目标物的概率,为训练图像中边框位置是否含有目标物的真实概率,t
i
为预测候选边框的位置坐标,为训练图像中目标物的真实边框坐标,L
log
表示采用对数损失函数,L
smoothL1
表示使用Smooth-L1损失函数,λ为加权常数,
N
cls
为所有候选边框的总数,N
reg
为所有候选边框坐标的总数。
[0041]进一步地,所述损失函数中目标物种类和目标物边框损失L
cls
为:
[0042][0043](6)式中,p
li
为预测的目标物种类概率分布,为真实的目标物种类概率分布,q
i
为预测出的目标物边框位置,为训练集图像中目标物的真实边框坐标,L
log
表示采用对数损失函数,L
smoothL1
表示使用Smooth-L1损失函数,λ为加权常数。
[0044]进一步地,所述损失函数中质心预测概率损失L
conf
为:
[0045][0046](5)式中,p
ci
为预测出的当前边框中是否含有质心的概率,为当前栅格中是否含有质心的实际概本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可定位目标物质心的目标识别方法,其特征在于,所述目标识别方法包括:建立含目标物质心信息的数据集;构建目标识别系统,并通过所述数据集训练所述目标识别系统;使用训练后的所述目标识别系统识别目标物质心;所述目标识别系统识别目标物质心包括:输入待检测图像,所述目标识别系统提取所述待检测图像的图像特征;依据所述图像特征,计算候选边框的坐标,并采用非极大值抑制法从所述候选边框中筛选出目标物边框坐标;依据所述目标物边框和所述图像特征,对所述目标物边框内的图像栅格分割,确认所述目标物的质心位置。2.根据权利要求1所述的目标识别方法,其特征在于,所述数据集为图像集,所述图像集的图像信息包括:目标物的位置边框、种类和质心位置。3.根据权利要求1或2所述的目标识别方法,其特征在于,所述数据集的建立包括:通过在不同的光照环境下拍摄目标物图像,手动标注出拍摄的目标物图像内目标物的位置边框、种类及质心位置;将所述数据集化分为训练集和测试集,所述训练集用于训练所述目标识别系统,所述测试集用于评估所述目标识别系统的有效性。4.根据权利要求1所述的目标识别方法,其特征在于,所述图像特征包括初次图像特征和二次图像特征;初次图像特征,用于计算所述候选边框的坐标;二次图像特征,用于筛选目标物边框和确认目标物质心。5.根据权利要求1或2所述的目标识别方法,其特征在于,确认所述目标物的质心位置包括:接收所述目标物边框,从所述图像特征的二次图像特征中,获取所述目标物边框的边框特征图;所述边框特征图通过降低所述边框特征图的维度至预设维度,进行栅格分割;继续降低栅格分割后所述边框特征图的维度,至所述边框特征图的维度为最终维度;将最终维度内置信度最高的栅格位置标记为质心位置。6.根据权利要求5所述的目标识别方法,其特征在于,所述最终维度包括:质心的置信度、质心的横坐标和质心纵坐标。7.根据权利要求5所述的目标识别方法,其特征在于,所述质心的置信度通过sigmoid函数的回归计算获得。8.根据权利要求1所述的目标识别方法,其特征在于,所述通过所述数据集训练所述目标识别系统包括:预处理所述数据集中的训练集图像;将预处理后的所述训练集图像输入所述目标识别系统中进行前向传播,并在前向传播过程中,通过损失函数获得传输路径中所述目标识别系的输出损失值后,将所述训练集图像通过Adam优化器进行反向传播;在所述反向传播中将所述输出损失值按训练集图像的传输路径返回,对所述目标识别
系统的参数进行更新,收敛所述目标识别系统的输出损失值;当所述输出损失值收敛降低至预设收敛值后,将所述数据集中的测试集图像输入所述目标识别系统中进行质心位置判断,得出所述测试集图像质心判断的平均准确率;若所述平均准确率大于或等于预设准确率,则所述目标识别系统训练成功,否则继续训练所述目标识别系统,直至所述平均准确率大于或等于预设准确率。9.根据权利要求8所述的目标识别方法,其特征在于,所述损失函数由(1)式表示:L=L
rpn
+L
cls
+L
conf
+L
loc
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1),(1)式中,L为目标识别系统的总损失函数,L
rpn
为候选边框位置和候选边框置信度损失,L
cls
为目标物种类损失,L
conf
为质心预测概率损失,L
loc
为质心位置损失。10.根据权利要求8或9所述的目标识别方法,其特征在于,所述损失函数中候选边框位置和候选边框置信度损失L
rpn
为:(2)式中,p
i
为预测的候选边框中含有目标物的概率,为训练图像中边框位置是否含有目标物的真实概率,t
i
为预测候选边框的位置坐标,为训练图像中目标物的真实边框坐标,L
log
表示采用对数损失函数,L
smoothL1
表示使用Smooth-L1损失函数,λ为加权常数,N
cls
为所有候选边框的总数,N
reg
为所有候选边框坐标的总数。11.根据权利要求8或9所述的目标识别方...

【专利技术属性】
技术研发人员:吴穗宁王智新李斌陈晓光史龙张璐
申请(专利权)人:北京全路通信信号研究设计院集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1