基于特征比对的复杂场景高效犬脸图像质量评估方法技术

技术编号:33345542 阅读:13 留言:0更新日期:2022-05-08 09:39
本发明专利技术公开了一种基于特征比对的复杂场景高效犬脸图像质量评估方法,包括如下步骤:采用图像目标检测抠取犬脸区域图像;对可能运动范围区域内的犬脸检测框图像进行特征提取,所用特征模型是基于深度学习训练的卷积神经网络;将特征加入时序特征库;利用时序特征库进行多帧特征比对,获取得到跟踪id;根据犬脸特征响应进行图像质量评估,并输出对应的犬脸图像、犬脸框位置、犬脸图像质量分。本发明专利技术可以对复杂场景中的犬脸进行精准高效的跟踪和抓拍,具有跟踪精度高和计算复杂度低的特点,解决了传统跟踪和抓拍方法效率与准确率成反比的问题。的问题。的问题。

【技术实现步骤摘要】
基于特征比对的复杂场景高效犬脸图像质量评估方法


[0001]本专利技术涉及一种视频中犬脸的高效跟踪和抓拍方法,尤其涉及一种基于特征比对的复杂场景高效犬脸图像质量评估方法,属于模式识别与图像处理领域。

技术介绍

[0002]犬身份识别是城市养狗登记的重要手段之一。犬身份识别方法通常包括芯片植入,犬鼻纹识别以及犬脸识别。犬脸识别的过程中,首先需要采集犬脸,在犬养殖场等犬较多的复杂场景中,抓拍采集犬脸图片需要用到目标跟踪与图像质量评估算法。传统的目标跟踪方法包括孪生网络、光流跟踪、粒子滤波等,这些方法通常跟踪准确性和效率成反比,导致整套方案效率低且跟踪准确率低,跟丢,跟漏等情况时常发生;传统的图像质量评估方法采用单独的质量判断模块,需要耗费额外的计算量,不利于在边缘设备的部署。

技术实现思路

[0003]针对现有技术的不足,本专利技术提供了一种基于特征比对的复杂场景高效犬脸图像质量评估方法,可以对复杂场景中的犬脸进行精准高效的跟踪和抓拍。
[0004]本专利技术提供了一种基于特征比对的复杂场景高效犬脸图像质量评估方法,该方法包括如下步骤:S01采用图像目标检测抠取犬脸区域图像,在输入的视频中,利用犬脸检测方法获取犬脸图像区域坐标,输入的视频和图像中,可能存在多个犬脸,需要全部获取;S02采用区域扩展法获取目标潜在运动范围;S03对可能运动范围区域内的犬脸检测框图像进行特征提取,所用特征模型是基于深度学习训练的卷积神经网络;S04将特征加入时序特征库;S05利用时序特征库进行多帧特征比对,获取得到跟踪id;S06根据犬脸特征响应进行图像质量评估,并输出对应的犬脸图像、犬脸框位置、犬脸图像质量分。
[0005]本专利技术的进一步限定技术方案,前述的基于特征比对的复杂场景高效犬脸图像质量评估方法,所述深度学习训练的卷积神经网络对图像的响应强度与图像质量成正相关,具体实现方法如下所示:a. 将特征值视为一个1
×
n的矩阵F;b. 将F乘以其转置矩阵,再开方q = (F F
T
)
½
;c. q即为犬脸特征置信度,q的值越大,犬脸特征质量越好,即 q∈[0, +∞);d. 通过实验获取犬脸特征置信度阈值,高于阈值则是质量达标,低于阈值则质量不达标。
[0006]前述基于特征比对的复杂场景高效犬脸图像质量评估方法,所述特征比对和跟踪id通过以下方式实现:本帧的任意检出的犬脸图像的位置如与任何潜在运动区域相交比大
于阈值R,则与该潜在运动区域id特征做比对,如果匹配则该犬脸id只与某个id匹配成功,则分配该跟踪id给该犬脸;如果与多个跟踪id都匹配上了,则取比对得分最大值对应的犬脸id;如果没有匹配上任何id,则分配新id给该犬脸。
[0007]进一步的,前述的基于特征比对的复杂场景高效犬脸图像质量评估方法,所述特征对比通过对犬脸图片进行特征提取,得到特征向量;同一只犬的犬脸特征向量距离近,不同犬的犬脸特征向量距离远;距离计算方法可采用余弦距离、L1距离进行计算。
[0008]本专利技术的有益效果:本专利技术可以对复杂场景中的犬脸进行精准高效的跟踪和抓拍,具有跟踪精度高和计算复杂度低的特点,解决了传统跟踪和抓拍方法效率与准确率成反比的问题,便于在手机、平板电脑、服务器等设备上的实施和推广难题。
附图说明
[0009]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,附图中的实施例不构成对本专利技术的任何限制,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是本实施例的流程框图。
[0011]图2是本实施例潜在运动范围示意图。
[0012]图3是本实施例搜索引擎爬取图片效果示意图。
具体实施方式
[0013]下面结合附图与实施例对本专利技术技术方案作进一步详细的说明,这是本专利技术的较佳实施例。应当理解,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例;需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]为了更好的理解上述的技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0015]实施例一本实施例提供了一种基于特征比对的复杂场景高效犬脸图像质量评估方法,该方法包括如下步骤:S01采用图像目标检测抠取犬脸区域图像,在输入的视频中,利用犬脸检测方法获取犬脸图像区域坐标,输入的视频和图像中,可能存在多个犬脸,需要全部获取;S02采用区域扩展法获取目标潜在运动范围;S03对可能运动范围区域内的犬脸检测框图像进行特征提取,所用特征模型是基于深度学习训练的卷积神经网络;S04将特征加入时序特征库;S05利用时序特征库进行多帧特征比对,获取得到跟踪id;S06根据犬脸特征响应进行图像质量评估,并输出对应的犬脸图像、犬脸框位置、犬脸图像质量分。
[0016]本实施例的步骤S02中,潜在运动区域的增加:根据犬脸框的尺寸数据,如图2所示,手动设置扩展系数(x,y),(x,y)为犬脸框的长宽的倍数,例如:如果犬脸框尺寸为80*80,扩展系数(x,y)设置为(2.0,2.0),那么该犬脸在上下帧的潜在运动尺寸则为160*160,该区域的中心点与当帧该犬脸框的中心点重合。采用扩展区域的目的是缩小比对候选特征,提升识别率。例如:可采用各种自适应滤波器,如卡尔曼滤波(kalman filter)、扩展卡尔曼滤波器等对犬脸的运动方向进行预测,结合预测结果对潜在运动区域扩展方式进行改变,如预测犬脸目标有较大的运动速度为(1.5,0.3),那么扩展系数则为手动扩展系数(2.0,2.0)乘以预测扩展系数(1.5+1,0.3+1)等于(5.0,2.6)。犬脸潜在运动区域是给下一帧特征比对使用的,在视频第一帧,设置所有犬脸框的潜在运动区域为整个图像区域。如果当前帧有n个犬脸检测框,下帧则有n个潜在运动框。所有潜在运动框都是为下一帧准备的。潜在运动区域的删除:删除潜在的运动区域的同时也是删除犬脸目标id的过程。判断依据为如果连续m帧都没有再发现该id犬脸目标出现,则删除。例如:设置m为25,若连续25帧都没有发现该id的犬脸目标,则删除该id和对应的潜在运动区域;如果连续h帧没有发现该id的犬脸目标,且h<m,则保持最后发现该id的潜在运动区域不变。
[0017]本实施例的犬脸检测,半自动数据标注:标注过程如下,使用爬虫程序在各大搜索引擎爬取狗脸数据,如图3所示,这些狗脸数据没有人工标注框,所以无法直接使用,我们取整张图片的中心扩展80%区域,用程序自动生成狗脸框,然后用这些数据训练一个犬只检测网络。这个犬脸检测网络的检测结果并不精准,再用该网络对待标注图片进行检测标注,再人工检查标注结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于特征比对的复杂场景高效犬脸图像质量评估方法,其特征在于该方法包括如下步骤:S01采用图像目标检测抠取犬脸区域图像,在输入的视频中,利用犬脸检测方法获取犬脸图像区域坐标,输入的视频和图像中,可能存在多个犬脸,需要全部获取;S02采用区域扩展法获取目标潜在运动范围;S03对可能运动范围区域内的犬脸检测框图像进行特征提取,所用特征模型是基于深度学习训练的卷积神经网络;S04将特征加入时序特征库;S05利用时序特征库进行多帧特征比对,获取得到跟踪id;S06根据犬脸特征响应进行图像质量评估,并输出对应的犬脸图像、犬脸框位置、犬脸图像质量分。2.根据权利要求1所述的基于特征比对的复杂场景高效犬脸图像质量评估方法,其特征在于:所述深度学习训练的卷积神经网络对图像的响应强度与图像质量成正相关,具体实现方法如下所示:a. 将特征值视为一个1
×
n的矩阵F;b. 将F乘以其转置矩阵,再开方q = (F F
T
...

【专利技术属性】
技术研发人员:匡金骏迟振
申请(专利权)人:苏州纳智天地智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1