对象识别模型优化方法、装置和电子设备制造方法及图纸

技术编号:19859130 阅读:24 留言:0更新日期:2018-12-22 12:03
公开了一种对象识别模型优化方法、装置和电子设备。该方法包括:基于对象识别模型提取多幅图像各自对应的特征向量;基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;基于所述距离矩阵对所述多幅图像进行聚类;以及,基于聚类后的所述多幅图像优化所述对象识别模型。这样,可以高效和稳定地获得具有良好性能的对象识别模型。

【技术实现步骤摘要】
对象识别模型优化方法、装置和电子设备
本申请涉及模型优化领域,且更为具体地,涉及一种对象识别模型优化方法、对象识别模型优化装置和电子设备。
技术介绍
近年来,由于行人再识别技术在智能监控系统中的应用,该问题已成为计算机视觉研究领域的重点之一。行人再识别需要通过判断某个摄像头拍摄到的目标行人与在不同时刻由另一非重叠视域的摄像头拍摄的行人是否为同一行人。目前,越来越多的行人再识别系统采用深度神经网络模型用于行人识别,但是在现实中,行人再识别系统会面临各种各样的环境,而其中大量场景是在模型训练时未加入考虑的内容。例如,在南方某个街头采集数据并训练好深度神经网络模型,可能在北方的冬天街头实际场景有雪景干扰。或者,利用室外街头的数据训练深度神经网络模型后,在室内实际应用时有场景光照变化,这些不同的场景环境均会导致模型精度显著下降。因此,期望提供改进的模型优化方案。
技术实现思路
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种对象识别模型优化方法、装置和电子设备,其通过使用基于图像的特征向量所确定的图像间距离对图像进行聚类,并使用聚类后的图像优化模型,从而高效和稳定地获得具有良好性能的对象识别模型。根据本申请的一个方面,提供了一种对象识别模型优化方法,包括:基于对象识别模型提取多幅图像各自对应的特征向量;基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;基于所述距离矩阵对所述多幅图像进行聚类;以及,基于聚类后的所述多幅图像优化所述对象识别模型。根据本申请的另一方面,提供了一种对象识别模型优化装置,包括:特征向量提取单元,用于基于对象识别模型提取多幅图像各自对应的特征向量;距离矩阵获得单元,用于基于所述特征向量提取单元所提取的特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;图像聚类单元,用于基于所述距离矩阵获得单元所获得的距离矩阵对所述多幅图像进行聚类;以及,模型优化单元,用于基于所述图像聚类单元聚类后的所述多幅图像优化所述对象识别模型。根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的对象识别模型优化方法。根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的对象识别模型优化方法。与现有技术相比,本申请提供的对象识别模型优化方法、装置和电子设备可以基于对象识别模型提取多幅图像各自对应的特征向量;基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;基于所述距离矩阵对所述多幅图像进行聚类;以及,基于聚类后的所述多幅图像优化所述对象识别模型。这样,通过使用基于图像的特征向量所确定的图像间距离对图像进行聚类,并使用聚类后的图像优化模型,由于充分利用了容易得到的大量未标记图像并筛选掉了置信度较低的图像,可以高效和稳定地获得具有良好性能的对象识别模型。附图说明通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1图示了根据本申请实施例的对象识别模型优化方法的应用场景的示意图。图2图示了根据本申请实施例的对象识别模型优化方法的流程图。图3图示了根据本申请实施例的多个摄像头的拍摄图像的示例的示意图。图4图示了根据本申请实施例的对象识别模型的优化过程的流程图。图5图示了根据本申请实施例的对象识别模型优化方法应用于行人再识别系统的示例的流程图。图6图示了根据本申请实施例的对象识别模型优化装置的框图。图7图示了根据本申请实施例的电子设备的框图。具体实施方式下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。申请概述如上所述,在目前使用深度神经网络模型的行人再识别系统中,不同的场景环境会导致模型精度显著下降。针对该问题,现有的技术方案主要分为两种。一种是在新场景中获取新的数据后,投入新的人力进行标注,将已有的深度神经网络模型用新数据进行微调和重新训练。但是,投入新的人力进行标记消耗资源太大,每一个新的行人再识别系统投入使用,都需要判定是否数据重新标注,如果需要重新标注,不仅拖慢系统上线时间,而且需要大量人力开展工作。第二是利用现有的深度生成网络技术,将有标记的行人图像进行图像风格迁移,得到新的场景下的图像。但是,现有的深度生成网络技术仍然不够成熟,生成的图像效果质量较差,若用这些生成图像对行人再识别系统的深度神经网络模型进行微调和重新训练,在新场景下带来的精度提升十分有限。同时,利用深度生成网络技术也未能利用大量的未标记数据资源。基于上述技术问题,本申请的基本构思是计算图像的特征向量,并基于所述特征向量生成的图像间的距离矩阵,通过所述距离矩阵对图像进行聚类,并使用聚类后的图像优化模型。这样,由于充分利用了容易得到的大量未标记图像并筛选掉了置信度较低的图像,可以高效和稳定地获得具有良好性能的对象识别模型。具体地,本申请提供的对象识别模型优化方法、装置和电子设备首先基于对象识别模型提取多幅图像各自对应的特征向量,然后基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵,再基于所述距离矩阵对所述多幅图像进行聚类,最后基于聚类后的所述多幅图像优化所述对象识别模型。因此,本申请的对象识别模型优化方法、装置和电子设备在遇到新的场景环境且模型的性能下降时,无需花费大量人力进行重新标注,而可以直接利用容易得到的大量未标记图像数据。并且,通过聚类筛选掉置信度较低的图像,然后利用剩下的图像去优化对象识别模型,相比使用尚不成熟的生成模型更加稳定可靠,且适合大规模地投入实际使用。这里,本领域技术人员可以理解,本申请的方案中的对象识别模型不仅限于行人再识别系统,而是可以是用于识别任何对象的识别模型,例如在智能驾驶领域中用于识别车辆、道路标志等的识别模型等。因此,本申请的方案可以适用于在任何训练以外的新场景下模型性能下降的情况下模型的优化,而并不限于特定的识别模型或者识别系统。在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。示例性系统图1图示了根据本申请实施例的优化方法的应用场景的示意图。如图1所示,对象识别模型可包括深度神经网络模型100。当多个图像采集装置从一个位置处移到另一个位置时,移动后的位置所在的场景可视为本申请中所述的新场景。多个图像采集装置可在该新场景下采集大量未标记的图像IM,将其通过深度神经网络模型100提取特征向量,并通过特征向量计算所述图像IM的距离矩阵110,这里,IM表示采集的多幅图像。需要说明的是,对象识别模型中还可以包含识别模型需要的其它功能模块,本申请在此不详述。然后,基于所述距离矩阵110通过聚类模块120对所述图像IM进行聚类,以得到聚类后的图像IN1,IN2,…,这里,IN1本文档来自技高网...

【技术保护点】
1.一种对象识别模型优化方法,包括:基于对象识别模型提取多幅图像各自对应的特征向量;基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;基于所述距离矩阵对所述多幅图像进行聚类;以及基于聚类后的所述多幅图像优化所述对象识别模型。

【技术特征摘要】
1.一种对象识别模型优化方法,包括:基于对象识别模型提取多幅图像各自对应的特征向量;基于所述特征向量确定所述多幅图像中每两幅图像之间的距离以获得距离矩阵;基于所述距离矩阵对所述多幅图像进行聚类;以及基于聚类后的所述多幅图像优化所述对象识别模型。2.如权利要求1所述的对象识别模型优化方法,其中,基于聚类后的所述多幅图像优化所述对象识别模型包括:基于所述聚类后的多幅图像的聚类信息确定所述聚类后的图像的至少一个标签信息;以及基于所述至少一个标签信息以及该至少一个标签信息对应的同类图像优化所述对象识别模型。3.如权利要求2所述的对象识别模型优化方法,其中,基于所述至少一个标签信息以及该至少一个标签信息对应的同类图像优化所述对象识别模型包括:确定所述同类图像中的每个图像与其聚类中心的距离是否小于或等于预定阈值;以及响应于确定所述同类图像中的一个或多个图像与其所述聚类中心的距离小于或等于预定阈值,以所述一个或多个图像优化所述对象识别模型。4.如权利要求3所述的对象识别模型优化方法,其中,所述预定阈值是固定阈值或者设置为所述聚类的类别中图像数目的预定比例的阈值。5.如权利要求1所述的对象识别模型优化方法,其中,在基于对象识别模型提取多幅图像各自对应的特征向量之前进一步包括:在预定时间段内控制多个图像采集设备采集所述多幅图像,以使得所述对象识别模型所识别的对象包含在所述多个图像采集设备中的不同图像采集设备采集的图像中。6.如权利要求1所述的对象识别模型优化方法,其中,基于聚类后的所述多幅图像优化所述对象识别模型包括:以小于所述对象识别模型的初始学习率的优化学习率重新训练所述对象识别模型。7.如权利要求1到6中任意一项所述的对象识别模型优化方法,在基于对象识别模型提取多幅图像各自对应的特征向量之前进一步包括:确定环境信息和/或地理位置信息;以及当所述环境信息和/或所述地理位置信息符合预设条件时,控制多个图像采集设备采集所述多幅图像。8.一种对象识别模型优化装置,包括:特征向量提取单元,用于基于对象识别模型提取多幅图像各自对应的特征向量;距离矩阵获得单元,用于基于所述特征向量提取...

【专利技术属性】
技术研发人员:宋俍辰汪成张骞黄畅
申请(专利权)人:北京地平线机器人技术研发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1