行人再识别模型的训练方法、行人再识别方法及装置制造方法及图纸

技术编号:34080839 阅读:14 留言:0更新日期:2022-07-11 18:49
本公开提供了一种行人再识别模型的训练方法、行人再识别方法及装置,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉、图像处理技术,可应用于智慧城市、智能交通等场景。该方法包括:将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到原始样本图像的第一样本特征;对原始样本图像的第一样本特征进行聚类,得到多个聚类簇;根据原始样本图像的第一样本特征生成原始样本图像对应的难正样本的第二样本特征;基于第一样本特征、第二样本特征和聚类簇,更新初始行人再识别模型。该方法提高了行人再识别模型的识别结果的准确性。确性。确性。

【技术实现步骤摘要】
行人再识别模型的训练方法、行人再识别方法及装置


[0001]本公开涉及人工智能
中的深度学习、计算机视觉、图像处理技术,尤其涉及一种行人再识别模型的训练方法、行人再识别方法及装置,可应用于智慧城市、智能交通等场景。

技术介绍

[0002]行人再识别是指在不同摄像头拍摄到的行人图像中搜索到特定的行人,可应用于智慧城市、智能交通等场景,在实际应用中,往往通过训练行人再识别模型来实现该功能。
[0003]有监督的行人再识别模型的训练方法,需要利用有身份信息标签的行人图像进行模型训练,但有监督训练的标注成本高、样本采集困难。因此,目前的发展方向是探索直接从无标签的行人图像上进行无监督的模型训练,现有的无监督的训练方法得到的行人再识别模型的识别结果准确性较低。

技术实现思路

[0004]本公开提供了一种提高了识别结果准确性的行人再识别模型的训练方法、行人再识别方法及装置。
[0005]根据本公开的第一方面,提供了一种行人再识别模型的训练方法,包括:将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到所述原始样本图像的第一样本特征;对所述原始样本图像的第一样本特征进行聚类,得到多个聚类簇;根据所述原始样本图像的第一样本特征生成所述原始样本图像对应的难正样本的第二样本特征;基于所述第一样本特征、所述第二样本特征和所述聚类簇,更新所述初始行人再识别模型。
[0006]根据本公开的第二方面,提供了一种行人再识别方法,包括:获取待识别图像和目标行人图像;将所述待识别图像和所述目标行人图像分别输入行人再识别模型,得到所述待识别图像的特征向量和所述目标行人图像的特征向量,其中,所述行人再识别模型是采用第一方面所述的方法训练得到的;基于所述待识别图像的特征向量与所述目标行人图像的特征向量的相似度确定所述待识别图像的识别结果。
[0007]根据本公开的第三方面,提供了一种行人再识别模型的训练装置,包括:输入模块,用于将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到所述原始样本图像的第一样本特征;聚类模块,用于对所述原始样本图像的第一样本特征进行聚类,得到多个聚类簇;生成模块,用于根据所述原始样本图像的第一样本特征生成所述原始样本图像对
应的难正样本的第二样本特征;更新模块,用于基于所述第一样本特征、所述第二样本特征和所述聚类簇,更新所述初始行人再识别模型。
[0008]根据本公开的第四方面,提供了一种行人再识别装置,包括:获取模块,用于获取待识别图像和目标行人图像;输入模块,用于将所述待识别图像和所述目标行人图像分别输入行人再识别模型,得到所述待识别图像的特征向量和所述目标行人图像的特征向量,其中,所述行人再识别模型是采用第一方面所述的方法训练得到的;识别模块,用于基于所述待识别图像的特征向量与所述目标行人图像的特征向量的相似度确定所述待识别图像的识别结果。
[0009]根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面或第二方面所述的方法。
[0010]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面或第二方面所述的方法。
[0011]根据本公开的第七方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或第二方面所述的方法。
[0012]根据本公开的技术方案,提高了行人再识别模型的识别结果的准确性。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是根据本公开实施例提供的一种行人再识别模型的训练方法的流程示意图;图2是根据本公开实施例提供的一种行人再识别模型的训练过程示意图;图3是根据本公开实施例提供的一种行人再识别方法的流程示意图;图4是根据本公开实施例提供的一种行人再识别模型的训练装置的结构示意图;图5是根据本公开实施例提供的一种行人再识别装置的结构示意图;图6是用来实现本公开实施例的方法的电子设备的示意性框图。
具体实施方式
[0015]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0016]相关技术中,无监督的行人再识别模型的训练方法通常采用基于伪标签的方法,基于伪标签的行人再识别模型的训练方法中,通常是利用聚类算法对无标签的行人图像进行聚类,从而得到不同的聚类簇,同一聚类簇的样本被当作具有相同身份信息的样本,进而被标注为相同的伪标签信息,将这些伪标签作为监督信号进行模型训练。由于聚类结果的准确性不能保证,也就是样本的伪标签不一定准确,在模型的训练过程中会产生模糊的分类边界,影响模型的判别性能,导致识别结果不准确。
[0017]本公开实施例提供的行人再识别模型的训练方法,对原始样本进行聚类,但是并不利用伪标签作为监督信号进行模型训练,而是针对每个原始样本,生成分布于决策边界附近的难正样本,将难正样本也加入模型训练中,利用原始样本、难正样本和聚类簇之间的损失函数进行对比训练,从而解决聚类可能导致的聚类簇中样本不完整或者聚类簇中样本混杂的问题,提高模型的特征表征能力,提高识别结果的准确性。
[0018]本公开提供一种行人再识别模型的训练方法、行人再识别方法、装置及电子设备,应用于人工智能
的深度学习、计算机视觉、图像处理领域,具体可以应用在智慧城市、智能交通、智能视频监控、智能安保等场景中,以提高识别结果的准确性。
[0019]下面,将通过具体的实施例对本公开提供的行人再识别模型的训练方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0020]图1是根据本公开实施例提供的一种行人再识别模型的训练方法的流程示意图。该方法的执行主体为行人再识别模型的训练装置,该装置可以通过软件和/或硬件的方式实现。如图1所示,该方法包括:S101、将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到原始样本图像的第一样本特征。
[0021]原始样本集中的原始样本图像为无标签的行人图像,利用初始行人再识别模型对原始样本图像进行特征提取,得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人再识别模型的训练方法,包括:将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到所述原始样本图像的第一样本特征;对所述原始样本图像的第一样本特征进行聚类,得到多个聚类簇;根据所述原始样本图像的第一样本特征生成所述原始样本图像对应的难正样本的第二样本特征;基于所述第一样本特征、所述第二样本特征和所述聚类簇,更新所述初始行人再识别模型。2.根据权利要求1所述的方法,其中,所述根据所述原始样本图像的第一样本特征生成所述原始样本图像对应的难正样本的第二样本特征,包括:根据所述第一样本特征,确定所述初始行人再识别模型的多个可学习参数各自对应的权重,其中,所述可学习参数表征所有原始样本图像的共同特征,所述可学习参数的维度与所述第一样本特征的维度相同;根据所述可学习参数和所述可学习参数对应的权重,确定所述原始样本图像对应的难正样本的第二样本特征。3.根据权利要求2所述的方法,其中,所述确定所述初始行人再识别模型的多个可学习参数各自对应的权重,包括:将所述第一样本特征分别输入多个全链接层,得到与所述多个可学习参数各自对应的权重。4.根据权利要求2所述的方法,其中,所述根据所述可学习参数和所述可学习参数对应的权重,确定所述原始样本对应的难正样本的第二样本特征,包括:按照所述可学习参数对应的权重,对所述可学习参数进行加权求和,得到所述第二样本特征。5.根据权利要求1

4任一项所述的方法,其中,所述基于所述第一样本特征、所述第二样本特征和所述聚类簇,更新所述初始行人再识别模型,包括:根据所述第一样本特征和所述聚类簇的聚类中心之间的第一损失函数,确定第一损失;根据所述第二样本特征和所述聚类簇的聚类中心之间的第二损失函数,确定第二损失;根据所述第一样本特征、所述第二样本特征和所述原始样本图像所属的聚类簇的聚类中心之间的第三损失函数,确定第三损失;基于所述第一损失、所述第二损失和所述第三损失,更新所述初始行人再识别模型。6.根据权利要求5所述的方法,其中,所述第一损失函数用于使得所述原始样本图像与所述原始样本图像所属的聚类簇的聚类中心的距离减小,且所述原始样本图像与其他聚类簇的聚类中心的距离增大。7.根据权利要求5所述的方法,其中,所述第二损失函数用于使得所述难正样本与所述原始样本图像所属的聚类簇的聚类中心的距离减小,且所述难正样本与其他聚类簇的聚类中心的距离增大。8.根据权利要求5所述的方法,其中,所述第三损失函数用于使得所述原始样本图像距
离所述原始样本图像所属的聚类簇的聚类中心的距离,小于所述难正样本距离所述原始样本图像所属的聚类簇的聚类中心的距离。9.一种行人再识别方法,包括:获取待识别图像和目标行人图像;将所述待识别图像和所述目标行人图像分别输入行人再识别模型,得到所述待识别图像的特征向量和所述目标行人图像的特征向量,其中,所述行人再识别模型是采用权利要求1

8中任一项所述的方法训练得到的;基于所述待识别图像的特征向量与所述目标行人图像的特征向量的相似度确定所述待识别图像的识别结果。10.一种行人再识别模型的训练装置,包括:输入模块,用于将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到所述原始样本图像的第一样本特征;聚类模块,用于对所述原始样本图像的第一样本特征进行聚类,得到多个聚类簇;生成模块,用于根据所述原始样本图...

【专利技术属性】
技术研发人员:张欣彧王之港王健孙昊丁二锐
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1