目标识别模型训练方法、装置、设备以及存储介质制造方法及图纸

技术编号:25522758 阅读:21 留言:0更新日期:2020-09-04 17:12
本申请实施例公开了目标识别模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取训练样本集,其中,训练样本集中的训练样本包括样本目标图像和样本目标特征;基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;构建深度模型,以及基于有符号邻接矩阵构建图卷积神经网络;利用训练样本集对深度模型和图卷积神经网络进行有监督训练,得到目标识别模型。该实施方式提供了一种基于图卷积的目标识别技术,利用图卷积方法对特征空间进行优化,能够更有效地使类间距离增大而类内距离减小,从而显著提升了目标识别模型的性能。

【技术实现步骤摘要】
目标识别模型训练方法、装置、设备以及存储介质
本申请实施例涉及计算机
,具体涉及人工智能

技术介绍
目标识别技术是指从图像或视频中识别或者比对出目标的技术。随着人工智能的发展,目标识别是计算机视觉和数字图像处理的一个热门方向,广泛应用于金融、安防、自动驾驶、机器人导航、智能视频监控等诸多领域,极大地方便了人们的生活。目标识别的当前主流方式是比对目标特征,因此需要学习出判别性强的特征。传统的特征学习方法主要包括以下三种:其一,基于度量学习损失函数的特征学习方法,包括比对损失函数(contrastiveloss)、三元组损失函数(tripletloss)等;其二,基于softmax与交叉熵损失函数以及其变种的特征学习方法,包括sphereface、arcface等;其三,前两种方法的混合,首先利用softmax与交叉熵损失函数进行训练,然后利用度量学习损失函数进行微调。
技术实现思路
本申请实施例提出了目标识别模型训练方法、装置、设备以及存储介质。第一方面,本申请实施例提出了一种目标识别模型训练方法,包括:获取训练样本集,其中,训练样本集中的训练样本包括样本目标图像和样本目标特征;基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;构建深度模型,以及基于有符号邻接矩阵构建图卷积神经网络;利用训练样本集对深度模型和图卷积神经网络进行有监督训练,得到目标识别模型。第二方面,本申请实施例提出了一种目标识别模型训练装置,包括:样本获取模块,被配置成获取训练样本集,其中,训练样本集中的训练样本包括样本目标图像和样本目标特征;矩阵构建模块,被配置成基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;模型构建模块,被配置成构建深度模型,以及基于有符号邻接矩阵构建图卷积神经网络;模型训练模块,被配置成利用训练样本集对深度模型和图卷积神经网络进行有监督训练,得到目标识别模型。第三方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。本申请实施例提供的目标识别模型训练方法、装置、设备以及存储介质,首先基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;然后构建深度模型,以及基于有符号邻接矩阵构建图卷积神经网络;最后利用训练样本集对深度模型和图卷积神经网络进行有监督训练,得到目标识别模型。提供了一种基于图卷积的目标识别技术,首次将有符号的图卷积神经网络应用到目标特征学习中,有效地融合了度量学习与分类学习,有效避免了传统度量学习中难样本采样的问题,以及传统分类学习与应用场景目标不一致的问题。通过将目标图像提取特征组成图的形式,并利用图卷积方法对特征空间进行优化,能够更有效地使类间距离增大而类内距离减小,从而显著提升了目标识别模型的性能。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请可以应用于其中的示例性系统架构;图2是根据本申请的目标识别模型训练方法的一个实施例的流程图;图3是可以实现本申请实施例的目标识别模型训练方法的场景图;图4是根据本申请的目标识别模型训练方法的又一个实施例的流程图;图5是根据本申请的目标识别模型训练装置的一个实施例的结构示意图;图6是用来实现本申请实施例的目标识别模型训练方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的目标识别模型训练方法或目标识别模型训练装置的实施例的示例性系统架构100。如图1所示,系统架构100中可以包括存储设备101、网络102和服务器103。网络102用以在存储设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。存储设备101可以通过网络102与服务器103交互。存储设备101中可以提供训练样本集,包括但不限于数据库、用户终端等等。服务器103可以是具有模型计算能力的独立服务器,也可以是具有计算能力的处理模块。例如,服务器103可以是模型服务器。模型服务器可以对从存储设备101获取到的训练样本集等数据进行分析等处理,并生成处理结果(例如目标识别模型)。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的目标识别模型训练方法一般由服务器103执行,相应地,目标识别模型训练装置一般设置于服务器103中。应该理解,图1中的存储设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的存储设备、网络和服务器。在服务器103中存储有训练样本集的情况下,系统架构100可以不设置存储设备101和网络102。继续参考图2,其示出了根据本申请的目标识别模型训练方法的一个实施例的流程200。该目标识别模型训练方法包括以下步骤:步骤201,获取训练样本集。在本实施例中,目标识别模型训练方法的执行主体(例如图1所示的服务器103)可以获取训练样本集。其中,训练样本集中可以包括小批量训练样本。训练样本可以包括样本目标图像和样本目标特征。样本目标图像可以是存在目标的图像。样本目标特征可以是样本目标图像中存在的目标的特征。步骤202,基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵。在本实施例中,上述执行主体可以基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵(signedaffinitymatrix)。通常,利用有符号的图(signedg本文档来自技高网...

【技术保护点】
1.一种目标识别模型训练方法,包括:/n获取训练样本集,其中,所述训练样本集中的训练样本包括样本目标图像和样本目标特征;/n基于所述训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;/n构建深度模型,以及基于所述有符号邻接矩阵构建图卷积神经网络;/n利用所述训练样本集对所述深度模型和所述图卷积神经网络进行有监督训练,得到目标识别模型。/n

【技术特征摘要】
1.一种目标识别模型训练方法,包括:
获取训练样本集,其中,所述训练样本集中的训练样本包括样本目标图像和样本目标特征;
基于所述训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;
构建深度模型,以及基于所述有符号邻接矩阵构建图卷积神经网络;
利用所述训练样本集对所述深度模型和所述图卷积神经网络进行有监督训练,得到目标识别模型。


2.根据权利要求1所述的方法,其中,所述基于所述训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵,包括:
利用邻近算法对所述训练样本集建立邻接关系;
基于所述邻接关系和所述训练样本集中的训练样本之间的样本目标特征关系,构建所述有符号邻接矩阵。


3.根据权利要求2所述的方法,其中,所述基于所述邻接关系和所述训练样本集中的训练样本之间的样本目标特征关系,构建所述有符号邻接矩阵,包括:
对于所述训练样本集中存在邻接关系的两个训练样本,若所述两个训练样本的样本目标特征属于同一类别,则所述两个训练样本在所述有符号邻接矩阵中对应的元素的符号为正,且值为所述两个训练样本的样本目标特征的余弦值的倒数,若所述两个训练样本的样本目标特征属于不同类别,则所述两个训练样本在所述有符号邻接矩阵中对应的元素的符号为负,且值为所述两个训练样本的样本目标特征的余弦值的倒数。


4.根据权利要求3所述的方法,其中,所述基于所述有符号邻接矩阵构建图卷积神经网络,包括:
基于所述有符号邻接矩阵生成度矩阵,其中,所述度矩阵是对角矩阵,且每行对角上的元素等于所述有符号邻接矩阵的每行元素的绝对值的和;
基于所述有符号邻接矩阵和所述度矩阵更新所述图卷积神经网络输出的特征图。


5.根据权利要求4所述的方法,其中,所述基于所述有符号邻接矩阵和所述度矩阵更新所述图卷积神经网络输出的特征图,包括:
利用所述度矩阵对所述有符号邻接矩阵归一化,生成拉普拉斯矩阵;
使用所述拉普拉斯矩阵更新所述图卷积神经网络输出的特征图。


6.根据权利要求5所述的方法,其中,所述利用所述训练样本集对所述深度模型和所述图卷积神经网络进行有监督训练,得到目标识别模型,包括:
对于所述训练样本集中的训练样本,将该训练样本中的样本目标图像输入至所述深度模型,输出所述深度模型提取的目标特征;
将所述深度模型提取的目标特征输入至所述图卷积神经网络,输出所述图卷积神经网络提取的目标特征;
将所述图卷积神经网络提取的目标特征和该训练样本中的样本目标特征输入至分类损失函数,得到分类损失;
基于所述分类损失更新所述深度模型和所述图卷积神经网络的参数至收敛,得到所述目标识别模型。


7.根据权利要求6所述的方法,其中,所述将所述深度模型提取的目标特征输入至所述图卷积神经网络,输出所述图卷积神经网络提取的目标特征,包括:
对于所述图卷积神经网络的当前层,将所述当前层的上一层输出的特征图、所述拉普拉斯矩阵与所述当前层的权重矩阵相乘,得到所述当前层输出的特征图。


8.根据权利要求1-7之一所述的方法,其中,所述方法还包括:
将预测目标图像输入至所述目标识别模型中的所述深度模型,输出所述深度模型提取的预测目标特征;
将所述深度模型提取的预测目标特征输入至所述目标识别模型中的所述图卷积神经网络,输出所述图卷积神经网络提取的预测目标特征;
将所述图卷积神经网络提取的预测目标特征在预先存储的目标信息集合中比对,基于比对结果确定所述预测图像中的预测目标的类别,其中,所述目标信息集合中的目标信息包括目标特征和目标类别。


9.一种目标识别模型训练装置,包括:
样本获取模块,被配置成获取训练样本集,其中,所述训练样本集中的训练样本包括样本目标图像和样本目标特征;
矩阵构建模块,被配置成基于所述训练样本集中的训练样本之间的样本目标特征关...

【专利技术属性】
技术研发人员:余席宇张刚韩钧宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1