人脸识别方法、装置及分类模型训练方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:19512031 阅读:20 留言:0更新日期:2018-11-21 08:13
本申请涉及一种人脸识别及分类模型训练方法、装置、计算机可读存储介质和计算机设备,分类模型训练方法包括:将训练样本输入至基于神经网络建立的分类模型,得到训练样本的多维特征向量;将多维特征向量投影至超球体特征空间,得到投影特征;将投影特征输入分类模型的全连接层和分类器,得到训练样本的输出结果;调整分类模型的损失相关参数;损失相关参数用于使分类模型的损失下降;根据训练样本的输出结果、训练样本的实际类别及调整的损失相关参数,计算分类模型的损失;根据损失进行反向传播优化分类模型,并基于优化的分类模型进行训练直到达到训练停止条件。该方法避免出现训练过程中,损失长时间不下降的问题,提高了分类模型的训练效率。

【技术实现步骤摘要】
人脸识别方法、装置及分类模型训练方法、装置、存储介质和计算机设备
本申请涉及计算机
,特别是涉及一种人脸识别方法、装置、计算机可读存储介质和计算机设备,及分类模型训练方法、装置、计算机可读存储介质和计算机设备。
技术介绍
随着人工智能技术的发展,人脸识别的应用范围越来越广,例如考勤,解锁等。人脸识别可以认为是分类问题,可基于分类模型实现。分类模型用于解决机器学习中的分类问题,其采用深度学习训练所得到的神经网络结构。分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一幅图片上的动物是一只猫还是一只狗。分类模型的作用是将输入数据,例如图像或语音等,提取特征,并将该特征与类别特征进行比较,达到分类的目的。分类模型通过大量标记的训练样本,训练神经网络结构的参数得到。分类模型训练过程中,若分类模型的损失符合预期时,则停止训练。分类模型的损失反应了预测结果的准确度,当预测结果的准确率高时,分类模型的损失小。然而在实际应用过程中,分类模型的损失通常一开始下降的非常快,但当训练到一定阶段时,分类模型的损失可能长时间不变化,这就导致分类模型的训练效率低。
技术实现思路
基于此,有必要针对训练效率低的技术问题,提供一种人脸识别方法、装置、计算机可读存储介质和计算机设备,及分类模型训练方法、装置、计算机可读存储介质和计算机设备。一种人脸识别方法,包括:获取待识别人脸图像;将所述人脸图像输入分类模型,通过所述分类模型得到所述待识别人脸图像的识别结果;其中,通过将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;将所述多维特征向量投影至超球体特征空间,得到投影特征;将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件,得到分类模型。一种分类模型训练方法,包括:将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;将所述多维特征向量投影至超球体特征空间,得到投影特征;将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件。一种人脸识别装置,包括:图像获取模块,用于获取待识别人脸图像;预测模块,用于将所述人脸图像输入分类模型,通过所述分类模型得到所述待识别人脸图像的识别结果;输入模块,用于将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;投影模块,用于将所述多维特征向量投影至超球体特征空间,得到投影特征;输出模块,用于将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整模块,用于调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;损失模块,用于根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;迭代模块,用于根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件,得到所述分类模块。一种分类模型训练模块,包括:输入模块,用于将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;投影模块,用于将所述多维特征向量投影至超球体特征空间,得到投影特征;输出模块,用于将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整模块,用于调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;损失模块,用于根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;迭代模块,用于根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。上述的人脸识别方法、装置计算机可读存储介质和计算机设备,及分类模型训练方法、装置、计算机可读存储介质和计算机设备,根据所述训练样本的输出结果,调整所述分类模型的损失相关参数,在传统的softmaxloss的基础上,考虑了其它的损失相关参数,并结合softmaxsloss和损失相关参数,计算分类模型的损失。由于损失相关参数的作用在于使分类模型的损失下降,因而本申请的方法得到的分类模型的损失在训练过程中是不断下降的,避免出现训练过程中,损失长时间不下降的问题,从而提高了分类模型的训练效率。附图说明图1为一个实施例中分类模型训练方法的应用环境示意图;图2为一个实施例中分类模型训练方法的流程图;图3为另一个实施例中分类模型训练方法的流程图;图4为与图3所示的流程图对应的时序图;图5为三种方式下模型评估数据集上的分类精度变化曲线示意图;图6为一个实施例的人脸识别装置的结构框图;图7为一个实施例中计算机设备的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请的分类模型训练方法,基于神经网络深度学习海量数据,学习有用的特征,达到准确分类的目的。分类模型用于解决机器学习中的分类问题,分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一幅图片上的动物是一只猫还是一只狗。分类模型的作用是将输入数据,例如图像或语音等,提取特征,并将该特征与各类别特征进行比较,达到分类的目的。分类模型的应用场景可以为图像识别、语音识别或人脸识别等。一个实施例的分类模型训练方法的应用场景示意图如图1所示,包括服务器101和终端设备102。服务器101和终端设备102网络连接。其中服务器101包括分类模型训练模块和预测模块。其中分类模型训练模块执行一种分类模型训练方法,得到分类模型。预测模块接收终端设备102输入的待分类数据,得到分类结果。基于分类模型的具体应用场景,终端设备可以为电子设备,例如智能家居设备、移动终端或考勤设备等。终端设备102基于终端设备具体的应用,采集语音信号或图像信息发送至服务器101,由服务器101进行分类,得到分类结果。服务器101将分类结果发送至终端设备102。终端设备102基于具体应用场景,根据分类结果可执行家居设备唤醒、考勤等相关指令。在一个实施例中,提供一种分类模型训练方法,如图2所示,包括以下步骤:S202,将训练样本输入至基于神经网络建立的分类模型,得到训练样本的多维特征向量。本实施例中的分类模型基于本文档来自技高网...

【技术保护点】
1.一种人脸识别方法,包括:获取待识别人脸图像;将所述人脸图像输入分类模型,通过所述分类模型得到所述待识别人脸图像的识别结果;其中,通过将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;将所述多维特征向量投影至超球体特征空间,得到投影特征;将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件,得到所述分类模型。

【技术特征摘要】
1.一种人脸识别方法,包括:获取待识别人脸图像;将所述人脸图像输入分类模型,通过所述分类模型得到所述待识别人脸图像的识别结果;其中,通过将训练样本输入至基于神经网络建立的分类模型,得到所述训练样本的多维特征向量;将所述多维特征向量投影至超球体特征空间,得到投影特征;将所述投影特征输入所述分类模型的全连接层,得到所述分类模型对所述训练样本的输出结果;调整所述分类模型的损失相关参数;所述损失相关参数用于使所述分类模型的损失下降;根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失;根据所述损失进行反向传播优化所述分类模型,并基于优化的分类模型进行训练直到达到训练停止条件,得到所述分类模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据上次训练所述分类模型的损失计算得到的所述分类模型的变化量;根据变化量和上次训练所采用的超球体特征空间的半径,计算当次训练的超球体特征空间的半径;所述损失相关参数包括所述超球体半径损失,所述调整所述分类模型的损失相关参数,包括:根据当次训练的超球体特征空间的半径计算超球体半径损失。3.根据权利要求2所述的方法,其特征在于,所述损失相关参数还包括边界值;所述调整所述分类模型的损失相关参数还包括:根据所述训练样本的输出结果所确定的所述训练样本与各类别的余弦相似度,调整所述训练样本与对应类别的边界值。4.根据权利要求1所述的方法,其特征在于,所述损失相关参数包括边界值;所述根据所述训练样本的输出结果,调整所述分类模型的损失相关参数还包括:根据所述训练样本的输出结果所确定的所述训练样本与各类别的余弦相似度,调整所述训练样本与对应类别的边界值。5.根据权利要求2所述的方法,其特征在于,所述将所述多维特征向量投影至超球体特征空间,得到投影特征,包括:根据当次训练的超球体特征空间的半径,将所述多维特征向量投影至超球体特征空间,得到投影特征。6.根据所述权利要求3所述的方法,其特征在于,根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失,包括:根据所述输出结果、所述训练样本的实际类别和所述边界值,计算得到第一损失值;根据所述第一损失值和所述超球体半径损失,得到所述分类模型的损失。7.根据权利要求2所述的方法,其特征在于,所述根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失,包括:根据所述输出结果和所述训练样本的实际类别计算第一损失值;根据所述第一损失值和所述超球体半径损失,计算得到所述分类模型的损失。8.根据权利要求4所述的方法,其特征在于,所述根据所述输出结果、所述训练样本的实际类别及调整的所述损失相关参数,计算所述分类模型的损失,包括:根据所述输出结果、所述训练样本的实际类别及所述边界值,计算所述分类模型的损失。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述将所述多维特征向量投影至超球体特征空间,得到投影特征之前,还包括:将所述多维特征向...

【专利技术属性】
技术研发人员:李安平李绍欣陈超沈鹏程李季檩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1