一种人物识别模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33918778 阅读:21 留言:0更新日期:2022-06-25 20:41
本发明专利技术提供了一种人物识别模型训练方法、装置、电子设备及存储介质,所述训练方法首先获取数据;其中,所述数据包括声音数据和图像数据;然后分析处理所述数据得到所述数据的特征向量;之后根据预设方法对所述特征向量进行标记;最后将标记后的所述特征向量输入到模型中进行训练得到人物识别模型;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记。本发明专利技术可以实时对模型中的声纹特征和人脸特征进行更新,提高了模型识别的准确率,为常态化教学状态提供了便利性。为常态化教学状态提供了便利性。为常态化教学状态提供了便利性。

【技术实现步骤摘要】
一种人物识别模型训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及模型训练领域,尤其涉及一种人物识别模型训练方法、装置、电子设备及存储介质

技术介绍

[0002]课堂分析中,需要确认教师,目前的方案都是通过预先建立人脸模型,例如:通过手机自拍上传图片到后台,后台进行人脸检测/人脸识别,得到人脸特征向量存储到数据库中,在之后的课程分析中,从数据库提取人脸特征向量进行比对。
[0003]目前手动建模方案主要面临两个问题:
[0004]建模设备与检测设备的差异性:人脸识别和声纹识别如果建模和检测使用不同的设备可能会影响检测精度,比如典型的手机人脸自拍焦距、视角与教室中摄像机的相差很大,会导致建模生成的特征向量与实际检测中使用的相似度相差较大;另外教室拾音器可能对环境做了某些调整,如去除某些低频噪声,而手机采集的人声不会做类似处理,也会导致声纹特征相似度下降;
[0005]无法适应教师特征变化:单次手动建模,随着时间推移,教师面部特征和声音特征都会发生缓慢变化,一般需要每年重新手动建模,更新历史特征,增加工作量,而且不知道何时需要重新手动建模。

技术实现思路

[0006]本专利技术提供了一种人物识别模型训练方法、装置、电子设备及存储介质,在数据采集和识别中通过使用相同的设备解决设备差异性问题;通过自动更新方式不断更新最近的人脸特征和声纹特征,能够持久保持最新的特征。
[0007]第一方面,本专利技术实施例提供了一种人物识别模型训练方法,所述训练方法包括:
[0008]获取数据;其中,所述数据包括声音数据和图像数据;
[0009]分析处理所述数据得到所述数据的特征向量;
[0010]根据预设方法对所述特征向量进行标记;
[0011]将标记后的所述特征向量输入到模型中进行训练得到人物识别模型。
[0012]可选地,所述训练方法还包括:
[0013]应用所述人物识别模型进行人物识别时将人物特征进行分析处理后更新到所述人物识别模型中;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记
[0014]可选地,所述训练方法还包括:
[0015]判断所述弱化特征所对应的人物身份是否正确,若错误则删除所述弱化特征。
[0016]可选地,所述分析处理所述数据得到所述数据的特征向量包括:
[0017]若所述数据为声音数据,所述分析处理所述数据得到所述数据的特征向量包括:
[0018]将所述声音数据转化为16k采样、f32格式的单声道PCM;
[0019]对所述单声道PCM做FFT得到频谱图;
[0020]将所述频谱图输入到声纹识别模型中得到声纹特征向量;
[0021]若所述数据为图像数据,所述分析处理所述数据得到所述数据的特征向量包括:
[0022]将所述图像数据中的图像输入到人脸识别模型中得到人脸特征向量。
[0023]可选地,所述根据预设方法对所述特征向量进行标记包括:
[0024]使用聚类算法对所述特征向量进行聚类得到多个不同的初始类;
[0025]在所述初始类中找到符合预设区分条件的最优类;
[0026]对所述最优类中的特征向量进行标记。
[0027]第二方面,本专利技术的实施例提供了一种人物识别方法,所述识别方法包括:
[0028]获取数据;其中,所述数据包括声音数据和图像数据;
[0029]分析处理所述数据得到所述数据的特征向量;
[0030]根据预设方法对所述特征向量进行标记;
[0031]将标记后的所述特征向量输入到模型中进行训练得到人物识别模型;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记;
[0032]获取当前人物的声音数据和图像数据;
[0033]使用所述人物识别模型对所述声音数据和图像数据进行识别,确定所述当前人物的身份。
[0034]第三方面,本专利技术的实施例提供了人物识别模型训练装置,所述训练装置包括:
[0035]数据获取模块,获取数据;其中,所述数据包括声音数据和图像数据;
[0036]分析处理模块,分析处理所述数据得到所述数据的特征向量;
[0037]标记模块,根据预设方法对所述特征向量进行标记;
[0038]训练模块,将标记后的所述特征向量输入到模型中进行训练得到人物识别模型;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记。
[0039]可选地,所述训练装置还包括:
[0040]修改模块,判断所述弱化特征所对应的人物身份是否正确,若错误则删除所述弱化特征。
[0041]第四方面,本专利技术的实施例提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面任一项所述的方法。
[0042]第五方面,本专利技术的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。
[0043]有益效果
[0044]本专利技术提供了一种人物识别模型训练方法、装置、电子设备及存储介质,所述训练方法首先获取数据;其中,所述数据包括声音数据和图像数据;然后分析处理所述数据得到所述数据的特征向量;之后根据预设方法对所述特征向量进行标记;最后将标记后的所述特征向量输入到模型中进行训练得到人物识别模型;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记。可以实时对模型中的声纹特征和人脸特征进行更新,提高了模型识别的准确率,为常态化教学状态提供了便利性。
[0045]应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。
附图说明
[0046]结合附图并参考以下详细说明,本专利技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。
[0047]图1示出了本专利技术的实施例的一种人物识别模型训练方法的流程图;
[0048]图2示出了本专利技术的实施例的一种人物识别方法的流程图;
[0049]图3示出了本专利技术实施例的一种人物识别模型训练装置的结构示意图;
[0050]图4示出了本专利技术实施例的一种电子设备的结构图。
具体实施方式
[0051]为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
[0052]需要说明的是,本专利技术实施例描述的仅仅是为了更加清楚的说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人物识别模型训练方法,其特征在于,所述训练方法包括:获取数据;其中,所述数据包括声音数据和图像数据;分析处理所述数据得到所述数据的特征向量;根据预设方法对所述特征向量进行标记;将标记后的所述特征向量输入到模型中进行训练得到人物识别模型。2.根据权利要求1所述的训练方法,其特征在于,所述训练方法还包括:应用所述人物识别模型进行人物识别时将人物特征进行分析处理后更新到所述人物识别模型中;其中,将标记的强化特征输入到特征库中,对标记的弱化特征打警示标记。3.根据权利要求1所述的训练方法,其特征在于,所述训练方法还包括:判断所述弱化特征所对应的人物身份是否正确,若错误则删除所述弱化特征。4.根据权利要求1所述的训练方法,其特征在于,所述分析处理所述数据得到所述数据的特征向量包括:若所述数据为声音数据,所述分析处理所述数据得到所述数据的特征向量包括:将所述声音数据转化为16k采样、f32格式的单声道PCM;对所述单声道PCM做FFT得到频谱图;将所述频谱图输入到声纹识别模型中得到声纹特征向量;若所述数据为图像数据,所述分析处理所述数据得到所述数据的特征向量包括:将所述图像数据中的图像输入到人脸识别模型中得到人脸特征向量。5.根据权利要求1所述的训练方法,其特征在于,所述根据预设方法对所述特征向量进行标记包括:使用聚类算法对所述特征向量进行聚类得到多个不同的初始类;在所述初始类中找到符合预设区分条件的最优类;对所述最优类中的...

【专利技术属性】
技术研发人员:孙玮
申请(专利权)人:北京中庆现代技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1