一种基于声纹模型的声纹数据的标注方法技术

技术编号：32822324 阅读：13 留言：0更新日期：2022-03-26 20:20

本申请公开了一种基于声纹模型的声纹数据的标注方法，该方法可以通过已标注有身份信息的多个第一声纹数据对初始模型进行训练得到声纹识别模型，基于声纹识别模型对多个未标注有身份信息的第二声纹数据进行声纹识别得到声纹特征，基于每个第二声纹数据对应的声纹特征，获取多个第二声纹数据中存在的多组声纹数据，以及多个第二声纹数据中除多组声纹数据以外的第二声纹数据作为其他声纹数据，将多组声纹数据中每组声纹数据对应的身份信息标注为不同的身份信息，以及将其他声纹数据中每个声纹数据标注为不同的身份信息。该方法通过半监督的方式既可以准确高效地对声纹数据标注身份信息，还可以提高声纹数据的标注的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声纹模型的声纹数据的标注方法

[0001]本申请涉及音频识别领域，更具体地，涉及一种基于声纹模型的声纹数据的标注方法。

技术介绍

[0002]深度学习是当今人工智能领域的核心技术，基于深度学习的技术的应用和推广，其中，基于深度学习的声纹识别正是其中的应用之一。如今，基于深度学习的声纹识别得到了飞速的发展和广泛的应用，在基于深度学习的声纹识别中，对声纹识别模型的训练来说，海量的数据和正确的标签尤为重要。相关技术中，通常通过人工标注的方式对音频数据进行标注，但由于待标注的音频数据量十分庞大，但人工标注的方法效率低下。

技术实现思路

[0003]鉴于上述问题，本申请提出了一种基于声纹模型的声纹数据的标注方法。
[0004]本申请实施例提供了一种基于声纹模型的声纹数据的标注方法，所述方法包括：获取多个声纹数据，所述多个声纹数据包括已标注有身份信息的多个第一声纹数据，以及未标注有身份信息的多个第二声纹数据；基于所述第一声纹数据，对初始模型进行训练，得到初始声纹识别模型；基于所述初始声纹识别模型对所述多个第二声纹数据进行声纹识别，得到每个第二声纹数据对应的声纹特征；基于所述每个第二声纹数据对应的声纹特征，获取所述多个第二声纹数据中存在的多组声纹数据，以及所述多个第二声纹数据中除所述多组声纹数据以外的第二声纹数据作为其他声纹数据，所述多组声纹数据的每组声纹数据中的第二声纹数据属于同一用户，所述每组声纹数据中包括至少两个第二声纹数据；将所述多组声纹数据中每组声纹数据对应的身份信息标注为不同的身份信息，...

【技术保护点】

【技术特征摘要】
1.一种基于声纹模型的声纹数据的标注方法，其特征在于，所述方法包括：获取多个声纹数据，所述多个声纹数据包括已标注有身份信息的多个第一声纹数据，以及未标注有身份信息的多个第二声纹数据；基于所述第一声纹数据，对初始模型进行训练，得到初始声纹识别模型；基于所述初始声纹识别模型对所述多个第二声纹数据进行声纹识别，得到每个第二声纹数据对应的声纹特征；基于所述每个第二声纹数据对应的声纹特征，获取所述多个第二声纹数据中存在的多组声纹数据，以及所述多个第二声纹数据中除所述多组声纹数据以外的第二声纹数据作为其他声纹数据，所述多组声纹数据的每组声纹数据中的第二声纹数据属于同一用户，所述每组声纹数据中包括至少两个第二声纹数据；将所述多组声纹数据中每组声纹数据对应的身份信息标注为不同的身份信息，以及将所述其他声纹数据中每个声纹数据标注为不同的身份信息，其中，所述多组声纹数据中同一组声纹数据中的第二声纹数据对应的身份信息相同，所述每组声纹数据对应的身份信息与所述其他声纹数据中每个声纹数据对应的身份信息互不相同。2.根据权利要求1所述的方法，其特征在于，所述基于所述每个第二声纹数据对应的声纹特征，获取所述多个第二声纹数据中存在的多组声纹数据，包括：基于所述每个第二声纹数据对应的声纹特征，获取所述多个第二声纹数据中每两个第二声纹数据的相似度；基于所述多个第二声纹数据中每两个第二声纹数据的相似度，从所述多个第二声纹数据中获取属于同一用户的第二声纹数据，并将属于同一用户的第二声纹数据作为一组声纹数据，得到多组声纹数据。3.根据权利要求2所述的方法，其特征在于，所述基于所述多个第二声纹数据中每两个第二声纹数据的相似度，从所述多个第二声纹数据中获取属于同一用户的第二声纹数据，包括：判断所述每两个第二声纹数据的相似度是否大于预设阈值；若任意两个目标声纹数据的相似度大于所述预设阈值，则将所述两个目标声纹数据确定为属于同一用户的第二声纹数据，所述目标声纹数据为所述多个第二声纹数据中的任一声纹数据。4.根据权利要求3所述的方法，其特征在于，在所述基于所述多个第二声纹数据中每两个第二声纹数据的相似度，从所述多个第二声纹数据中获取属于同一用户的第二声纹数据，并将属于同一用户的第二声纹数据作为一组声纹数据，得到多组声纹数据之后，所述方法还包括：从所述多组声纹数据中随机抽取预设组数的声纹数据；获取用户对所述预设组数的声纹数据进行检验的检验结果，所述检验结果用于表征每组声纹数据中的第二声纹数据是否属于同一用户以及不同组声纹数据中的第二声纹数据是否不属于同一用户；根据所述检验结果，调整所述预设阈值；基于调整后的所述预设阈值，对所述多组声纹数据以及所述其他声纹数据进行更新。5.根据权利要求...

【专利技术属性】
技术研发人员：吴广财，赖蔚蔚，郑颖龙，叶杭，周昉昉，陈颖璇，郑杰生，林嘉鑫，李凯，曾朝霖，许鑫禹，刘铭传，黄宏恩，
申请(专利权)人：广东电力信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人