角色识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：35692803 阅读：18 留言：0更新日期：2022-11-23 14:42

本发明专利技术公开了一种角色识别方法，该方法包括获取目标音频文本，对目标音频文本进行文本检测，得到文本检测结果；对所述检测失败结果对应的所述目标音频文本进行纠正处理，得到纠正音频文本；获取纠正音频文本对应的纠正音频数据，对纠正音频数据进行声纹特征提取，得到音频声纹特征；确定纠正音频文本对应的文本特征向量，以及确定音频声纹特征对应的音频特征向量；基于音频特征向量和文本特征向量，确定纠正音频文本对应的情绪识别结果，并基于情绪识别结果、音频特征向量和文本特征向量，确定纠正音频文本对应的角色类别。如此，本发明专利技术通过情绪识别结果对纠正音频文本对应的角色类别进行辅助识别，从而提高了对角色识别的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
角色识别方法、装置、计算机设备及存储介质

[0001]本专利技术涉及语音交互
，尤其涉及一种角色识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]在智能语音的应用中，对语音交互中的说话人进行身份识别的场景非常典型和普遍，如智能会议的发言人的识别和智能客服的客服/客户的识别等。
[0003]现有技术中，往往是基于语音数据建立的声纹识别模型对说话人的身份进行识别。在智能会议或客服通话等场景下多个说话人在交替说话，从而在不同说话人的语音话术快速切换下，对说话人的身份识别的准确性较低。

技术实现思路

[0004]本专利技术实施例提供一种角色识别方法、装置、计算机设备及存储介质，以解决现有技术中对语音数据进行角色识别的准确性较低的问题。
[0005]一种角色识别方法，包括：
[0006]获取目标音频文本，对所述目标音频文本进行文本检测，得到文本检测结果；所述文本检测结果中包括检测失败结果；所述检测失败结果表征所述目标音频文本存在错误；
[0007]对所述检测失败结果对应的所述目标音频文本进行纠正处理，得到纠正音频文本；
[0008]获取所述纠正音频文本对应的纠正音频数据，对所述纠正音频数据进行声纹特征提取，得到音频声纹特征；
[0009]确定所述纠正音频文本对应的文本特征向量，以及确定所述音频声纹特征对应的音频特征向量；
[0010]基于所述音频特征向量和所述文本特征向量，确定所述纠正音频文本对应的情绪识别结果，并基于所述情绪识别结果、所...

【技术保护点】

【技术特征摘要】
1.一种角色识别方法，其特征在于，包括：获取目标音频文本，对所述目标音频文本进行文本检测，得到文本检测结果；所述文本检测结果中包括检测失败结果；所述检测失败结果表征所述目标音频文本存在错误；对所述检测失败结果对应的所述目标音频文本进行纠正处理，得到纠正音频文本；获取所述纠正音频文本对应的纠正音频数据，对所述纠正音频数据进行声纹特征提取，得到音频声纹特征；确定所述纠正音频文本对应的文本特征向量，以及确定所述音频声纹特征对应的音频特征向量；基于所述音频特征向量和所述文本特征向量，确定所述纠正音频文本对应的情绪识别结果，并基于所述情绪识别结果、所述音频特征向量和所述文本特征向量，确定所述纠正音频文本对应的角色类别。2.如权利要求1所述的角色识别方法，其特征在于，所述对所述目标音频文本进行文本检测，得到文本检测结果，包括：对所述目标音频文本进行文本检测，得到所述目标音频文本对应的文本检测值；获取预设阈值，并根据所述预设阈值和所述文本检测值，确定所述文本检测结果。3.如权利要求1所述的角色识别方法，其特征在于，所述对所述检测失败结果对应的所述目标音频文本进行纠正处理，得到纠正音频文本，包括：将所述检测失败结果对应的所述目标音频文本确定为错误音频文本，并确定所述错误音频文本中包含的待纠正字词；对所述错误音频文本中的所述待纠正字词进行掩码处理，得到待纠正掩码文本；将所述待纠正掩码文本输入至预设语言模型，通过所述预设语言模型对所述待纠正掩码文本进行纠正预测，得到所述待纠正字词对应的预测替换字词；将所述预测替换字词替换所述待纠正字词，并将替换之后的所述错误音频文本记录为所述纠正音频文本。4.如权利要求1所述的角色识别方法，其特征在于，所述获取所述纠正音频文本对应的纠正音频数据，对所述纠正音频数据进行声纹特征提取，得到音频声纹特征，包括：对所述纠正音频文本对应的所述纠正音频数据进行预处理，得到目标语音数据；对所述目标语音数据进行声纹特征提取，得到所述纠正音频数据对应的所述音频声纹特征。5.如权利要求1所述的角色识别方法，其特征在于，所述确定所述纠正音频文本对应的文本特征向量，以及确定所述音频声纹特征对应的音频特征向量，包括：对所述纠正音频文本进行分词处理，得到所述纠正音频文本对应的音频字词；对所述音频字词进行向量转换，得到所述音频字词对应的词向量，并根据所有所述词向量，确定所述纠正音频文本对应的所述文本特征向量；对所述音频声纹特征进行切割处理，得到切割音频...

【专利技术属性】
技术研发人员：蒋佳惟，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人