语音处理方法、装置、设备及存储介质制造方法及图纸

技术编号：39033512 阅读：9 留言：0更新日期：2023-10-10 11:46

本申请实施例提供一种语音处理方法、装置、设备及存储介质，该方法包括：获取唤醒词语音信号中各单词的时长和声音信号振幅；判断单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致，若否，则对单词的声音信号振幅进行缩放，以使单词的声音信号振幅与目标单词的声音信号振幅一致；目标单词为预设注册声纹中与单词相同的词；判断单词的时长与目标单词的时长是否一致，若否，则对单词的时长进行缩放，以使单词的时长与目标单词的时长一致，得到缩放后的唤醒词语音信号。这样可以克服输入的唤醒词语音的语速较快或较慢，以及音量较高或较低时提取的特征的准确率较低的问题，从而达到提高语音唤醒成功率、语音交互成功率的效果。交互成功率的效果。交互成功率的效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置、设备及存储介质

[0001]本申请实施例涉及工业互联网语音识别
，尤其涉及一种语音处理方法、装置、设备及存储介质。

技术介绍

[0001]随着工业智能设备的发展，工业智能设备(以下简称智能设备)的语音交互功能受到越来越多的用户青睐，用户可以通过语音唤醒词唤醒智能设备或智能设备中的语音识别单元，使得智能设备或智能设备中的语音识别单元由待机状态变为工作状态，以便进行下一步的人机语音交互。
[0002]目前，在进行语音唤醒或者语音交互时，智能设备直接对获取的语音信号进行特征提取，并将提取的特征和注册声纹的特征进行对比，在对比结果不超过预设阈值时，唤醒智能设备或执行语音信号对应的操作。
[0003]但当用户输入的语音的语速较快或较慢，以及音量较高或较低时，容易使得智能设备从语音信号提取的特征的准确率较低，从而导致语音唤醒、语音交互成功率较低。

技术实现思路

[0004]本申请实施例提供一种语音处理方法、装置、设备及存储介质，有助于提高语音唤醒、语音交互成功率。
[0005]第一方面，本申请实施例提供一种语音处理方法，该方法包括：
[0006]获取唤醒词语音信号中各单词的时长和声音信号振幅；
[0007]判断单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致，若否，则对单词的声音信号振幅进行缩放，以使单词的声音信号振幅与目标单词的声音信号振幅一致；目标单词为预设注册声纹中与单词相同的词；
[0008]判断单词的时长与目标单...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，其特征在于，所述方法包括：获取唤醒词语音信号中各单词的时长和声音信号振幅；判断所述单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致，若否，则对所述单词的声音信号振幅进行缩放，以使所述单词的声音信号振幅与所述目标单词的声音信号振幅一致；所述目标单词为所述预设注册声纹中与所述单词相同的词；判断所述单词的时长与所述目标单词的时长是否一致，若否，则对所述单词的时长进行缩放，以使所述单词的时长与所述目标单词的时长一致，得到缩放后的唤醒词语音信号。2.根据权利要求1所述的方法，其特征在于，所述对所述单词的声音信号振幅进行缩放，以使所述单词的声音信号振幅与所述目标单词的声音信号振幅一致，包括：根据所述目标单词的声音信号振幅与所述单词的声音信号振幅的比值得到所述振幅缩放比例；根据所述振幅缩放比例对所述单词的声音信号振幅进行缩放。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取所述唤醒词语音信号中各所述单词的声音频率；根据所述目标单词的声音频率与所述单词的声音频率的比值得到频率缩放比例；根据所述频率缩放比例对所述单词的声音频率进行缩放。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述对所述单词的时长进行缩放，以使所述单词的时长与所述目标单词的时长一致，包括：根据所述目标单词的时长与所述单词的时长的比值得到所述时长缩放比例；根据所述时长缩放比例对所述单词的时长进行缩放。5.根据权利要求4所述的方法，其特征在于，所述获取唤醒词语音信号中各单词的时长和声音信号振幅，包括：分段获取所述唤醒词语音信号的时长和声音信号振幅，得到至少一个单词组的时长和声音信号振幅；从所述至少一个单词组的时长和声音信号振幅中获取所述各单词的时长和声音信号振幅。6.根据权利...

【专利技术属性】
技术研发人员：冯志珍，鲁效平，徐春长，秦承刚，王迷珍，
申请(专利权)人：卡奥斯物联科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人