语音处理方法、装置、设备及存储介质制造方法及图纸

技术编号:39033512 阅读:9 留言:0更新日期:2023-10-10 11:46
本申请实施例提供一种语音处理方法、装置、设备及存储介质,该方法包括:获取唤醒词语音信号中各单词的时长和声音信号振幅;判断单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致,若否,则对单词的声音信号振幅进行缩放,以使单词的声音信号振幅与目标单词的声音信号振幅一致;目标单词为预设注册声纹中与单词相同的词;判断单词的时长与目标单词的时长是否一致,若否,则对单词的时长进行缩放,以使单词的时长与目标单词的时长一致,得到缩放后的唤醒词语音信号。这样可以克服输入的唤醒词语音的语速较快或较慢,以及音量较高或较低时提取的特征的准确率较低的问题,从而达到提高语音唤醒成功率、语音交互成功率的效果。交互成功率的效果。交互成功率的效果。

【技术实现步骤摘要】
语音处理方法、装置、设备及存储介质


[0001]本申请实施例涉及工业互联网语音识别
,尤其涉及一种语音处理方法、装置、设备及存储介质。

技术介绍

[0001]随着工业智能设备的发展,工业智能设备(以下简称智能设备)的语音交互功能受到越来越多的用户青睐,用户可以通过语音唤醒词唤醒智能设备或智能设备中的语音识别单元,使得智能设备或智能设备中的语音识别单元由待机状态变为工作状态,以便进行下一步的人机语音交互。
[0002]目前,在进行语音唤醒或者语音交互时,智能设备直接对获取的语音信号进行特征提取,并将提取的特征和注册声纹的特征进行对比,在对比结果不超过预设阈值时,唤醒智能设备或执行语音信号对应的操作。
[0003]但当用户输入的语音的语速较快或较慢,以及音量较高或较低时,容易使得智能设备从语音信号提取的特征的准确率较低,从而导致语音唤醒、语音交互成功率较低。

技术实现思路

[0004]本申请实施例提供一种语音处理方法、装置、设备及存储介质,有助于提高语音唤醒、语音交互成功率。
[0005]第一方面,本申请实施例提供一种语音处理方法,该方法包括:
[0006]获取唤醒词语音信号中各单词的时长和声音信号振幅;
[0007]判断单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致,若否,则对单词的声音信号振幅进行缩放,以使单词的声音信号振幅与目标单词的声音信号振幅一致;目标单词为预设注册声纹中与单词相同的词;
[0008]判断单词的时长与目标单词的时长是否一致,若否,则对单词的时长进行缩放,以使单词的时长与目标单词的时长一致,得到缩放后的唤醒词语音信号。
[0009]在一种可能的实现方式中,对单词的声音信号振幅进行缩放,以使单词的声音信号振幅与目标单词的声音信号振幅一致,包括:
[0010]根据目标单词的声音信号振幅与单词的声音信号振幅的比值得到振幅缩放比例;根据振幅缩放比例对单词的声音信号振幅进行缩放。
[0011]在一种可能的实现方式中,方法还包括:
[0012]获取唤醒词语音信号中各单词的声音频率;
[0013]根据目标单词的声音频率与单词的声音频率的比值得到频率缩放比例;
[0014]根据频率缩放比例对单词的声音频率进行缩放。
[0015]在一种可能的实现方式中,对单词的时长进行缩放,以使单词的时长与目标单词的时长一致,包括:
[0016]根据目标单词的时长与单词的时长的比值得到时长缩放比例;根据时长缩放比例
对单词的时长进行缩放。
[0017]在一种可能的实现方式中,获取唤醒词语音信号中各单词的时长和声音信号振幅,包括:
[0018]分段获取唤醒词语音信号的时长和声音信号振幅,得到至少一个单词组的时长和声音信号振幅;从至少一个单词组的时长和声音信号振幅中获取各单词的时长和声音信号振幅。
[0019]在一种可能的实现方式中,方法还包括:
[0020]获取缩放后的唤醒词语音信号的特征和注册声纹的特征;将缩放后的唤醒词语音信号的特征与注册声纹的特征进行对比,得到对比结果;根据对比结果判断是否唤醒语音识别单元或者执行唤醒词语音信号对应的操作。
[0021]在一种可能的实现方式中,方法还包括:
[0022]保存缩放后的唤醒词语音信号,并将缩放后的唤醒词语音信号对应的关键词的参数标识加1;
[0023]在参数标识达到预设数值时,若获取到关键词对应的唤醒词语音信号,则执行缩放后的唤醒词语音信号对应的操作。
[0024]第二方面,本申请实施例提供一种语音处理装置,该装置包括:获取模块,第一缩放模块和第二缩放模块,其中,
[0025]获取模块,用于获取唤醒词语音信号中各单词的时长和声音信号振幅;
[0026]第一缩放模块,用于判断单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致,若否,则对单词的声音信号振幅进行缩放,以使单词的声音信号振幅与目标单词的声音信号振幅一致;目标单词为预设注册声纹中与单词相同的词;
[0027]第二缩放模块,用于判断单词的时长与目标单词的时长是否一致,若否,则对单词的时长进行缩放,以使单词的时长与目标单词的时长一致,得到缩放后的唤醒词语音信号。
[0028]在一种可能的实现方式中,第一缩放模块,具体用于:
[0029]根据目标单词的声音信号振幅与单词的声音信号振幅的比值得到振幅缩放比例;
[0030]根据振幅缩放比例对单词的声音信号振幅进行缩放。
[0031]在一种可能的实现方式中,该装置还包括:
[0032]获得模块,用于获取唤醒词语音信号中各单词的声音频率;
[0033]计算模块,用于根据目标单词的声音频率与单词的声音频率的比值得到频率缩放比例;
[0034]第三缩放模块,用于根据频率缩放比例对单词的声音频率进行缩放。
[0035]在一种可能的实现方式中,第二缩放模块,具体用于:
[0036]根据目标单词的时长与单词的时长的比值得到时长缩放比例;
[0037]根据时长缩放比例对单词的时长进行缩放。
[0038]在一种可能的实现方式中,获取模块,具体用于:
[0039]分段获取唤醒词语音信号的时长和声音信号振幅,得到至少一个单词组的时长和声音信号振幅;
[0040]从至少一个单词组的时长和声音信号振幅中获取各单词的时长和声音信号振幅。
[0041]在一种可能的实现方式中,该装置还包括:
[0042]提取模块,用于获取缩放后的唤醒词语音信号的特征和注册声纹的特征;
[0043]对比模块,用于将缩放后的唤醒词语音信号的特征与注册声纹的特征进行对比,得到对比结果;
[0044]判断模块,用于根据对比结果判断是否唤醒语音识别单元或者执行唤醒词语音信号对应的操作。
[0045]在一种可能的实现方式中,该装置还包括:
[0046]保存模块,用于保存缩放后的唤醒词语音信号,并将缩放后的唤醒词语音信号对应的关键词的参数标识加1;
[0047]执行模块,用于在参数标识达到预设数值时,若获取到关键词对应的唤醒词语音信号,则执行缩放后的唤醒词语音信号对应的操作。
[0048]第三方面,本申请实施例提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;存储器存储计算机执行指令;处理器执行存储器存储的计算机执行指令,使得处理器执行如第一方面描述的语音处理方法。
[0049]第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面描述的语音处理方法。
[0050]第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面描述的语音处理方法。
[0051]第六方面,本申请实施例提供一种芯片,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:获取唤醒词语音信号中各单词的时长和声音信号振幅;判断所述单词的声音信号振幅与预设注册声纹中的目标单词的声音信号振幅是否一致,若否,则对所述单词的声音信号振幅进行缩放,以使所述单词的声音信号振幅与所述目标单词的声音信号振幅一致;所述目标单词为所述预设注册声纹中与所述单词相同的词;判断所述单词的时长与所述目标单词的时长是否一致,若否,则对所述单词的时长进行缩放,以使所述单词的时长与所述目标单词的时长一致,得到缩放后的唤醒词语音信号。2.根据权利要求1所述的方法,其特征在于,所述对所述单词的声音信号振幅进行缩放,以使所述单词的声音信号振幅与所述目标单词的声音信号振幅一致,包括:根据所述目标单词的声音信号振幅与所述单词的声音信号振幅的比值得到所述振幅缩放比例;根据所述振幅缩放比例对所述单词的声音信号振幅进行缩放。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述唤醒词语音信号中各所述单词的声音频率;根据所述目标单词的声音频率与所述单词的声音频率的比值得到频率缩放比例;根据所述频率缩放比例对所述单词的声音频率进行缩放。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述对所述单词的时长进行缩放,以使所述单词的时长与所述目标单词的时长一致,包括:根据所述目标单词的时长与所述单词的时长的比值得到所述时长缩放比例;根据所述时长缩放比例对所述单词的时长进行缩放。5.根据权利要求4所述的方法,其特征在于,所述获取唤醒词语音信号中各单词的时长和声音信号振幅,包括:分段获取所述唤醒词语音信号的时长和声音信号振幅,得到至少一个单词组的时长和声音信号振幅;从所述至少一个单词组的时长和声音信号振幅中获取所述各单词的时长和声音信号振幅。6.根据权利...

【专利技术属性】
技术研发人员:冯志珍鲁效平徐春长秦承刚王迷珍
申请(专利权)人:卡奥斯物联科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1