唤醒设备识别方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：43564298 阅读：5 留言：0更新日期：2024-12-06 17:35

本发明专利技术涉及就近唤醒技术领域，提供一种唤醒设备识别方法、装置、设备、存储介质及程序产品。该方法包括：基于语音设备所处的生命周期阶段，采用阶段适配方式计算各目标语音设备与参考语音设备之间的目标增益差；分别将各目标语音设备在多个生命周期阶段对应的目标增益差进行融合；基于融合增益差，对各目标语音设备的语音能量进行增益校准；将校准后的最大语音能量对应的语音设备识别为唤醒设备。本发明专利技术能够最大限度地消除在各类因素干扰下，各目标语音设备与参考语音设备的语音能量增益之间的差距，使得各目标语音设备增益后的语音能量能够准确衡量对应语音设备与用户之间的距离，提高唤醒设备识别的准确性，并同步提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及就近唤醒，尤其涉及唤醒设备识别方法、装置、设备、存储介质及程序产品。

技术介绍

1、随着当前智能语音家居的普及，在同一个房间或者区域会同时存在多个智能语音设备，当用户喊出唤醒词后，需要从多个智能语音设备中识别出距离用户最近的语音设备进行唤醒，以便接收并执行用户的后续语音指令。

2、由于距离用户较近的语音设备接收的用户唤醒语音的能量通常也较大，因此传统的唤醒设备识别方法可以通过各语音设备接收的用户唤醒语音的能量大小来识别唤醒设备。但各语音设备对接收的用户唤醒语音具有增益效应，用于识别唤醒设备的语音能量实际上为经过增益后的语音能量，而不同语音设备在各种因素影响下的增益并不相同，从而导致增益后的语音能量不能准确衡量对应语音设备与用户之间的距离，降低唤醒设备识别的准确性，影响用户体验。

技术实现思路

1、本专利技术旨在至少解决相关技术中存在的技术问题之一。为此，本专利技术提出一种唤醒设备识别方法，最大限度地消除在各类因素干扰下，各目标语音设备的语音能量增益与参考语音设备的语音能量增益之间的差距，使得各目标语音设备的语音能量增益均与参考语音设备的语音能量增益保持同一水平，进而使得各目标语音设备增益后的语音能量能够准确衡量对应语音设备与用户之间的距离，从而提高唤醒设备识别的准确性，并同步提高用户体验。

2、本专利技术还提出一种唤醒设备识别装置、设备、存储介质及程序产品。

3、根据本专利技术第一方面实施例的唤醒设备识别方法，包括：

5、分别将各目标语音设备在多个生命周期阶段对应的目标增益差进行融合，得到各目标语音设备对应的融合增益差；

6、基于各目标语音设备对应的融合增益差，对各目标语音设备接收的用户唤醒语音的语音能量进行增益校准，得到各目标语音设备的校准后语音能量；

7、从各目标语音能量中确定出最大目标语音能量，将所述最大目标语音能量对应的语音设备识别为唤醒设备；

8、所述目标语音能量包括各目标语音设备的校准后语音能量。

9、根据本专利技术实施例的唤醒设备识别方法，基于语音设备所处的不同生命周期阶段，采用与各阶段适配的不同计算方式计算同一组网内每个目标语音设备与参考语音设备之间的目标增益差，能够通过对生命周期阶段的覆盖，尽可能对导致各目标语音设备与参考语音设备之间产生目标增益差的各类因素进行覆盖，并通过针对性的计算方式得到在各类因素干扰下准确的目标增益差，再将目标语音设备在不同阶段中的目标增益差进行融合，得到各类因素干扰下的融合增益差，基于该融合增益差对目标语音设备接收的用户唤醒语音的语音能量进行增益校准，最大限度地消除在各类因素干扰下，各目标语音设备的语音能量增益与参考语音设备的语音能量增益之间的差距，使得各目标语音设备的语音能量增益均与参考语音设备的语音能量增益保持同一水平，进而使得各目标语音设备增益后的语音能量能够准确衡量对应语音设备与用户之间的距离，从而提高唤醒设备识别的准确性，并同步提高用户体验。

10、根据本专利技术的一个实施例，所述目标语音能量还包括所述参考语音设备接收的用户唤醒语音的语音能量。

11、根据本专利技术的一个实施例，任一目标语音设备在用户使用阶段对应的目标增益差是基于如下方式确定：

12、在各语音设备处于增益稳定状态时，计算所述目标语音设备对应的目标增益差。

13、根据本专利技术的一个实施例，任一语音设备是否处于增益稳定状态是基于如下方式确定：

14、计算所述语音设备在深夜时段采集的多个第一预设时长底噪的增益，得到多个增益；

15、基于所述多个增益的增益均值和所述多个增益的增益标准差，得到所述语音设备的增益变异系数；

16、若所述语音设备的增益变异系数小于系数阈值，则确定所述语音设备处于增益稳定状态。

17、根据本专利技术的一个实施例，所述计算所述目标语音设备对应的目标增益差，包括：

18、计算所述目标语音设备的所述增益均值与所述参考语音设备的所述增益均值之间的差值，得到所述目标语音设备对应的当前增益差；

19、基于所述当前增益差与所述目标语音设备对应的历史增益差的加权求和结果，得到所述目标语音设备对应的目标增益差。

20、根据本专利技术的一个实施例，任一第一预设时长底噪的增益是基于如下方式确定：

21、计算所述第一预设时长底噪中多个第二预设时长底噪的功率谱，得到多个功率谱；

22、基于所述多个功率谱的平均值，确定所述第一预设时长底噪的增益。

23、根据本专利技术的一个实施例，所述增益均值和所述增益标准差是基于如下方式确定：

24、剔除所述多个增益中的最大值和最小值，得到多个待处理增益；

25、计算所述多个待处理增益的平均值和标准差，得到所述增益均值和所述增益标准差。

26、根据本专利技术的一个实施例，任一目标语音设备在用户使用阶段对应的目标增益差是基于如下方式确定：

27、计算所述目标语音设备的历史增益与所述参考语音设备的历史增益之间的差值，得到所述目标语音设备对应的目标增益差。

28、根据本专利技术的一个实施例，任一语音设备的历史增益是基于如下方式确定：

29、计算所述语音设备在多个历史唤醒时段采集的唤醒语音中目标频段语音的增益，得到多个待处理增益；

30、基于所述多个待处理增益的平均值，确定所述历史增益。

31、根据本专利技术的一个实施例，任一目标语音设备在目标阶段对应的目标增益差是基于如下方式确定：

32、计算所述目标语音设备的频点增益与所述参考语音设备的频点增益之间的差值，得到所述目标语音设备对应的目标增益差；

33、所述目标阶段包括设计阶段和/或出厂阶段。

34、根据本专利技术的一个实施例，任一语音设备的频点增益是基于如下方式确定：

35、计算所述语音设备在所述目标阶段采集的扫频声音信号中各频点的增益，得到多个待处理增益；所述扫频声音信号是扬声器在相对于所述语音设备的至少一个角度位置且达到均衡之后播放的；

36、基于所述多个待处理增益的平均值，确定所述频点增益。

37、根据本专利技术的一个实施例，所述分别将各目标语音设备在多个生命周期阶段对应的目标增益差进行融合，得到各目标语音设备对应的融合增益差，包括：

38、分别将各目标语音设备在多个生命周期阶段对应的目标增益差进行加权求和，得到各目标语音设备对应的融合增益差；

39、其中，所述目标增益差的权重的决定因素包括阶段选择、各语音设备的组网时长或各语音设备的唤醒次数中的至少任一项。

40、根本文档来自技高网...

【技术保护点】

1.一种唤醒设备识别方法，其特征在于，包括：

2.根据权利要求1所述的唤醒设备识别方法，其特征在于，

3.根据权利要求1所述的唤醒设备识别方法，其特征在于，任一目标语音设备在用户使用阶段对应的目标增益差是基于如下方式确定：

4.根据权利要求3所述的唤醒设备识别方法，其特征在于，任一语音设备是否处于增益稳定状态是基于如下方式确定：

5.根据权利要求4所述的唤醒设备识别方法，其特征在于，所述计算所述目标语音设备对应的目标增益差，包括：

6.根据权利要求4所述的唤醒设备识别方法，其特征在于，任一第一预设时长底噪的增益是基于如下方式确定：

7.根据权利要求4所述的唤醒设备识别方法，其特征在于，所述增益均值和所述增益标准差是基于如下方式确定：

8.根据权利要求1所述的唤醒设备识别方法，其特征在于，任一目标语音设备在用户使用阶段对应的目标增益差是基于如下方式确定：

9.根据权利要求8所述的唤醒设备识别方法，其特征在于，任一语音设备的历史增益是基于如下方式确定：

10.根据权利要求1所述

11.根据权利要求10所述的唤醒设备识别方法，其特征在于，任一语音设备的频点增益是基于如下方式确定：

12.根据权利要求1所述的唤醒设备识别方法，其特征在于，所述分别将各目标语音设备在多个生命周期阶段对应的目标增益差进行融合，得到各目标语音设备对应的融合增益差，包括：

13.一种唤醒设备识别装置，其特征在于，包括：

14.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至12任一项所述唤醒设备识别方法。

15.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至12任一项所述唤醒设备识别方法。

16.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至12任一项所述唤醒设备识别方法。

...

【技术特征摘要】