声音识别方法、声音识别装置及电子设备制造方法及图纸

技术编号：32549724 阅读：27 留言：0更新日期：2022-03-05 11:49

本公开提供了一种声音识别方法、声音识别装置及电子设备。该方法包括获取年龄处于目标年龄段内的用户对象的音频信息，其中，用户对象通过声音特点来表达需求；对音频信息进行预处理，得到目标音频信息；对目标音频信息进行特征提取，得到对数梅尔频谱特征；按照预设信号处理规则对对数梅尔频谱特征进行处理，得到初始二维矩阵；利用预设差分处理规则处理初始二维矩阵，得到目标二维矩阵；根据目标二维矩阵和初始二维矩阵，生成三维张量；以及将三维张量输入分类器识别模块，输出预测结果，其中，预测结果用于表征用户对象的需求。预测结果用于表征用户对象的需求。预测结果用于表征用户对象的需求。

全部详细技术资料下载

【技术实现步骤摘要】
声音识别方法、声音识别装置及电子设备

[0001]本公开涉及语音信号处理
，更具体地，涉及一种声音识别方法、声音识别装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]声音是由物体振动产生的声波，是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。通过声音可以表达不同的需求，例如婴儿可以通过发出哭声提醒亲属其需求，如饿了、冷了等。
[0003]在实现本公开构思的过程中，专利技术人发现相关技术中至少存在如下问题：较难通过用户的声音特点判断用户的需求。

技术实现思路

[0004]有鉴于此，本公开实施例提供了一种声音识别方法、声音识别装置、电子设备、计算机可读存储介质及计算机程序产品。
[0005]本公开实施例的一个方面提供了一种声音识别方法，包括：
[0006]获取年龄处于目标年龄段内的用户对象的音频信息，其中，上述用户对象通过声音特点来表达需求；
[0007]对上述音频信息进行预处理，得到目标音频信息；
[0008]对上述目标音频信息进行特征提取，得到对数梅尔频谱特征；
[0009]按照预设信号处理规则对上述对数梅尔频谱特征进行处理，得到初始二维矩阵；
[0010]利用预设差分处理规则处理上述初始二维矩阵，得到目标二维矩阵；根据上述目标二维矩阵和上述初始二维矩阵，生成三维张量；以及
[0011]将上述三维张量输入分类器识别模块，输出预测结果，其中，上述预测结果用于表征上述用户对象的需求。<...

【技术保护点】

【技术特征摘要】
1.一种声音识别方法，包括：获取年龄处于目标年龄段内的用户对象的音频信息，其中，所述用户对象通过声音特点来表达需求；对所述音频信息进行预处理，得到目标音频信息；对所述目标音频信息进行特征提取，得到对数梅尔频谱特征；按照预设信号处理规则对所述对数梅尔频谱特征进行处理，得到初始二维矩阵；利用预设差分处理规则处理所述初始二维矩阵，得到目标二维矩阵；根据所述目标二维矩阵和初始二维矩阵，生成三维张量；以及将所述三维张量输入分类器识别模块，输出预测结果，其中，所述预测结果用于表征所述用户对象的需求。2.根据权利要求1所述的方法，所述初始二维矩阵包括目标频率维度和目标时间维度；其中，利用预设差分处理规则处理所述初始二维矩阵，得到目标二维矩阵，包括：在所述目标频率维度和所述目标时间维度上对所述初始二维矩阵分别进行差分处理，得到所述目标二维矩阵。3.根据权利要求1所述的方法，其中，所述对所述音频信息进行预处理，得到目标音频信息，包括：对所述音频信息的采样率进行降采样处理，得到第一音频信息；对所述第一音频信息进行降噪处理，得到第二音频信息；对所述第二音频信息进行静音抑制处理，得到所述目标音频信息。4.根据权利要求3所述的方法，其中，所述对所述第二音频信息进行静音抑制处理，得到所述目标音频信息，包括：利用语音活动检测方法对所述第二音频信息中的静音片段进行处理，得到所述目标音频信息。5.根据权利要求1所述的方法，所述分类器识别模块包括声音识别模型，所述声音识别模型包括特征嵌入层、模型编码器和多层感知机机头；其中，所述将所述三维张量输入分类器识别模块，输出预测结果，包括：按照预设切割规则对所述三维张量进行切割，得到多个子张量将多个所述子张量输入所述特征嵌入层，输出第一矩阵；在所述第一矩阵上拼接预设向量，得到第二矩阵；根据所述第二矩阵和预设位置编码矩阵，得到第三矩阵；将所述第三矩阵输入所述模型编码器，输出第四矩阵；将所述第四矩阵输入所述多层感知机机头，输出所述预测结果。6.根据权利要求5所述的方法，其中，所述将所述第三矩阵输入所述模型编码器，输出第四矩阵，包括：将所述第三矩阵输入所述模型编码器，输出新的第三矩阵；在不满足预设条件的情况下，迭代地将所述新的第三矩阵作...

【专利技术属性】
技术研发人员：张结，徐海涛，戴礼荣，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人