一种语音数据处理方法技术

技术编号：39755969 阅读：12 留言：0更新日期：2023-12-17 23:55

本申请实施例提供了一种语音数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
一种语音数据处理方法、装置、设备以及可读存储介质

[0001]本申请涉及计算机
，尤其涉及一种语音数据处理方法
、
装置
、
计算机设备以及可读存储介质
。

技术介绍

[0002]随着人工智能
(Artificial Intelligence
，
AI)
技术的发展，自动语音识别
(Automatic Speech Recognition
，
ASR)
技术的应用越来越广泛
。
关键词检测
(KeywordSpotting
，
KWS)
是自动语音识别技术的一种重要应用，用于检测语音信号中是否存在某些关键词，从而根据检测到的关键词处理相关业务，如用以唤醒智能设备
、
对用户上传的语音数据进行合规性检测等
。
目前，用于语音关键词检测的装置的计算能力有限，在处理大规模语音数据时，可能无法实现高效的实时处理和较快的响应速递，导致语音关键词检测的效率较低
。

技术实现思路

[0003]本申请实施例提供一种语音数据处理方法
、
装置
、
设备以及可读存储介质，可以提高语音关键词检测的效率
。
[0004]本申请实施例一方面提供了一种语音数据处理方法，包括：
[0005]获取
M
个语音数据片段，以及用于对
M
个语音数据片段进行...

【技术保护点】

【技术特征摘要】
1.
一种语音数据处理方法，其特征在于，包括：获取
M
个语音数据片段，以及用于对所述
M
个语音数据片段进行检测的语音检测参数；
M
为正整数；将所述语音检测参数分配给图像处理器中的线程组，将所述语音检测参数和所述
M
个语音数据片段存储至所述线程组对应的共享内存中；所述线程组包括多个线程；并行调用所述线程组中的多个线程，从所述共享内存中读取所述语音检测参数和所述
M
个语音数据片段；并行调用所述线程组中的多个线程，根据所述语音检测参数，对所述
M
个语音数据片段进行关键词检测，得到关键词检测结果
。2.
根据权利要求1所述的方法，其特征在于，所述并行调用所述线程组中的多个线程，根据所述语音检测参数，对所述
M
个语音数据片段进行关键词检测，得到关键词检测结果，包括：根据所述线程组中的线程数量以及所述
M
个语音数据片段中的片段数量，为所述
M
个语音数据片段分配对应的线程；并行调用所述
M
个语音数据片段分别对应的线程，根据所述语音检测参数，对各自对应的语音数据片段进行卷积处理，得到
M
个片段卷积特征；并行调用所述
M
个语音数据片段分别对应的线程，根据所述
M
个片段卷积特征，对各自对应的
M
个语音数据片段进行关键词检测，得到关键词检测结果
。3.
根据权利要求2所述的方法，其特征在于，所述并行调用所述
M
个语音数据片段分别对应的线程，根据所述语音检测参数，对各自对应的语音数据片段进行卷积处理，得到
M
个片段卷积特征，包括：并行调用所述
M
个语音数据片段分别对应的线程，对各自对应的语音数据片段进行向量转换，得到
M
个语音片段向量；并行调用所述
M
个语音数据片段分别对应的线程，根据所述语音检测参数，对各自对应的语音片段向量进行卷积处理，得到所述
M
个片段卷积特征
。4.
根据权利要求3所述的方法，其特征在于，所述
M
个语音数据片段包括语音数据片段
i
，
i
为小于或者等于
M
的正整数；所述语音数据片段
i
对应的线程，对所述语音数据片段
i
进行向量转换，包括：调用所述语音数据片段
i
对应的线程，对所述语音数据片段
i
进行预处理，得到预处理后的语音数据片段
i
；对所述预处理后的语音数据片段
i
进行傅里叶变换处理，得到片段频域信号；调用梅尔滤波器组，对所述片段频域信号进行转换，得到所述语音数据片段
i
对应的语音片段向量
。5.
根据权利要求3所述的方法，其特征在于，所述语音检测参数包括卷积权重参数和卷积偏移参数，所述
M
个语音数据片段包括语音数据片段
i
，
i
为小于或者等于
M
的正整数；所述语音数据片段
i
对应的线程，对所述语音数据片段
i
的语音片段向量进行卷积处理，包括：调用所述语音数据片段
i
对应的线程，根据所述卷积权重参数，对所述语音数据片段
i
对应的语音片段向量进行卷积处理，得到第
i
个初始卷积特征；
对所述卷积偏移参数，与所述第
i
个初始卷积特征进行求和，得到所述语音数据片段
i
对应的片段卷积特征
。6.
根据权利要求5所述的方法，其特征在于，所述调用所述语音数据片段
i
对应的线程，根据所述卷积权重参数，对所述语音数据片段
i
对应的语音片段向量进行卷积处理，得到第
i
个初始卷积特征，包括：从所述语音数据片段
i
对应的线程中，确定用于处理深度信息的
K
个线程；
K
为小于或者等于
Q
的正整数，
Q
为所述语音数据片段
i
对应的线程的数量；从所述语音数据片段
i
对应的语音片段向量中提取与深度信息关联的
S
个子片段向量；
S
为正整数；从所述
K
个线程中，为所述
S
个子片段向量分别分配线程；调用所述
S
个子片段向量分别对应的线程，根据所述卷积权重参数，对各自对应的子片段向量进行卷积处理，得到所述语音数据片段
i
对应的初始卷积特征
。7.
根据权利要求6所述的方法，其特征在于，所述调用所述
S
个子片段向量分别对应的线程，根据所述卷积权重参数，对各自对应的子片段向量进行卷积处理，得到所述语音数据片段
i
对应的初始卷积特征，包括：调用所述
S
个子片段向量分别对应的线程，根据所述卷积权重参数，对各自对应的子片段向量进行卷积处理，得到所述
S
个子片段向量分别对应的初始卷积特征；将所述
S
个子片段向量分别对应的初始...

【专利技术属性】
技术研发人员：周伟，赵楚涵，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人