【技术实现步骤摘要】
一种语音数据处理方法、装置、设备以及可读存储介质
[0001]本申请涉及计算机
,尤其涉及一种语音数据处理方法
、
装置
、
计算机设备以及可读存储介质
。
技术介绍
[0002]随着人工智能
(Artificial Intelligence
,
AI)
技术的发展,自动语音识别
(Automatic Speech Recognition
,
ASR)
技术的应用越来越广泛
。
关键词检测
(KeywordSpotting
,
KWS)
是自动语音识别技术的一种重要应用,用于检测语音信号中是否存在某些关键词,从而根据检测到的关键词处理相关业务,如用以唤醒智能设备
、
对用户上传的语音数据进行合规性检测等
。
目前,用于语音关键词检测的装置的计算能力有限,在处理大规模语音数据时,可能无法实现高效的实时处理和较快的响应速递,导致语音关键词检测的效率较低
。
技术实现思路
[0003]本申请实施例提供一种语音数据处理方法
、
装置
、
设备以及可读存储介质,可以提高语音关键词检测的效率
。
[0004]本申请实施例一方面提供了一种语音数据处理方法,包括:
[0005]获取
M
个语音数据片段,以及用于对
M
个语音数据片段进行 ...
【技术保护点】
【技术特征摘要】
1.
一种语音数据处理方法,其特征在于,包括:获取
M
个语音数据片段,以及用于对所述
M
个语音数据片段进行检测的语音检测参数;
M
为正整数;将所述语音检测参数分配给图像处理器中的线程组,将所述语音检测参数和所述
M
个语音数据片段存储至所述线程组对应的共享内存中;所述线程组包括多个线程;并行调用所述线程组中的多个线程,从所述共享内存中读取所述语音检测参数和所述
M
个语音数据片段;并行调用所述线程组中的多个线程,根据所述语音检测参数,对所述
M
个语音数据片段进行关键词检测,得到关键词检测结果
。2.
根据权利要求1所述的方法,其特征在于,所述并行调用所述线程组中的多个线程,根据所述语音检测参数,对所述
M
个语音数据片段进行关键词检测,得到关键词检测结果,包括:根据所述线程组中的线程数量以及所述
M
个语音数据片段中的片段数量,为所述
M
个语音数据片段分配对应的线程;并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音数据片段进行卷积处理,得到
M
个片段卷积特征;并行调用所述
M
个语音数据片段分别对应的线程,根据所述
M
个片段卷积特征,对各自对应的
M
个语音数据片段进行关键词检测,得到关键词检测结果
。3.
根据权利要求2所述的方法,其特征在于,所述并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音数据片段进行卷积处理,得到
M
个片段卷积特征,包括:并行调用所述
M
个语音数据片段分别对应的线程,对各自对应的语音数据片段进行向量转换,得到
M
个语音片段向量;并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音片段向量进行卷积处理,得到所述
M
个片段卷积特征
。4.
根据权利要求3所述的方法,其特征在于,所述
M
个语音数据片段包括语音数据片段
i
,
i
为小于或者等于
M
的正整数;所述语音数据片段
i
对应的线程,对所述语音数据片段
i
进行向量转换,包括:调用所述语音数据片段
i
对应的线程,对所述语音数据片段
i
进行预处理,得到预处理后的语音数据片段
i
;对所述预处理后的语音数据片段
i
进行傅里叶变换处理,得到片段频域信号;调用梅尔滤波器组,对所述片段频域信号进行转换,得到所述语音数据片段
i
对应的语音片段向量
。5.
根据权利要求3所述的方法,其特征在于,所述语音检测参数包括卷积权重参数和卷积偏移参数,所述
M
个语音数据片段包括语音数据片段
i
,
i
为小于或者等于
M
的正整数;所述语音数据片段
i
对应的线程,对所述语音数据片段
i
的语音片段向量进行卷积处理,包括:调用所述语音数据片段
i
对应的线程,根据所述卷积权重参数,对所述语音数据片段
i
对应的语音片段向量进行卷积处理,得到第
i
个初始卷积特征;
对所述卷积偏移参数,与所述第
i
个初始卷积特征进行求和,得到所述语音数据片段
i
对应的片段卷积特征
。6.
根据权利要求5所述的方法,其特征在于,所述调用所述语音数据片段
i
对应的线程,根据所述卷积权重参数,对所述语音数据片段
i
对应的语音片段向量进行卷积处理,得到第
i
个初始卷积特征,包括:从所述语音数据片段
i
对应的线程中,确定用于处理深度信息的
K
个线程;
K
为小于或者等于
Q
的正整数,
Q
为所述语音数据片段
i
对应的线程的数量;从所述语音数据片段
i
对应的语音片段向量中提取与深度信息关联的
S
个子片段向量;
S
为正整数;从所述
K
个线程中,为所述
S
个子片段向量分别分配线程;调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述语音数据片段
i
对应的初始卷积特征
。7.
根据权利要求6所述的方法,其特征在于,所述调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述语音数据片段
i
对应的初始卷积特征,包括:调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述
S
个子片段向量分别对应的初始卷积特征;将所述
S
个子片段向量分别对应的初始...
【专利技术属性】
技术研发人员:周伟,赵楚涵,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。