一种语音数据处理方法技术

技术编号:39755969 阅读:12 留言:0更新日期:2023-12-17 23:55
本申请实施例提供了一种语音数据处理方法

【技术实现步骤摘要】
一种语音数据处理方法、装置、设备以及可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种语音数据处理方法

装置

计算机设备以及可读存储介质


技术介绍

[0002]随着人工智能
(Artificial Intelligence

AI)
技术的发展,自动语音识别
(Automatic Speech Recognition

ASR)
技术的应用越来越广泛

关键词检测
(KeywordSpotting

KWS)
是自动语音识别技术的一种重要应用,用于检测语音信号中是否存在某些关键词,从而根据检测到的关键词处理相关业务,如用以唤醒智能设备

对用户上传的语音数据进行合规性检测等

目前,用于语音关键词检测的装置的计算能力有限,在处理大规模语音数据时,可能无法实现高效的实时处理和较快的响应速递,导致语音关键词检测的效率较低


技术实现思路

[0003]本申请实施例提供一种语音数据处理方法

装置

设备以及可读存储介质,可以提高语音关键词检测的效率

[0004]本申请实施例一方面提供了一种语音数据处理方法,包括:
[0005]获取
M
个语音数据片段,以及用于对
M
个语音数据片段进行检测的语音检测参数;
M
为正整数;
[0006]将语音检测参数分配给图像处理器中的线程组,将语音检测参数和
M
个语音数据片段存储至线程组对应的共享内存中;线程组包括多个线程;
[0007]并行调用线程组中的多个线程,从共享内存中读取语音检测参数和
M
个语音数据片段;
[0008]并行调用线程组中的多个线程,根据语音检测参数,对
M
个语音数据片段进行关键词检测,得到关键词检测结果

[0009]本申请实施例一方面提供了一种语音数据处理装置,包括:
[0010]获取模块,用于获取
M
个语音数据片段,以及用于对
M
个语音数据片段进行检测的语音检测参数;
M
为正整数;
[0011]存储模块,用于将语音检测参数分配给图像处理器中的线程组,将语音检测参数和
M
个语音数据片段存储至线程组对应的共享内存中;线程组包括多个线程;
[0012]读取模块,用于并行调用线程组中的多个线程,从共享内存中读取语音检测参数和
M
个语音数据片段;
[0013]检测模块,用于并行调用线程组中的多个线程,根据语音检测参数,对
M
个语音数据片段进行关键词检测,得到关键词检测结果

[0014]本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
[0015]处理器与存储器相连,其中,存储器用于存储计算机程序,计算机程序被处理器执
行时,使得该计算机设备执行本申请实施例提供的方法

[0016]本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法

[0017]本申请实施例一方面提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中

计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本申请实施例提供的方法

[0018]在本申请实施例中,为图像处理器中的线程组分配独立的共享内存,以存储线程组对应的语音检测参数,在关键词检测过程中,只需要线程组中的线程对其对应的共享内存进行访问,以读取语音检测参数,而不需要从全局内存
(
全局内容是指所有线程均可以访问的内存区域,一般用于存储线程需要访问的数据
)
中读取数据,可以减少对全局内存的访问次数,进而降低全局内存的访问负担;同时,还可以提高数据读取的效率,进而提高关键词检测的效率

在读取到语音检测参数后,通过并行调用线程组中的多个线程,根据语音检测参数对
M
个语音数据片段进行关键词检测,即通过线程组中的多个线程,并行根据语音检测参数对
M
个语音片段进行关键词检测,能够实现高效的实时处理以及较快的响应速度,提高关键词检测的效率

附图说明
[0019]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0020]图1是本申请实施例提供的一种语音数据处理系统的结构示意图;
[0021]图2是本申请实施例提供的一种语音关键词检测的场景示意图;
[0022]图3是本申请实施例提供的一种语音数据处理方法的流程示意图;
[0023]图4是本申请实施例提供的一种共享内存的示意图;
[0024]图5是本申请实施例提供的一种对语音数据片段
i
对应的语音片段向量进行卷积处理的示意图;
[0025]图6是本申请实施例提供的一种对语音片段向量进行卷积处理的示意图;
[0026]图7是本申请实施例提供的一种语音数据处理方法的流程示意图;
[0027]图8是本申请实施例提供的一种游戏语音检测场景的示意图;
[0028]图9是本申请实施例提供的一种游戏语音检测场景的示意图;
[0029]图
10
是本申请实施例提供的一种语音数据处理装置的结构示意图;
[0030]图
11
是本申请实施例提供的一种计算机设备的结构示意图

具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例

基于
本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围

[0032]本申请涉及人工智能
,本申请具体可以通过语音检测模型中的语音检测参数
(
如卷积权重参数和卷积偏移参数等
)
,对语音数据片段进行关键词检测,得到关键词检测结果,可以提高关键词检测的效本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种语音数据处理方法,其特征在于,包括:获取
M
个语音数据片段,以及用于对所述
M
个语音数据片段进行检测的语音检测参数;
M
为正整数;将所述语音检测参数分配给图像处理器中的线程组,将所述语音检测参数和所述
M
个语音数据片段存储至所述线程组对应的共享内存中;所述线程组包括多个线程;并行调用所述线程组中的多个线程,从所述共享内存中读取所述语音检测参数和所述
M
个语音数据片段;并行调用所述线程组中的多个线程,根据所述语音检测参数,对所述
M
个语音数据片段进行关键词检测,得到关键词检测结果
。2.
根据权利要求1所述的方法,其特征在于,所述并行调用所述线程组中的多个线程,根据所述语音检测参数,对所述
M
个语音数据片段进行关键词检测,得到关键词检测结果,包括:根据所述线程组中的线程数量以及所述
M
个语音数据片段中的片段数量,为所述
M
个语音数据片段分配对应的线程;并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音数据片段进行卷积处理,得到
M
个片段卷积特征;并行调用所述
M
个语音数据片段分别对应的线程,根据所述
M
个片段卷积特征,对各自对应的
M
个语音数据片段进行关键词检测,得到关键词检测结果
。3.
根据权利要求2所述的方法,其特征在于,所述并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音数据片段进行卷积处理,得到
M
个片段卷积特征,包括:并行调用所述
M
个语音数据片段分别对应的线程,对各自对应的语音数据片段进行向量转换,得到
M
个语音片段向量;并行调用所述
M
个语音数据片段分别对应的线程,根据所述语音检测参数,对各自对应的语音片段向量进行卷积处理,得到所述
M
个片段卷积特征
。4.
根据权利要求3所述的方法,其特征在于,所述
M
个语音数据片段包括语音数据片段
i

i
为小于或者等于
M
的正整数;所述语音数据片段
i
对应的线程,对所述语音数据片段
i
进行向量转换,包括:调用所述语音数据片段
i
对应的线程,对所述语音数据片段
i
进行预处理,得到预处理后的语音数据片段
i
;对所述预处理后的语音数据片段
i
进行傅里叶变换处理,得到片段频域信号;调用梅尔滤波器组,对所述片段频域信号进行转换,得到所述语音数据片段
i
对应的语音片段向量
。5.
根据权利要求3所述的方法,其特征在于,所述语音检测参数包括卷积权重参数和卷积偏移参数,所述
M
个语音数据片段包括语音数据片段
i

i
为小于或者等于
M
的正整数;所述语音数据片段
i
对应的线程,对所述语音数据片段
i
的语音片段向量进行卷积处理,包括:调用所述语音数据片段
i
对应的线程,根据所述卷积权重参数,对所述语音数据片段
i
对应的语音片段向量进行卷积处理,得到第
i
个初始卷积特征;
对所述卷积偏移参数,与所述第
i
个初始卷积特征进行求和,得到所述语音数据片段
i
对应的片段卷积特征
。6.
根据权利要求5所述的方法,其特征在于,所述调用所述语音数据片段
i
对应的线程,根据所述卷积权重参数,对所述语音数据片段
i
对应的语音片段向量进行卷积处理,得到第
i
个初始卷积特征,包括:从所述语音数据片段
i
对应的线程中,确定用于处理深度信息的
K
个线程;
K
为小于或者等于
Q
的正整数,
Q
为所述语音数据片段
i
对应的线程的数量;从所述语音数据片段
i
对应的语音片段向量中提取与深度信息关联的
S
个子片段向量;
S
为正整数;从所述
K
个线程中,为所述
S
个子片段向量分别分配线程;调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述语音数据片段
i
对应的初始卷积特征
。7.
根据权利要求6所述的方法,其特征在于,所述调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述语音数据片段
i
对应的初始卷积特征,包括:调用所述
S
个子片段向量分别对应的线程,根据所述卷积权重参数,对各自对应的子片段向量进行卷积处理,得到所述
S
个子片段向量分别对应的初始卷积特征;将所述
S
个子片段向量分别对应的初始...

【专利技术属性】
技术研发人员:周伟赵楚涵
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1