一种语音唤醒的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:35483396 阅读:25 留言:0更新日期:2022-11-05 16:35
本发明专利技术公开了一种语音唤醒的方法、装置、存储介质及电子设备,方法包括:获取语音唤醒模型,设定唤醒敏感度及唤醒阈值;获取待判定语音,并通过所获取的语音唤醒模型输出预测概率;指定正态分布概率密度函数,并通过正态分布概率密度函数计算累计概率分布;将输出的预测概率转换为分布点,通过分布点在得到的累计概率分布中取对应值,得到平滑概率;根据平滑概率、唤醒敏感度及唤醒阈值来判断是否唤醒。本发明专利技术避免了语音唤醒模型对某个预测值置信度很低的情况下,由于预测值的快速跳跃而造成的误激活问题,同时为语音唤醒提供了相对线性的阈值调节,从而更加准确对语音唤醒进行响应。应。应。

【技术实现步骤摘要】
一种语音唤醒的方法、装置、存储介质及电子设备


[0001]本专利技术涉及语音处理
,具体涉及一种语音唤醒的方法、装置、存储介质及电子设备。

技术介绍

[0002]语音唤醒技术是指用户通过说出唤醒词来使智能设备从休眠状态进入激活状态,目前该技术已经得到了广泛的应用。传统的语音唤醒方法,主要将语音唤醒模型的输出直接与设定阈值进行比较来判断是否唤醒。
[0003]预测置信度(forecasting confidence)为在对未来的情况做出估计时,采用数理统计中的区间估计法而获得的在误差允许范围以内的预测值的概率。然而,在某个预测置信度很低的情况下,也可能由于预测值的快速跳跃而造成误激活的问题。另外,传统方法不能对语音唤醒进行线性的阈值调节。

技术实现思路

[0004]本专利技术的目的在于提供一种语音唤醒的方法及装置,以解决上述
技术介绍
中提出的语音唤醒中模型预测值由于快速跳跃而造成的误激活以及缺乏线性阈值调节的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种语音唤醒方法,包括:
[0007]S1.获取语音唤醒模型,设定唤醒敏感度及唤醒阈值;
[0008]S2.获取待判定语音,并通过S1所获取的语音唤醒模型输出预测概率;
[0009]S3.指定正态分布概率密度函数,并通过正态分布概率密度函数计算累计概率分布;
[0010]S4.将S2输出的预测概率转换为分布点,通过分布点在S3得到的累计概率分布中取对应值,得到平滑概率;
[0011]S5.根据S4得到的平滑概率以及S1设定的唤醒敏感度及唤醒阈值来判断是否唤醒。
[0012]进一步的技术方案是:所述语音唤醒模型为二分类模型。
[0013]进一步的技术方案是:所述S2具体为:待判定语音的数据流根据设定的数据块大小,按帧获取语音数据,存储并更新到缓存区;且缓存区的更新按照先入先出的原则,将缓存区的语音帧输入到语音唤醒模型得到预测概率。
[0014]进一步的技术方案是:所述S3具体为:
[0015]由指定的均值、方差得到所述正态分布概率密度函数,
[0016]由指定的分布范围、分辨率得到分布点序列,
[0017]再通过正态分布概率密度函数以及分布点序列获得累计概率分布。
[0018]进一步的技术方案是:所述预测概率转换为分布点的方法为:
[0019]将预测概率通过Sigmoid反函数得到标量值,再通过指定的分布范围对标量值进
行归一化,根据指定的分辨率对归一化标量值计算得到分布点。
[0020]进一步的技术方案是:所述S5具体为:
[0021]激活数目初始化为0,对S4得到的平滑概率与S1设定的唤醒敏感度进行比较,若平滑概率大于唤醒敏感度,则激活数目加1;否则,激活数目减1,当激活数目大于唤醒阈值时,则判断为唤醒状态。
[0022]同时,本专利技术还提供如下技术方案:
[0023]一种语音唤醒装置,包括:
[0024]语音数据获取模块,用于接收语音并存储、更新至缓存区;
[0025]模型处理模块,用于对获取的语音输出预测概率;
[0026]正态分布平滑模块,用于将预测概率转换为平滑概率;
[0027]激活判决模块,用于设定唤醒敏感度、唤醒阈值以及判断是否唤醒。
[0028]另外,本专利技术还提供如下技术方案:
[0029]一种计算机可读存储介质,存储有计算机程序,所述计算机程序用于实现如上所述一种语音唤醒方法。
[0030]另外,本专利技术还提供如下技术方案:
[0031]一种电子设备,包括:
[0032]存储装置,用于存储计算机程序;
[0033]处理装置,用于执行所述存储装置中的所述计算机程序,以实现如上所述一种语音唤醒方法的步骤。
[0034]与现有技术相比,本专利技术的有益效果是:
[0035]通过估计语音唤醒模型输出的正态分布,使用平均值和标准差来计算累计概率分布,避免了语音唤醒模型对某个预测值置信度很低的情况下,由于预测值的快速跳跃而造成的误激活问题,同时为语音唤醒提供了相对线性的阈值调节,从而更加准确对语音唤醒进行响应。
附图说明
[0036]图1为本专利技术实施例中语音唤醒方法的流程示意图;
[0037]图2为本专利技术实施例中获取待判定语音的示意图;
[0038]图3为本专利技术实施例中唤醒判决流程示意图;
[0039]图4为本专利技术实施例中一种语音唤醒装置结构框图。
具体实施方式
[0040]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]实施例1
[0042]本专利技术实施例所述一种语音唤醒方法,如图1所示,包括以下步骤:
[0043]S1.获取语音唤醒模型,设定唤醒敏感度及唤醒阈值;
[0044]可选的,所述语音唤醒模型包括但不限于二分类模型;所述唤醒敏感度用于对控制唤醒的灵敏程度;所述唤醒阈值用于判断是否激活;
[0045]S2.获取待判定语音,并通过S1获取的语音唤醒模型输出预测概率;
[0046]如图2所示,所述待判定语音数据流根据人为设定的数据块大小,按帧获取语音数据,同时存储并更新到缓存区,缓存区的更新按照先入先出的原则,将缓存区的语音帧输入到语音唤醒模型得到预测概率;
[0047]S3.指定正态分布概率密度函数,并对正态分布概率密度函数计算累计概率分布;
[0048]可选的,所述正态分布概率密度函数由指定的均值、方差得到,由指定的分布范围、分辨率得到分布点序列,由正态分布密度函数以及分布点序列计算得到累计概率分布;
[0049]举例说明,指定均值为4,方差为6,可得到概率密度函数,指定分布范围为

10~22,分辨率为200,通过分布范围以及分辨率得到分布点序列[

10.00,

9.99,

9.98,...,21.994,22.00],共32
×
200个点,再通过分布点序列、概率密度函数可计算得到累计概率分布;
[0050]S4.将S2的预测概率转换为分布点,在S3得到的累计概率分布中取对应值,得到平滑概率;
[0051]可选的,所述预测概率转换为分布点的方式为:将预测概率通过Sigmoid反函数得到标量值,再通过指定的分布范围对标量值进行归一化,根据指定的分辨率对归一化标量值计算得到分布点,将分布点带入累计概率分布得到平滑概率;
[0052]S5.根据S4得到的平滑概率以及S1设定的唤醒敏感度及唤醒阈值来判断是否唤醒;
[0053]如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,包括:S1.获取语音唤醒模型,设定唤醒敏感度及唤醒阈值;S2.获取待判定语音,并通过S1所获取的语音唤醒模型输出预测概率;S3.指定正态分布概率密度函数,并通过正态分布概率密度函数计算累计概率分布;S4.将S2输出的预测概率转换为分布点,通过分布点在S3得到的累计概率分布中取对应值,得到平滑概率;S5.根据S4得到的平滑概率以及S1设定的唤醒敏感度及唤醒阈值来判断是否唤醒。2.根据权利要求1所述一种语音唤醒方法,其特征在于,所述语音唤醒模型为二分类模型。3.根据权利要求1所述一种语音唤醒方法,其特征在于,所述S2具体为:待判定语音的数据流根据设定的数据块大小,按帧获取语音数据,存储并更新到缓存区;且缓存区的更新按照先入先出的原则,将缓存区的语音帧输入到语音唤醒模型得到预测概率。4.根据权利要求1所述一种语音唤醒方法,其特征在于,所述S3具体为:由指定的均值、方差得到所述正态分布概率密度函数,由指定的分布范围、分辨率得到分布点序列,再通过正态分布概率密度函数以及分布点序列获得累计概率分布。5.根据权利要求4所述一种语音唤醒方法,其特征在于,所述预测概率转换...

【专利技术属性】
技术研发人员:朱海
申请(专利权)人:四川启睿克科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1