语音唤醒方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：35096087 阅读：49 留言：0更新日期：2022-10-01 16:59

本申请公开了一种语音唤醒方法、装置、设备、存储介质及程序产品，涉及语音识别领域。该方法包括：获取语音数据，语音数据是用于进行语音唤醒的信号；对语音数据进行特征提取，得到语音特征表示；将语音特征表示与多个目标唤醒词进行匹配度预测，得到多个识别结果，其中，每个目标唤醒词对应一个识别结果，识别结果用于指示语音特征表示与目标唤醒词之间的匹配程度；对多个识别结果进行综合选择，得到唤醒词识别结果，并确定语音唤醒结果。通过以上方式，在共用特征提取部分的基础上，以多个目标唤醒词对语音数据进行单独分析，有效减少了系统的资源占比。本申请可应用于云技术、人工智能、智慧交通等各种场景。智慧交通等各种场景。智慧交通等各种场景。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法、装置、设备、存储介质及程序产品

[0001]本申请实施例涉及语音识别领域，特别涉及一种语音唤醒方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]随着智能设备以及语音交互的不断普及，在越来越多的场景中需要通过唤醒词对智能设备进行唤醒，然后通过语音控制智能设备执行命令，如：打开空调等。
[0003]相关技术中，通常对每一个唤醒词单独训练一个唤醒词模型，在对目标语句进行唤醒词识别过程时，将目标语句分别输入不同唤醒词模型，基于不同唤醒词模型对应的置信度得分，确定目标语句的唤醒情况。
[0004]然而，若对每一个唤醒词单独训练一个唤醒词模型，会使得设备占用资源较大，在相同的资源占用情况下，每个唤醒词模型可用的资源量大幅减少，必然会导致设备的唤醒分析性能下降。

技术实现思路

[0005]本申请实施例提供了一种语音唤醒方法、装置、设备、存储介质及程序产品，能够减少对系统的资源占比，提升唤醒词识别模型的唤醒性能。所述技术方案如下。
[0006]一方面，提供了一种语音唤醒方法，所述方法包括：
[0007]获取语音数据，所述语音数据是用于进行语音唤醒的信号；
[0008]对所述语音数据进行特征提取，得到所述语音数据对应的语音特征表示；
[0009]将所述语音特征表示与多个目标唤醒词进行匹配度预测，得到多个识别结果，其中，每个目标唤醒词对应一个识别结果，所述识别结果用于指示所述语音特征表示与所述目标唤醒词之间的匹配程度；
[0010]对所述多...

【技术保护点】

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，所述方法包括：获取语音数据，所述语音数据是用于进行语音唤醒的信号；对所述语音数据进行特征提取，得到所述语音数据对应的语音特征表示；将所述语音特征表示与多个目标唤醒词进行匹配度预测，得到多个识别结果，其中，每个目标唤醒词对应一个识别结果，所述识别结果用于指示所述语音特征表示与所述目标唤醒词之间的匹配程度；对所述多个识别结果进行综合选择，得到所述语音数据对应的唤醒词识别结果，所述唤醒词识别结果用于确定语音唤醒结果。2.根据权利要求1所述的方法，其特征在于，应用于唤醒词识别模型，所述唤醒词识别模型中包括多个唤醒词识别单元，其中，不同的唤醒词识别单元对应不同的目标唤醒词；所述将所述语音特征表示与多个目标唤醒词进行匹配度预测，得到多个识别结果，包括：将所述语音特征表示输入所述多个唤醒词识别单元，通过所述多个唤醒词识别单元分别对所述语音特征表示进行唤醒词识别，输出所述多个识别结果，其中，每个唤醒词识别单元输出一个识别结果，所述识别结果用于指示所述语音特征表示与唤醒词识别单元对应的目标唤醒词之间的匹配程度。3.根据权利要求2所述的方法，其特征在于，所述唤醒词识别模型中还包括多个后验单元，每个后验单元对应一个唤醒词识别单元；所述将所述语音特征表示输入所述多个唤醒词识别单元，通过所述多个唤醒词识别单元分别对所述语音特征表示进行唤醒词识别，输出多个识别结果，包括：将所述语音特征表示输入所述多个唤醒词识别单元，输出多个音节识别结果，其中，每个唤醒词识别单元输出一个与所述目标唤醒词对应的音节识别结果；将所述唤醒词识别单元输出的音节识别结果输入与所述唤醒词识别单元对应的后验单元，输出得到所述唤醒词识别单元的目标唤醒词对应的置信度作为所述识别结果。4.根据权利要求3所述的方法，其特征在于，所述唤醒词识别单元中包括与所述目标唤醒词对应的音节子单元；所述将所述语音特征表示输入所述多个唤醒词识别单元，输出多个音节识别结果，包括：将所述语音特征表示输入所述多个唤醒词识别单元；通过所述唤醒词识别单元中的音节子单元对所述语音特征表示进行识别，得到与所述音节子单元对应的音节得分作为所述音节识别结果。5.根据权利要求4所述的方法，其特征在于，所述将所述唤醒词识别单元输出的音节识别结果输入与所述唤醒词识别单元对应的后验单元，输出得到所述唤醒词识别单元的目标唤醒词对应的置信度作为所述识别结果，包括：将所述唤醒词识别单元输出的音节识别结果输入与所述唤醒词识别单元对应的后验单元；通过所述后验单元对所述音节子单元对应的音节得分进行后验处理，得到所述唤醒词识别单元的目标唤醒词对应的置信度作为所述识别结果。6.根据权利要求5所述的方法，其特征在于，所述多个唤醒词识别单元中包括第一唤醒
词识别单元以及第二唤醒词识别单元；所述方法还包括：响应于所述第一唤醒词识别单元中的第一音节子单元，与所述第二唤醒词识别单元中的第二音节子单元相同，将所述第一音节子单元对应的音节得分作为所述第二音节子单元对应的音节得分。7.根据权利要求5所述的方法，其特征在于，所述音节子单元中包括重音节子单元和轻音节子单元；所述通过所述后验单元对所述音节子单元对应的音节得分进行后验处理，得到所述唤醒词识别单元的目标唤醒词对应...

【专利技术属性】
技术研发人员：陈杰，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人