System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种语音唤醒词泛化的方法及装置制造方法及图纸_技高网

一种语音唤醒词泛化的方法及装置制造方法及图纸

技术编号:43769844 阅读:10 留言:0更新日期:2024-12-24 16:10
本发明专利技术涉及语音识别技术领域,更具体地说,本发明专利技术提供了一种语音唤醒词泛化的方法及装置,通过实现语音唤醒词的泛化,显著提升了用户体验和系统的智能化水平,使用户能够以更加灵活多样的方式与设备进行交互,从而大大增强了使用的便捷性。同时,系统通过监测用户的使用习惯,并据此动态调整各泛化唤醒词的灵敏度,有效优化了系统资源的利用,提高了响应速度并显著减少了误唤醒的情况。此外,本发明专利技术还赋予了系统强大的自适应能力,使其能够不断学习和调整,根据用户的使用习惯和环境变化自动更新和优化泛化唤醒词及其灵敏度,从而长期保持与用户需求的同步,提供更加个性化和精准的服务。

【技术实现步骤摘要】

本专利技术涉及语音识别,更具体地说,是一种语音唤醒词泛化的方法及装置


技术介绍

1、语音唤醒(voice wake-up)是一种基于语音识别技术的功能,它允许用户通过发出特定的语音指令(通常是一个词或短语)来激活设备,启动其语音助手或进行其他操作。这种技术极大地提升了人机交互的便捷性,使用户无需手动触摸设备即可与其进行交互。

2、语音唤醒系统主要包括声学模型和语言模型两部分,声学模型:负责将输入的语音信号转换为语音特征。它的主要目标是将连续的声音信号转换为离散的符号序列,从而便于计算机处理。声学模型的作用是从原始语音信号中提取有用特征并将其映射到音素或字母上;语言模型:根据声学模型提取的语音特征判断是否出现了预先设定的唤醒词,唤醒词检测通常是通过一个轻量级的神经网络实现的,该网络可以实时识别声音中的特定模式,从而判断用户是否说出了唤醒词。

3、市面上的语音系统,默认带有唤醒词,可开放自定义功能让用户修改唤醒词,如“小爱同学”改为“小白”,满足用户个性化需求。自定义唤醒词技术已广泛运用在智能座舱、智能家居、智能展厅等场景。当前的功能逻辑是输入一个固定的唤醒词。但是,不同地域不同用户唤醒习惯差异较大,固定的词难以应对多样性需求,导致唤醒不便。例如:智能座舱的使用场景中,用户将唤醒词自定义为“小白”,乘客a说“嗨小白”,唤醒失败。乘客b说“小白小白”,唤醒失败。乘客c说“你好小白”,唤醒失败。乘客d说“小白你好”,唤醒失败。乘客e说“召唤小白”,唤醒失败。

4、所以,如何在唤醒词自定义后,根据用户地区自动进行唤醒词泛化,覆盖典型句式,以提升唤醒交互命中率,是当前语音唤醒技术急需解决的问题。


技术实现思路

1、本专利技术的目的在于提供一种语音唤醒词泛化的方法及装置,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种语音唤醒词泛化的方法,所述方法包括以下步骤:

4、s1、启动输入界面,输入自定义唤醒词,确认输入后触发唤醒词泛化功能;

5、s2、获取用户当前位置信息,根据用户当前位置信息,查找并选择系统中对应的剔除模板库,将剔除模板库中的模板辅助词与自定义唤醒词匹配,剔除掉自定义唤醒词中的模板辅助词,得到一个关键词;

6、s3、根据用户当前位置信息,在系统中查找匹配的泛化模型,通过所述泛化模型为所述关键词添加辅助词,生成多个泛化唤醒词;

7、s4、根据多个泛化唤醒词生成配置文件,所述配置文件包括每个泛化唤醒词对应的唤醒音频文件和关联的灵敏度,并由服务端下发至客户端,由客户端存储和调用;

8、s5、用户说出唤醒指令后,检查唤醒指令,确认唤醒指令是否匹配成功,并记录用户习惯,根据用户习惯调整各所述泛化唤醒词的灵敏度;

9、调整各所述泛化唤醒词的灵敏度,具体为对用户习惯进行监测,监测用户使用每个泛化唤醒词的频率,并且根据所述频率调整每个泛化唤醒词的灵敏度值;

10、调整每个泛化唤醒词的灵敏度值包括以下步骤:

11、f1、设置单位时间,记录单位时间内每个泛化唤醒词的使用频率;

12、f2、本次单位时间内设备初次启动后,根据上一单位时间的每个泛化唤醒词的使用频率对应调整本次单位时间内泛化唤醒词的灵敏度值。

13、本申请再进一步的技术方案:上一单位时间内,使用频率大于95%的任意泛化唤醒词的灵敏度值增加2;上一单位时间内,使用频率小于0.5%的任意泛化唤醒词的灵敏度值减少2;删除上一单位时间内,使用频率为0的任意泛化唤醒词。

14、本申请再进一步的技术方案:上一单位时间内,若设备的唤醒次数小于50次,则本次单位时间内不进行泛化唤醒词的灵敏度值调整。

15、本申请再进一步的技术方案:任一唤醒词灵敏度值上限设置为90,到达最大值则不再增加;任一唤醒词灵敏度值下限设置为50,到达最小值则不再减少。

16、本申请再进一步的技术方案:所述步骤s5中检查唤醒指令包括以下步骤:

17、s51、检查当前唤醒指令中用户发出的唤醒词部分是否完整,若不完整,则根据历史时间内记录的用户习惯和当前唤醒指令的上下文信息,自动添补空缺的唤醒词,并得到补充后唤醒词,同时将所述补充后唤醒词记录为泛化唤醒词;

18、s52、将所述补充后唤醒词与所述配置文件匹配,若匹配成功,则将所述补充后唤醒词与当前唤醒指令的上下文信息组合,执行唤醒操作;

19、s53、若匹配失败,则记录当次失败情况,并将当次所述补充后唤醒词记录删除。

20、本申请还提供一种语音唤醒词泛化的装置,包括:

21、输入模块,用于接收用户输入的自定义唤醒词;

22、泛化模块,用于将一个唤醒词泛化为多个泛化唤醒词;

23、生成模块,用于根据多个泛化唤醒词生成配置文件;

24、存储模块,用于存储所述配置文件,在后续的语音交互中使用;

25、唤醒模块,用于识别用户的唤醒指令并检查所述唤醒指令;

26、调整模块,用于根据用户习惯,调整各泛化唤醒词的灵敏度。

27、本申请再进一步的技术方案:所述自定义唤醒词为文本输入或语音识别输入。

28、本申请再进一步的技术方案:所述泛化模块包括信息获取子模块、定位子模块、剔除子模块和匹配子模块;

29、信息获取子模块用于接收用户输入的自定义唤醒词;

30、定位子模块用于获取用户当前位置信息;

31、剔除子模块用于根据用户当前位置信息,查找并选择系统中对应的剔除模板库,将剔除模板库中的模板辅助词与自定义唤醒词匹配,剔除掉自定义唤醒词中的模板辅助词,得到一个关键词;

32、匹配子模块用于根据用户当前位置信息,在系统中查找匹配的泛化模型,通过所述泛化模型为所述关键词添加辅助词,生成多个泛化唤醒词;

33、所述调整模块包括用户习惯监测子模块和灵敏度值调整子模块,

34、用户习惯监测子模块用于监测用户习惯,记录单位时间内每个泛化唤醒词的使用频率;

35、灵敏度值调整子模块用于根据泛化唤醒词的使用频率,生成新的灵敏度值,自动替换当前的灵敏度值。

36、采用本专利技术提供的技术方案,与现有技术相比,具有如下有益效果:

37、本专利技术通过实现语音唤醒词的泛化,显著提升了用户体验和系统的智能化水平,使用户能够以更加灵活多样的方式与设备进行交互,从而大大增强了使用的便捷性。同时,系统通过监测用户的使用习惯,并据此动态调整各泛化唤醒词的灵敏度,有效优化了系统资源的利用,提高了响应速度并显著减少了误唤醒的情况。此外,本专利技术还赋予了系统强大的自适应能力,使其能够不断学习和调整,根据用户的使用习惯和环境变化自动更新和优化泛化唤醒词及其灵敏度,从而长期保持与用户需求的同步,提供更加个性化和精准的服务。

本文档来自技高网...

【技术保护点】

1.一种语音唤醒词泛化的方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种语音唤醒词泛化的方法,其特征在于,上一单位时间内,使用频率大于95%的任意泛化唤醒词的灵敏度值增加2;上一单位时间内,使用频率小于0.5%的任意泛化唤醒词的灵敏度值减少2;删除上一单位时间内,使用频率为0的任意泛化唤醒词。

3.根据权利要求1所述的一种语音唤醒词泛化的方法,其特征在于,上一单位时间内,若设备的唤醒次数小于50次,则本次单位时间内不进行泛化唤醒词的灵敏度值调整。

4.根据权利要求2所述的一种语音唤醒词泛化的方法,其特征在于,任一唤醒词灵敏度值上限设置为90,到达最大值则不再增加;任一唤醒词灵敏度值下限设置为50,到达最小值则不再减少。

5.根据权利要求1所述的一种语音唤醒词泛化的方法,其特征在于,所述步骤S5中检查唤醒指令包括以下步骤:

6.一种语音唤醒词泛化的装置,其特征在于,包括:

7.根据权利要求6所述的一种语音唤醒词泛化的装置,其特征在于,所述自定义唤醒词为文本输入或语音识别输入。

8.根据权利要求6所述的一种语音唤醒词泛化的装置,其特征在于,所述泛化模块包括信息获取子模块、定位子模块、剔除子模块和匹配子模块;

...

【技术特征摘要】

1.一种语音唤醒词泛化的方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种语音唤醒词泛化的方法,其特征在于,上一单位时间内,使用频率大于95%的任意泛化唤醒词的灵敏度值增加2;上一单位时间内,使用频率小于0.5%的任意泛化唤醒词的灵敏度值减少2;删除上一单位时间内,使用频率为0的任意泛化唤醒词。

3.根据权利要求1所述的一种语音唤醒词泛化的方法,其特征在于,上一单位时间内,若设备的唤醒次数小于50次,则本次单位时间内不进行泛化唤醒词的灵敏度值调整。

4.根据权利要求2所述的一种语音唤醒词泛化的方法,其...

【专利技术属性】
技术研发人员:罗慧娜
申请(专利权)人:润芯微科技江苏有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1