基于特征的话语码本选择制造技术

技术编号：21841318 阅读：46 留言：0更新日期：2019-08-10 21:39

一种设备包含话语处理引擎，所述话语处理引擎经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是与参考特征相差至少阈值量。所述设备进一步包含响应于所述话语处理引擎的选择电路。所述选择电路经配置以基于所述第一特征与所述参考特征相差至少阈值量从多个话语码本之中选择特定话语码本。所述特定话语码本与所述第一特征相关联。此第一特征是基于所述用户的情绪、所述用户的环境和所述用户的估计的年龄或距离麦克风的所述用户的估计的距离的。

Feature-based Codebook Selection

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于特征的话语码本选择优先权的主张本申请主张2017年1月12日递交的标题为“基于特征的话语码本选择(CHARACTERISTIC-BASEDSPEECHCODEBOOKSELECTION)”的第15/405,159号共同拥有的美国非临时专利申请的优先权，前述申请的内容明确地以全文引用的方式并入本文中。
本专利技术大体上涉及电子装置，且更确切地说，涉及通过电子装置的音频信号的处理。
技术介绍
电子装置(例如，移动装置或服务器)可基于用户的话语接收数据。举例来说，数据可包含话语的样本。电子装置可使用数据结合一或多个基于话语的操作。为了说明，电子装置可基于数据识别话语内的命令，例如，“导航回家”。作为另一实例，电子装置可识别用户的身份，例如，通过匹配数据的频谱和与用户相关联的信息。在一些情况下，基于话语的操作可能引发时延和过量的功率消耗。举例来说，背景噪声可能抑制电子装置识别命令，当电子装置重新尝试识别命令时引起时延和过量的功率消耗。在一些情况下，用户可能被提示再次说出命令或使用图形用户接口输入命令。
技术实现思路
在说明性实例中，设备包含经配置以接收对应于话语的数据的话语处理引擎。话语处理引擎进一步经配置以确定与话语相关联的第一特征是否与参考特征相差至少阈值量。设备进一步包含响应于话语处理引擎的选择电路。选择电路经配置以基于第一特征与参考特征相差至少阈值量从多个话语码本之中选择特定话语码本。特定话语码本与第一特征相关联。在另一说明性实例中，选择话语码本的方法包含接收对应于话语的数据。方法进一步包含基于与话语相关联的第一特征与参考特征相差至少阈值量从多个话语码本之...

【技术保护点】
1.一种设备，其包括：话语处理引擎，其经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是否与参考特征相差至少阈值量；以及选择电路，其响应于所述话语处理引擎并且经配置以基于所述第一特征与所述参考特征相差至少所述阈值量从多个话语码本之中选择特定话语码本，所述特定话语码本与所述第一特征相关联。

【技术特征摘要】
【国外来华专利技术】2017.01.12 US 15/405,1591.一种设备，其包括：话语处理引擎，其经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是否与参考特征相差至少阈值量；以及选择电路，其响应于所述话语处理引擎并且经配置以基于所述第一特征与所述参考特征相差至少所述阈值量从多个话语码本之中选择特定话语码本，所述特定话语码本与所述第一特征相关联。2.根据权利要求1所述的设备，其进一步包括耦合到所述选择电路的存储器，所述存储器经配置以存储所述多个话语码本。3.根据权利要求1所述的设备，其进一步包括话语译码器/解码器(编解码器)，所述话语译码器/解码器经配置以使用所述特定话语码本对所述数据进行编码，以使用所述特定话语码本对所述数据进行解码，或这两者。4.根据权利要求1所述的设备，其中所述话语处理引擎进一步经配置以使用深度神经网络DNN模型识别所述第一特征。5.根据权利要求1所述的设备，其中所述第一特征是基于产生所述话语的用户的情绪、所述用户的环境、所述用户的估计的年龄，或距离麦克风的所述用户的估计的距离的。6.根据权利要求5所述的设备，其中所述环境对应于建筑物的类型、建筑物的特定房间或车辆中的一或多个。7.根据权利要求1所述的设备，其中所述多个话语码本包含远场话语码本、近场话语码本、基于情绪的话语码本或普通话语码本中的至少一个。8.根据权利要求1所述的设备，其进一步包括：天线；以及收发器，其耦合到所述天线并且经配置以接收基于所述数据的经编码音频信号，以发射所述经编码音频信号，或这两者。9.根据权利要求8所述的设备，其中话语处理引擎、所述选择电路、所述收发器和所述天线被集成到移动装置或基站中。10.一种在装置处选择话语码本的方法，所述方法包括：在装置处接收数据，所述数据对应于话语；以及基于与所述话语相关联的第一特征与参考特征相差至少阈值量，通过所述装置从多个话语码本之中选择特定话语码本，所述特定话语码本与所述第一特征相关联。11.根据权利要求10所述的方法，其中所述第一特征是基于产生所述话语的用户的情绪的。12.根据权利要求10所述的方法，其中所述第一特征是基于产生所述话语的用户的环境的，所述环境对应于建筑物的类型、建筑物的特定房间或车辆中的一或多个。13.根据权利要求10所述的方法，其中所述第一特征是基于产生所述话语的用户的估计的年龄的。14.根据权利要求10所述的方法，其中所述第一特征是基于距离麦克风的用户的估计的距离的。15.根据权利要求10所述的方法，其进一步包括使用深度神经网络DNN模型识别所述第一特征。16.根据权利要求10所述的方法，...

【专利技术属性】
技术研发人员：郭寅一，E·维瑟，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人