用于改进型关键短语检测的中间评分和拒绝环回制造技术

技术编号：19397502 阅读：19 留言：0更新日期：2018-11-10 05:13

讨论涉及用于应用(例如，话音唤醒)的关键短语检测的技术。这些技术可以包括关键短语模型的一个或多个状态的中间评分和/或从关键短语模型的状态到拒绝模型的后向转移或拒绝环回，以基于接收到的表述来减少错误接受。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于改进型关键短语检测的中间评分和拒绝环回优先权要求该申请要求题为“INTERMEDIATESCORINGANDREJECTIONLOOPBACKFORIMPROVEDKEYPHRASEDETECTION”的2016年3月1日提交的美国专利申请序列号No.15/057,695的优先权，并且其通过完整引用得以合并。
技术介绍
关键短语或热点词语检测系统可以用于检测可以通过设备发起活动的词语或短语等。例如，设备可以基于检测到特定词语或短语来唤醒(例如，从低功率或休眠模式转移到有效模式)。这些话音唤醒或关键短语检测系统可能关注于通过有限的存储器和算力来检测所指定的短语以唤醒设备。这些系统的目标可以是使得两种可能的错误类型——错误拒绝(例如，错误地拒绝正确的短语)以及错误接受(例如，错误地接受错的短语)——最小化。具体地说，当所表述的短语的一部分匹配或在语音上相似于关键短语而所表述的短语的另一部分并不匹配或在语音上不相似时，这些错误接受可能更有可能产生。故此，尤其是当已经表述关键短语的一部分时，现有技术可能提供相对高的假阳性率。随着对于实现关键短语检测系统(例如，话音唤醒系统)的期望变得更广泛，这些问题可能变得严重。附图说明在附图中通过示例的方式而非通过限制的方式示出在此所描述的材料。为了说明的简明性和清楚性，附图所示的要素不一定按比例绘制。例如，为了清楚，一些要素的尺寸可以相对于其它要素夸大。此外，在考虑得适当的情况下，标号已经在附图之间重复，以指示对应或类似要素。在附图中：图1是用于提供关键短语检测的示例设置的说明性示图；图2是用于提供关键短语检测的示例系统的说明性...

【技术保护点】
1.一种计算机实现的用于关键短语检测的方法，包括：在当前时间实例，基于表示接收到的音频输入的子语音单元的得分来更新具有单个状态的基于起始状态的拒绝模型以及具有多个状态并且与预定关键短语关联的关键短语模型，其中，所述更新包括：提供从所述关键短语模型的所述多个状态中的特定状态到所述关键短语模型的所述多个状态中的下一状态并且到所述拒绝模型的所述单个状态的得分的转移；以及生成与所述基于起始状态的拒绝模型的所述单个状态对应的拒绝似然率得分以及与所述关键短语模型对应的关键短语似然率得分；以及基于所述拒绝似然率得分和所述关键短语似然率得分来确定接收到的音频输入是否与所述预定关键短语关联。

【技术特征摘要】
【国外来华专利技术】2016.03.01 US 15/057,6951.一种计算机实现的用于关键短语检测的方法，包括：在当前时间实例，基于表示接收到的音频输入的子语音单元的得分来更新具有单个状态的基于起始状态的拒绝模型以及具有多个状态并且与预定关键短语关联的关键短语模型，其中，所述更新包括：提供从所述关键短语模型的所述多个状态中的特定状态到所述关键短语模型的所述多个状态中的下一状态并且到所述拒绝模型的所述单个状态的得分的转移；以及生成与所述基于起始状态的拒绝模型的所述单个状态对应的拒绝似然率得分以及与所述关键短语模型对应的关键短语似然率得分；以及基于所述拒绝似然率得分和所述关键短语似然率得分来确定接收到的音频输入是否与所述预定关键短语关联。2.如权利要求1所述的方法，其中，所述更新包括：从与所述基于起始状态的拒绝模型关联的多个所述子语音单元的得分确定最高概率得分，并且将所述最高概率得分与从所述特定状态转移的得分和所述单个状态的先前得分中的最大者相加，以提供所述单个状态在所述当前时间实例的得分。3.如权利要求1所述的方法，其中，所述更新包括：提供从所述关键短语模型的所述多个状态中的第二状态到所述拒绝模型的所述单个状态的第二得分的第二转移；以及从与所述基于起始状态的拒绝模型关联的多个所述子语音单元的得分确定最高概率得分，并且将所述最高概率得分与从所述特定状态转移的得分、从所述第二状态转移的第二得分以及所述单个状态的先前得分中的最大者相加，以提供所述单个状态在所述当前时间实例的得分。4.如权利要求1所述的方法，其中，所述基于起始状态的拒绝模型的所述单个状态包括与所述子语音单元的得分中的第一得分关联的自环，并且所述关键短语模型的所述多个状态与所述子语音单元的得分中的第二得分关联，并且其中，在所述第一得分中不包括所述第二得分。5.如权利要求1所述的方法，其中，所述关键短语似然率得分包括与所述关键短语模型的第一状态关联的第一似然率得分和与所述关键短语模型的第二状态关联的第二似然率得分中的最小者。6.如权利要求1所述的方法，其中，所述关键短语模型的所述特定状态与所述预定关键短语内的词语结尾关联。7.如权利要求1所述的方法，其中，所述更新包括：从与所述下一状态对应的所述子语音单元的得分确定得分，并且将该得分与从所述特定状态转移的得分和所述下一状态的先前得分中的最大者相加，以提供所述下一状态在所述当前时间实例的得分。8.如权利要求1所述的方法，其中，所述关键短语似然率得分与所述关键短语模型的最终状态关联。9.如权利要求1所述的方法，其中，确定接收到的音频输入是否与所述预定关键短语关联包括：基于所述拒绝似然率得分和所述关键短语似然率得分来确定对数似然率得分，并且将所述对数似然率得分与阈值进行比较。10.一种用于执行关键短语检测的系统，包括：存储器，被配置为：存储声学模型、基于起始状态的拒绝模型以及与预定关键短语关联的关键短语模型；和数字信号处理器，耦合到所述存储器，所述数字信号处理器用于：在当前时间实例，基于表示接收到的音频输入的子语音单元的得分来更新具有单个状态的所述基于起始状态的拒绝模型以及具有多个状态的所述关键短语模型，其中，为了更新所述基于起始状态的拒绝模型和所述关键短语模型，所述数字信号处理器：提供从所述关键短语模型的所述多个状态中的特定状态到所述关键短语模型的所述多个状态中的下一状态以及到所述拒绝模型的所述单个状态的得分的转移，并且生成与所述基于起始状态的拒绝模型的所述单个状态对应的拒绝似然率得分以及与所述关键短语模型对应的关键短语似然率得分；以及基于所述拒绝似然率得分和所述关键短语似然率得分来确定接收到的音频输入是否与所述预定关键短语关联。11.如权利要求10所述的系统，其中，为了更新所述基于起始状态的拒绝模型和所述关键短语模型，所述数字信号处理器：从与所述基于起始状态的拒绝模型关联的多个所述子语音单元的得分确定最高概率得分，并将所述最高概率得分与从所述特定状态转移的得分和所述单个状态的先前得分中的最大者相加，以提供所述单个状态在所述当前时间实例的得分。12.如权利要求10所述的系统，其中，为了更新所述基于起始状态的拒绝模型和所述关键短语模型，所述数字信号处理器：提供从所述关键短语模型的所述多个状态中的第二状态到所述拒绝模型的所述单个状态的第二得分的第二转移；以及从与所述基于起始状态的拒绝模型关联的多个所述子语音单元的得分确定最高概率得分，并将所述最高概率得分与从所述特定状态转移的得分、从所述第二状态转移的所述第二得分以及所述单个状态的先前得分中的最大者相加，以提供所述单个状态在所述当前时间实例的得分。13.如权...

【专利技术属性】
技术研发人员：T·博克莱特，A·马雷克，T·多劳，P·索邦，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人