深度神经网络的低资源占用适配和个性化制造技术

技术编号：13974614 阅读：230 留言：0更新日期：2016-11-11 04:33

本发明专利技术提供了对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化。可以在诸如话音搜索或短消息命令之类的ASR任务中接收包括一个或多个扬声器的语音特征的话语。然后，可以将分解方法应用于该DNN模型中的原始矩阵。响应于应用该分解方法，该原始矩阵可以被变换为比该原始矩阵更小的多个新矩阵。然后，可以将方阵加到所述新矩阵。然后，可以将扬声器特定参数存储在该方阵中。然后，可以通过更新该方阵来对该DNN模型进行适配。这个过程可以被应用于该DNN模型中的所有多个原始矩阵。经适配的DNN模型可以包括与原始DNN模型中接收的参数相比数量减少的参数。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
很多计算设备，例如智能电话、桌面型计算机、膝上型计算机、平板电脑、游戏控制台等等，利用自动语音识别(ASR)来执行包括话音搜索和短消息命令的多种任务。为了提高ASR的准确度，已经提出了深度神经网络(DNN)的使用。DNN是在输入层和输出层之间具有一个以上的隐藏层的人工神经网络，并且可以模拟复杂的非线性关系。DNN中的隐藏层提供另外的抽象水平，从而增加其模型容量。然而当DNN被用于ASR中时，会遭受与适配和个性化相关联的多项缺点。例如，DNN的使用在增加ASR准确度的同时，也伴随着非常大量的参数，使得对DNN模型的适配非常有挑战性。此外，与在个性化ASR应用(即，多个单独扬声器)中使用DNN相关联的开销由于需要在部署期间针对每个单独扬声器存储非常大的DNN模型而过高。正是出于这些考虑以及其它考虑才做出了本专利技术的各个实施例。
技术实现思路
提供本概述以便以简化的形式介绍对构思的选择，以下详细描述将进一步描述这些构思。这一概述并不意在标识所声明的主题内容的关键特征或必要特征，也并不意在辅助确定所声明的主题内容的范围。针对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化提供了实施例。包括很多扬声器的语音特征的话语可以被用于训练该DNN模型。然后，将诸如低秩因式分解之类的分解方法应用于DNN模型中的原始权重矩阵。由于应用该分解方法，该原始权重矩阵可以被变换为比该原始矩阵更小的多个新矩阵的乘积。然后，将方阵加到这些矩阵上。然后，可以将扬声器特定参数存储在该方阵中，该方阵可以被初始化为单位矩阵。然后，通过更新该方阵来对该DNN模型进行适配。经适配的DNN...

【技术保护点】
一种对用于自动语音识别(ASR)的深度神经网络(DNN)模型进行适配和个性化的方法，包括：由计算设备从一个或多个ASR任务接收包括一个或多个扬声器的多个语音特征的至少一个话语；由所述计算设备将分解方法应用于所述DNN模型中的原始矩阵；响应于应用所述分解方法，将所述原始矩阵变换为多个新矩阵，所述多个新矩阵中的每一个新矩阵小于所述原始矩阵；由所述计算设备将另一个矩阵加到所述多个新矩阵上；以及由所述计算设备通过更新相加后的矩阵来对所述DNN模型进行适配，经适配的DNN模型包括所述DNN模型中的参数的数量的减少。

【技术特征摘要】
【国外来华专利技术】2014.03.07 US 14/201,7041.一种对用于自动语音识别(ASR)的深度神经网络(DNN)模型进行适配和个性化的方法，包括：由计算设备从一个或多个ASR任务接收包括一个或多个扬声器的多个语音特征的至少一个话语；由所述计算设备将分解方法应用于所述DNN模型中的原始矩阵；响应于应用所述分解方法，将所述原始矩阵变换为多个新矩阵，所述多个新矩阵中的每一个新矩阵小于所述原始矩阵；由所述计算设备将另一个矩阵加到所述多个新矩阵上；以及由所述计算设备通过更新相加后的矩阵来对所述DNN模型进行适配，经适配的DNN模型包括所述DNN模型中的参数的数量的减少。2.如权利要求1所述的方法，还包括利用多个新层来替换所述DNN模型中的原始层。3.如权利要求2所述的方法，其中，所述多个新层中的至少一个新层包括非线性层。4.如权利要求1所述的方法，其中，由所述计算设备将分解方法应用于所述DNN模型中的原始矩阵包括：将奇异值分解(SVD)应用于所述DNN模型中的所述原始矩阵。5.一种对用于自动语音识别(ASR)的深度神经网络(DNN)模型进行适配和个性化的系统，包括：用于存储可执行程序代码的存储器；以及处理器，其功能性地耦接到所述存储器，所述处理器响应于所述程序代码中包含的计算机可执行指令并且操作用于：从一个或多个ASR任务接收包括一个或多个扬声器的多个语音特征的至少一个话语；根据所述DNN模型来确定经适配的DNN模型，所述DNN模型包括多个未适配的矩阵，并且所述经适配的DNN模型包括多个经适配的矩...

【专利技术属性】
技术研发人员：薛健，李锦宇，俞栋，M·L·塞尔策，龚一凡，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人