语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：25311542 阅读：17 留言：0更新日期：2020-08-18 22:29

本发明专利技术公开了一种语音识别方法、设备、系统及计算机可读存储介质，所述方法包括：对待识别语音数据进行语音识别得到所述待识别语音数据的各第一候选结果；获取各所述第一候选结果对应的特征数据，并将各所述特征数据输入预先训练得到的排序模型中，得到各所述第一候选结果的排序结果；根据所述排序结果从各所述第一候选结果中选取目标候选结果作为所述待识别语音数据的语音识别结果。本发明专利技术相比于依据人为经验设置的线性评分组合方式，能够获得更加准确的排序结果，从而能够获得更加准确的语音识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质
本专利技术涉及语音数据处理
，尤其涉及一种语音识别方法、装置、设备及计算机可读存储介质。
技术介绍
随着语音数据处理技术的发展，语音识别系统已经广泛地应用于各个领域。语音识别系统中，对N-候选重打分(N-bestHypothesesRescoring)是一个重要的部分，对语音识别效果有至关重要的影响。N-候选是对语音数据识别得到的N个候选结果，N-候选重打分是对N个候选结果重新进行打分排序。目前采用的N-候选重打分的方式是先用语音模型(AcousticModel)和语言模型(LanguageModel)对每个候选进行评估打分，然后将语音模型评分和语言模型评分组合起来给出N-候选的最终排序结果，取排名第一的候选作为最终的语音识别结果。但是这种先给出语音模型评分和语言模型评分，再线性组合两种得分的方式，需要根据经验来设置得分的线性组合方式，具有很大的不确定性，从而导致语音识别效果不够准确。
技术实现思路
本专利技术的主要目的在于提供一种语音识别方法、设备、系统及计算机可读存储介质，旨在解决目前N-候选重打分的方式，需要根据经验来设置得分的线性组合方式，具有很大的不确定性，从而导致语音识别效果不够准确的问题。为实现上述目的，本专利技术提供一种语音识别方法，所述方法包括以下步骤：对待识别语音数据进行语音识别得到所述待识别语音数据的各第一候选结果；获取各所述第一候选结果对应的特征数据，并将各所述特征数据输入预先训练得到的排序模型中，...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括以下步骤：/n对待识别语音数据进行语音识别得到所述待识别语音数据的各第一候选结果；/n获取各所述第一候选结果对应的特征数据，并将各所述特征数据输入预先训练得到的排序模型中，得到各所述第一候选结果的排序结果；/n根据所述排序结果从各所述第一候选结果中选取目标候选结果作为所述待识别语音数据的语音识别结果。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括以下步骤：
对待识别语音数据进行语音识别得到所述待识别语音数据的各第一候选结果；
获取各所述第一候选结果对应的特征数据，并将各所述特征数据输入预先训练得到的排序模型中，得到各所述第一候选结果的排序结果；
根据所述排序结果从各所述第一候选结果中选取目标候选结果作为所述待识别语音数据的语音识别结果。

2.如权利要求1所述的语音识别方法，其特征在于，所述获取各所述第一候选结果对应的特征数据的步骤包括：
采用预设的打分模型对各所述第一候选结果进行打分，得到各所述第一候选结果对应的打分值，其中，所述打分模型包括至少一个语音模型和/或至少一个语言模型；
将各所述第一候选结果的打分值对应作为各所述第一候选结果的特征数据。

3.如权利要求1所述的语音识别方法，其特征在于，所述获取各所述第一候选结果对应的特征数据的步骤包括：
采用预设的至少一个语言表征模型对各所述第一候选结果进行处理，得到各所述第一候选结果对应的向量表示；
将各所述第一候选结果的向量表示对应作为各所述第一候选结果的特征数据。

4.如权利要求1所述的语音识别方法，其特征在于，所述获取各所述第一候选结果对应的特征数据，并将各所述特征数据输入预设的排序模型，得到各所述第一候选结果的排序结果的步骤之前，还包括：
对训练语音数据进行语音识别得到所述训练语音数据的各第二候选结果；
获取各所述第二候选结果对应的特征数据，以及获取各所述第二候选结果的排序标签；
将各所述第二候选结果对应的特征数据和各所述第二候选结果的排序标签作为一条训练数据，并根据获取到的各条训练数据得到训练数据集；
采用所述训练数据集对待训练排序模型进行训练得到所述排序模型。

5.如权利要求4所...

【专利技术属性】
技术研发人员：宋元峰，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人