语音识别方法及装置、存储介质、电子设备制造方法及图纸

技术编号：32125073 阅读：31 留言：0更新日期：2022-01-29 19:12

本公开提供一种语音识别方法、语音识别装置、存储介质与电子设备，涉及计算机技术领域。其中，所述语音识别方法包括：获取待识别语音，并对所述待识别语音进行特征提取获取语音特征；通过结合建模单元构建的声学模型对所述语音特征进行预测处理，确定所述待识别语音的建模单元的概率分布；所述建模单元包括主要语言字符和辅助语言子词；基于所述主要语言字符和所述辅助语言子词构建的语言模型对所述待识别语音进行识别处理，确定所述待识别语音的语法得分；结合所述概率分布以及所述语法得分，确定所述待识别语音的识别结果。本公开的技术方案能够提高语音识别的准确性。方案能够提高语音识别的准确性。方案能够提高语音识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法及装置、存储介质、电子设备

[0001]本公开涉及计算机
，具体而言，涉及一种语音识别方法、语音识别装置、计算机可读存储介质以及电子设备。

技术介绍

[0002]随着语音识别技术的发展，用户使用多种语言交流已逐渐成为普遍现象。因此，单语言的语音识别已无法满足许多场景下的识别需求。
[0003]相关技术中，主要通过两种方式来进行语言识别：一是传统语音识别系统，由声学模型、发音词典和语言模型三部分组成，不同模型需要分来训练，然后将各个部分融合到一起构成解码图，通过解码得到识别结果。二是端到端的语音识别系统，只需给出输入端的语音以及输出端的文本信息，训练一个模型，即可直接实现输入语音到输出文本的转换。
[0004]上述方式中，发音的音素需要大量的语言学专业知识来构建这种混合语种的发音词典，操作步骤复杂且可能存在偏差，准确性较低。并且，以中文字符和英文字母作为建模单元集合时，中文字符与英文字母之间是有明显差异的，可能会出现无法完全建模以及模型无法处理的问题，因此建模方式不合理，从而导致语音识别的应用范围较小，且语音识别的准确性较低。
[0005]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开提供一种语音识别方法及装置、计算机可读存储介质和电子设备，进而至少在一定程度上克服相关技术中语音识别的准确性较低的问题。
[0007]本公开的其他特性和...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：获取待识别语音，并对所述待识别语音进行特征提取获取语音特征；通过结合建模单元构建的声学模型对所述语音特征进行预测处理，确定所述待识别语音的建模单元的概率分布；所述建模单元包括主要语言字符和辅助语言子词；基于所述主要语言字符和所述辅助语言子词构建的语言模型对所述待识别语音进行识别处理，确定所述待识别语音的语法得分；结合所述概率分布以及所述语法得分，确定所述待识别语音的识别结果。2.根据权利要求1所述的语音识别方法，其特征在于，所述方法还包括：获取训练语料，并对所述训练语料进行特征提取，确定所述训练语料的参考语音特征；结合所述参考语音特征以及所述建模单元中的所述主要语言字符和所述辅助语言子词对声学神经网络模型进行模型训练，得到声学模型。3.根据权利要求2所述的语音识别方法，其特征在于，所述对所述训练语料进行特征提取，确定所述训练语料的参考语音特征，包括；对所述训练语料进行分帧加窗操作，以获取多个语音帧；将所述多个语音帧进行变换处理，获取所述参考语音特征。4.根据权利要求2所述的语音识别方法，其特征在于，所述结合所述参考语音特征以及所述建模单元对声学神经网络模型进行模型训练，得到声学模型，包括：将所述参考语音特征输入至所述声学神经网络模型，确定所述参考语音特征对应的预测标签的概率分布；将所述预测标签与所述建模单元表示的真实标签进行对比，根据所述预测标签和所述真实标签之间的距离确定损失函数；根据所述损失函数调整所述神经网络模型的模型参数，直至所述损失函数最小，以得到所述声学模型。5.根据权利要求1所述的语音识别方法，其特征在于，所述方法还包括：将训练语料按照最小粒度进行拆分，得到字符序列；统计所述字符序列中每个连续字符对出现的次数，将出现次数最高的字符对进行合并生成新字符序列，直至满足结束条件为止，以确定所述辅助语言子词。6.根据权利要求1所述的语...

【专利技术属性】
技术研发人员：李思琪，
申请(专利权)人：京东科技信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人