一种语音识别的置信度估计方法、装置及计算机设备制造方法及图纸

技术编号：33204581 阅读：18 留言：0更新日期：2022-04-24 00:48

本发明专利技术公开了一种语音识别的置信度估计方法、装置及设备，包括：获取待估计语句；将待估计语句送入声学模型进行计算和解码，以获取待估计语句中每个音素对应声学模型状态的后验值；将音素的后验值送入预先构建的音素模糊矩阵，计算单音素置信度；根据单音素置信度计算待估计语句的置信度。本发明专利技术通过利用音素模糊矩阵，来进行单音素置信度的计算，以得到整体语音的置信度，解决了在现有的置信度计算方法中，存在计算置信度效果不理想、计算量大、影响准确率等问题。响准确率等问题。响准确率等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别的置信度估计方法、装置及计算机设备

[0001]本专利技术涉及人工智能领域，尤其涉及一种语音识别的置信度估计方法、装置及计算机设备。

技术介绍

[0002]随着人工智能及语音识别技术的不断发展，以及提高人机交互效率的需求的日益增长，对语音识别的置信度提出了更高的要求。
[0003]置信度包括准确率和拒识能力，准确率是把人类说话发出的“语音”转换为对应形式的“文字”，拒识能力是对如噪音等的非预期输入进行识别及排除。
[0004]置信度可以反映识别结果的可靠程度，在语音识别的现有的置信度计算方法中，存在计算置信度效果不理想、计算量大、影响准确率等问题。

技术实现思路

[0005]本申请实施例通过提供一种语音识别的置信度估计方法、装置及计算机设备，解决了现有技术中语音识别中置信度计算效果不理想的问题。
[0006]第一方面，本申请实施例提供了一种语音识别的置信度估计方法，包括：
[0007]获取待估计语句；
[0008]将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值作为识别结果；
[0009]将所述音素的后验值送入预先构建的音素模糊矩阵，计算单音素置信度；
[0010]根据所述单音素置信度计算所述识别结果的置信度。
[0011]在其中一个实施例中，所述将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值，包括：
[001

【技术保护点】

【技术特征摘要】
1.一种语音识别的置信度估计方法，其特征在于，包括：获取待估计语句；将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值作为识别结果；将所述音素的后验值送入预先构建的音素模糊矩阵，计算单音素置信度；根据所述单音素置信度计算所述识别结果的置信度。2.如权利要求1所述的一种基于音素模糊的置信度估计方法，其特征在于，所述将所述待估计语句送入声学模型进行计算和解码，以获取所述待估计语句中每个音素对应所述声学模型状态的后验值，包括：将所述待估计语句的语言信号分帧后转换成特征序列；将所述特征序列中后验概率最大的词序列作为每个音素对应声学模型状态的后验值。3.如权利要求1所述的一种基于音素模糊的置信度估计方法，其特征在于，所述预先构建的音素模糊矩阵包括：所述音素模糊矩阵对于每一个音素选取与其相似度较高的音素作为其模糊音素。4.如权利要求3所述的一种基于音素模糊的置信度估计方法，其特征在于，所述计算单音素置信度，包括：对所述每个音素及其所述模糊音素的后验值加权，所述加权系数为其模糊系数，得到所述每个音素对应的声学置信度。5.如权利要求4所述的一种基于音素模糊的置信度估计方法，其特征在于，所诉根据所述单音素置信度计算所述识别结果的置信度包括：根据所述每个音素对应的声学置信度，计算所述识别结果的声学模型置信度；根据所述识别结果的声学模型置信度，计算所述识别结果的语言模型置信度；根据所述识别结果的语言模型置信度，计算所述识别结...

【专利技术属性】
技术研发人员：张钰辉，赵茂详，李全忠，何国涛，蒲瑶，
申请(专利权)人：普强时代珠海横琴信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人