一种发音检错方法及装置制造方法及图纸

技术编号：14852837 阅读：96 留言：0更新日期：2017-03-18 19:55

本发明专利技术公开了一种发音检错方法及装置，该方法包括：获取待检错语音信号；提取所述语音信号的语音特征序列；对所述语音特征序列进行切分，获取基本语音单元片断；对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；根据所述基本语音单元片断的发音得分进行发音检错。本发明专利技术能够减小发音得分出现的偏差，提高发音检错的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及发音检错
，尤其涉及一种发音检错方法及装置。
技术介绍
自上世纪90年代开始，为了解除传统方法的束缚，越来越多的语音识别、语言学、教育学等方面的研究人员开展计算机辅助发音训练(ComputerAssistedPronunciationTraining，CAPT)系统的研究与开发，用于取代或者部分取代“教师”的作用，实现对学习者发音水平的自动评估，并对发音错误给予反馈与指导，提高学习效果与效率。发音检错即检测出用户发音过程中的错误，作为CAPT系统的重要环节，受到很多研究人员的关注。现有发音检错系统中，发音得分通常计算为语音单元片断相应于其对应系统预设模型的相似度，系统预设模型由系统预先在采集的语音数据上训练得到。然而，由于训练数据的有限性，训练数据中包含的基本语音单元的词频分布往往具有一定的偏向性，如常用单词not、and等往往出现频率较高，而较生僻的单词则出现频率较低。而在真实数据测试中，由于测试数据环境和训练数据的不尽一致，数据充足的模型识别率高，而那些数据稀疏的模型识别可能出现失真。相应的，基于该模型打分的发音得分可能存在一定的偏差，从而导致发音检测的准确率不高。
技术实现思路
为解决上述技术问题，本申请实施例提供一种发音检错方法及装置，能够减小发音得分出现的偏差，提高发音检错的准确率。技术方案如下：一种发音检错方法，包括：获取待检错语音信号；提取所述语音信号的语...

【技术保护点】
一种发音检错方法，其特征在于，包括：获取待检错语音信号；提取所述语音信号的语音特征序列；对所述语音特征序列进行切分，获取基本语音单元片断；对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；根据所述基本语音单元片断的发音得分进行发音检错。

【技术特征摘要】
1.一种发音检错方法，其特征在于，包括：
获取待检错语音信号；
提取所述语音信号的语音特征序列；
对所述语音特征序列进行切分，获取基本语音单元片断；
对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元
片断的发音得分；
根据所述基本语音单元片断的发音得分进行发音检错。
2.根据权利要求1所述的方法，其特征在于，所述对所述基本语音单
元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分，包括：
确定所述基本语音单元片断对应的发音模型和竞争模型；
计算所述基本语音单元片断与所述发音模型的第一似然度得分，以及
所述基本语音单元片断与所述竞争模型的第二似然度得分；
获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数；
根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿，获
得第三似然度得分；
根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分
获得所述基本语音单元片断的发音得分。
3.根据权利要求2所述的方法，其特征在于，所述获得所述基本语音
单元片断对应的所述竞争模型的模型补偿系数，包括：
获取训练数据；
获取所述训练数据中的基本语音单元片断；
确定所述基本语音单元片断对应的发音模型及竞争模型；
计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分
集合；其中，所述第一似然度得分集合为由所有所述训练数据中的基本语
音单元片断与所述发音模型的似然度得分形成的集合；所述第二似然度得
分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似
然度得分形成的集合；
根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述
基本语音单元片断对应的竞争模型的模型补偿系数。
4.根据权利要求3所述的方法，其特征在于，所述根据所述第一似然
度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应
的竞争模型的模型补偿系数，包括：
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然
度得分差集合；
对所述似然度得分差集合中的对象按照数值从小到大进行排序，得到
一得分差数组SCORE′；
根据预设的所述发音模型和所述竞争模型间的虚警比例P％及所述似
然度得分差集合中的对象个数N，获得得分差数组SCORE′中的对象
SCORE′(N*P％)；
如果所述对象SCORE′(N*P％)大于0，则将所述基本语音单元片断对应
的所述竞争模型的模型补偿系数设置为0；否则，将所述对象SCORE′(N*P％)
作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
5.根据权利要求3所述的方法，其特征在于，所述根据所述第一似然
度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应
的竞争模型的模型补偿系数，包括：
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然
度得分差集合；
从所述似然度得分差集合中选择最小的N*P％个对象，N为所述似然
度得分差集合中的对象个数，P％为所述发音模型和所述竞争模型间的虚警
比例；
获取所述N*P％个对象中最大的值；
如果所述最大的值大于0，则将所述基本语音单元片断对应的所述竞
争模型的模型补偿系数设置为0；否则，将所述最大的值作为所述基本语
音单元片断对应的所述竞争模型的模型补偿系数。
6.一种发音检错装置，其特征在于，包括：
信号获取单元，用于获取待检错语音信号；
特征提取单元，用于提取所...

【专利技术属性】
技术研发人员：赵超，高前勇，魏思，胡国平，胡郁，刘庆峰，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人