产生及侦测混淆音的方法及系统技术方案

技术编号：3048175 阅读：238 留言：0更新日期：2012-04-11 18:40

一种混淆音产生及侦测方法，包含产生阶段及侦测阶段，产生阶段包含：ａ．输入汉语语料；ｂ．利用维特比解码算法中的强迫校准，切割汉语语料；ｃ．将切音结果与汉语声学模型比对；ｄ．判别是否有混淆音产生；ｅ．当混淆音产生时，将混淆音加入辨识网络，重复步骤ｂ、ｃ、ｄ；以及ｆ．当没有混淆音产生时，停止并输出所有之前产生的混淆音至混淆音设定档。侦测阶段包含：ｇ．输入使用者念出的汉语语句；ｈ．利用混淆音辨识网络进行校准；ｉ．决定汉语语句的最佳路径；以及ｊ．比较最佳路径与标准路径，进行即时语音矫正。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是有关于一种产生及侦测混淆音的方法及系统，且特别是有关于-一种产生及侦测汉语发音混淆音的方法及系统。
技术介绍
由于近年来电脑计算能力的提升以及语音辨识技术的进步，语音处理在我们日常生活上的应用与日俱增，在语言学习方面，以电脑辅助使用者进行非母语学习已受到相当重视，各方也纷纷投入相关的研究。语言的学习大致上可以分为听、说、读、写这四大部分，在汉语口说能力的训练方面，没有一个很好的解决方案来帮助汉语学习者自我练习与评量，目前在汉语学习软件市场上提供的辅助发音会话学习方面，经过切音、系统分析、以及算法等数据处理后，只能做到语音评分，让使用者知道哪个单字发音发的不够准确，但是无法对使用者的发音进一歩提出分析或指正，也无法根据不同语言或国家的使用者的特性给予有效的矫正建议，实用性不大，所能提供的实质帮助有限。因此，需要一种产生及侦测发音错误模型的方法及系统来改善上述问题。
技术实现思路
因此本专利技术的目的就是在提供一种产生及侦测混淆音的方法及系统，此方法及系统可以分析出使用者发音错误的模式，指出使用者错误之处，让使用者知道哪个发音发的不够准确，还能进一步提出发音指正，给予有效的矫正建议，增加使用者的学习效率。根据本专利技术的上述目的，提出一种产生及侦测混淆音的方法。依照本专利技术一较佳实施例，此产生及侦测混淆音的方法包含产生阶段及侦测阶段，产生阶段包含a.输入汉语语料；b.利用维特比解码算法(ViterbiDecoding)中的强迫校准(Forced Alignment),切割汉语语料；c.将切音结果与汉语声学模型比对；d.6判别是否有混淆音产生；e.当...

【技术保护点】
一种混淆音产生及侦测方法，其特征在于，包含：　提供一产生阶段，该产生阶段包含：　ａ．输入一汉语语料；　ｂ．利用维特比解码算法中的强迫校准，通过一辨识网络辨识出一最佳路径，切割该汉语语料以得到一切音结果，其中该切音结果为多个音节；　ｃ．将该切音结果与一汉语声学模型比对，其中该汉语声学模型包含多个标准汉语音节；　ｄ．判别是否有混淆音产生；　ｅ．当混淆音产生时，将混淆音加入该辨识网络，重复步骤ｂ、ｃ、以及ｄ；以及　ｆ．当没有混淆音产生时，停止并输出所有之前产生的混淆音至一混淆音设定档；　提供一侦测阶段，该侦测阶段包含：　ｇ．输入一使用者念出的一汉语语句；　ｈ．利用一混淆音辨识网络进行校准，其中该混淆音辨识网络根据该产生阶段输出的该混淆音设定档所建立；　ｉ．决定该汉语语句的最佳路径；以及　ｊ．比较该最佳路径与该标准路径，进行即时语音矫正。

【技术特征摘要】
1. 一种混淆音产生及侦测方法，其特征在于，包含提供一产生阶段，该产生阶段包含a. 输入一汉语语料；b. 利用维特比解码算法中的强迫校准，通过一辨识网络辨识出一最佳路径，切割该汉语语料以得到一切音结果，其中该切音结果为多个音节；c. 将该切音结果与一汉语声学模型比对，其中该汉语声学模型包含多个标准汉语音节；d. 判别是否有混淆音产生；e. 当混淆音产生时，将混淆音加入该辨识网络，重复步骤b、c、以及d；以及f. 当没有混淆音产生时，停止并输出所有之前产生的混淆音至一混淆音设定档；提供一侦测阶段，该侦测阶段包含g. 输入一使用者念出的一汉语语句；h. 利用一混淆音辨识网络进行校准，其中该混淆音辨识网络根据该产生阶段输出的该混淆音设定档所建立；i. 决定该汉语语句的最佳路径；以及j. 比较该最佳路径与该标准路径，进行即时语音矫正。2. 根据权利要求l所述的混淆音产生及侦测方法，其特征在于，由该切音结果得知每一该音节的起始时间及结束时间。3. 根据权利要求1所述的混淆音产生及侦测方法，其特征在于，该汉语声学模型为隐藏式马可夫模型。4. 根据权利要求1所述的混淆音产生及侦测方法，其特征在于，该汉语声学模型包含411个标准汉语音节。5. 根据权利要求1所述的混淆音产生及侦测方法，其特征在于，该辨识网络在起始时包含一标准路径，该标准路径为该汉语语料的标准语音内容。6. 根据权利要求1所述的混淆音产生及侦测方法，其特征在于，该步骤 c包含音设定档;将每一该音节与所有该标准汉语音节比对以计算出多个对数机率；根据该对数机率的高低来排名该标准汉语音节；以及当存在一标准汉语音节，该标准汉语音节的排名高于每一该音节所应对应的标准汉语音节时，该标准汉语音节即为混淆音。7. 根据权利要求1所述的混淆音产生及侦测方法，其特征在于，该方法以迭代的方法来反复找出混淆音并加入该辨识网络，来逐次提高切咅的正确性以及评分的客观性。8. —种混淆音产生及侦测系统，其特征在于，包含一产生系统，包含一辨识网络，用以辨识汉语语料；一汉语声学模型，用以提供多个标准汉语音节，其中该汉语声学模型包含多个标准汉语音节；一混淆音设定档，用以储存所有产生的混淆音；一语音切割模块，输入一汉语语料，利用维特比解码算法中的强迫校准，通过该辨识网络辨识出一最佳路径，切割该汉语语料以得到一切音结果，其中该切音结果为多个音节；以及一混淆音产生模块，将该切音结果与该汉语声学模型比对以判别是否有混淆音产生，.当混淆音产生时，将混淆音加入该辨识网络，当没有混淆音产生时，停止并输出所有之前产生的混淆音至该混淆音设定档；其中当该混淆音产生模块有混淆音产生时，该语音切割模块会通过该辨识网络辨识出一新的最佳路径，再次切割该汉语语料以得到一新的切音结果，并将该新的切音结果输出至该混淆音产生模块以判别是否有混淆音产生；一侦测系统，包含一混淆音辨识网络，用以辨识一使用者念出的一汉语语句，该混淆音辨识网络根据该产生阶段输出的该混淆音设定档所建立；一路径辨识模块，利用维特比解码算法中的强迫校准决定该汉语语句的最佳路径；以及一语音矫...

【专利技术属性】
技术研发人员：张智星，王派斌，陈江村，林正豪，
申请(专利权)人：财团法人资讯工业策进会，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人