产生及侦测混淆音的方法及系统技术方案

技术编号:3048175 阅读:227 留言:0更新日期:2012-04-11 18:40
一种混淆音产生及侦测方法,包含产生阶段及侦测阶段,产生阶段包含:a.输入汉语语料;b.利用维特比解码算法中的强迫校准,切割汉语语料;c.将切音结果与汉语声学模型比对;d.判别是否有混淆音产生;e.当混淆音产生时,将混淆音加入辨识网络,重复步骤b、c、d;以及f.当没有混淆音产生时,停止并输出所有之前产生的混淆音至混淆音设定档。侦测阶段包含:g.输入使用者念出的汉语语句;h.利用混淆音辨识网络进行校准;i.决定汉语语句的最佳路径;以及j.比较最佳路径与标准路径,进行即时语音矫正。

【技术实现步骤摘要】

本专利技术是有关于一种产生及侦测混淆音的方法及系统,且特别是有关于-一种产生及侦测汉语发音混淆音的方法及系统。
技术介绍
由于近年来电脑计算能力的提升以及语音辨识技术的进步,语音处理在我们日常生活上的应用与日俱增,在语言学习方面,以电脑辅助使用者进行非母语学习已受到相当重视,各方也纷纷投入相关的研究。语言的学习大致上可以分为听、说、读、写这四大部分,在汉语口说能力的训练方面,没有一个很好的解决方案来帮助汉语学习者自我练习与评量,目前在汉语学习软件市场上提供的辅助发音会话学习方面,经过切音、系统分析、以及算法等数据处理后,只能做到语音评分,让使用者知道哪个单字发音发的不够准确,但是无法对使用者的发音进一歩提出分析或指正,也无法根据不同语言或国家的使用者的特性给予有效的矫正建议,实用性不大,所能提供的实质帮助有限。因此,需要一种产生及侦测发音错误模型的方法及系统来改善上述问题。
技术实现思路
因此本专利技术的目的就是在提供一种产生及侦测混淆音的方法及系统,此方法及系统可以分析出使用者发音错误的模式,指出使用者错误之处,让使用者知道哪个发音发的不够准确,还能进一步提出发音指正,给予有效的矫正建议,增加使用者的学习效率。根据本专利技术的上述目的,提出一种产生及侦测混淆音的方法。依照本专利技术一较佳实施例,此产生及侦测混淆音的方法包含产生阶段及侦测阶段,产生阶段包含a.输入汉语语料;b.利用维特比解码算法(ViterbiDecoding)中的强迫校准(Forced Alignment),切割汉语语料;c.将切音结果与汉语声学模型比对;d.6判别是否有混淆音产生;e.当混淆音产生时,将混淆音加入辨识网络,重复步骤b、 C、以及d;以及f.当没有混淆音产生时,停止并输出所有之前产生的混淆音至混淆音设定档。侦测阶段包含g.输入使用者念出的汉语语句;h.利用混淆音辨识网络进行校准;i.决定汉语语句的最佳路径;以及J.比较最佳路径与标准路径,进行即时语音矫正。根据本专利技术的上述目的,提出一种产生及侦测混淆音的系统。依照本专利技术一较佳实施例,此产生及侦测混淆音的系统包含产生系统及侦测系统,产生系统包含辨识网络,用以辨识汉语语料;汉语声学模型,用以提供411个标准汉语音节;混淆音设定档,用以储存所有产生的混淆音;语音切割模块,输入汉语语料,利用维特比解码算法中的强迫校准,通过辨识网络辨识出最佳路径,切割汉语语料以得到切音结果;以及混淆音产生模块,将切音结果与汉语声学模型比对以判别是否有混淆音产生,当混淆音产生时,将混淆音加入辨识网络,当没有混淆音产生时,停止并输出所有之前产生的混淆音至混淆富-设定档;其中当混淆音产生模块有混淆音产生时,语音切割模块会通过辨识网络辨识出一条新的最佳路径,再次切割汉语语料以得到新的切音结果,并将新的切音结果输出至混淆音产生模块。侦测系统包含混淆音辨识网络,用以辨识使用者念出的汉语语句,混淆音辨识网络根据产生阶段输出的混淆音设定档所建立;路径辨识模块,利用维特比解码算法中的强迫校准决定汉语语句的最佳路径;以及语音矫正模块,比较最佳路径与标准路径,进行即时语音矫正。本专利技术以迭代(Iteration)的方法来反复找出混淆音并加入辨识网络,来逐次提高切音的正确性以及评分的客观性。应用本专利技术可以分析出使用者发音错误的模式,指出使用者错误之处,让使用者知道哪个发音发的不够准确,还能进一步提出发音指正,给予有效的矫正建议,增加使用者的学习效率。附图说明为使本专利技术的上述和其它目的、特征、优点与实施例能更明显易懂,所附附图的详细说明如下图1A所示为依照本专利技术一较佳实施例的混淆音产生方法流程图;图1B所示为依照本专利技术一较佳实施例的混淆音侦测方法流程图;图2A所示为依照本专利技术一较佳实施例于混淆音产生阶段时的辨识网络示意图2B所示为依照本专利技术一较佳实施例于混淆音侦测阶段时的路径示意图2C所示为依照本专利技术一较佳实施例的切音结果示意图;图3A所示为依照本专利技术一较佳实施例的混淆音产生系统的结构示意图;图3B所示为依照本专利技术一较佳实施例的混淆音侦测系统的结构示意图。其中,附图标记10:输入汉语语料120:利用维特比解码算法中的强迫校准切割汉语语料130:将切音结果与汉语声学模型比对140:判别是否有混淆音产生150:将混淆音加入辨识网络160:停止并输出所有之前产生的混淆音170:输入汉语语句175:利用混淆音辨识网络进行校准180:决定汉语语句的最佳路径185:进行即时语音矫正210:起始时的辨识网络220:加入混淆音的辨识网络具体实施例方式此产生及侦测混淆音的方法可分成产生阶段及侦测阶段来进行。请参照图1A及图2A,图1A所示为依照本专利技术一较佳实施例的混淆音产生方法流程图,图2A所示为依照本专利技术一较佳实施例在混淆音产生阶段时的辨识网络示意图。在产生阶段时,可从汉语语音文件或麦克风输入汉语语料(步骤110);接240:混淆音辨识网络250:最佳路径270:第一次切音的结果280:第二次切音的结果310:汉语语音文件320:辨识网络330:汉语声学模型340:混淆音设定档350:语音切割模块360:混淆音产生模块362:计算模块364:排名模块370:混淆音辨识网络380:路径辨识模块385:语音矫正模块8着,进行切割汉语语料(步骤120),此步骤是利用维特比解码算法中的强迫校 准,通过辨识网络辨识出一条最佳路径,辨识网络在起始时包含一条标准路径,此标准路径为汉语语料的标准语音内容,在此以例句qu-nian-xia-tian-re-si-le(去 年夏天热死了)说明,如图2A中的状态210所示,此时辨识网络内的标准路径是 由qu nian xia tian re si le这七个标准汉语音节所构成,根据这些标准汉语音节切 割汉语语料后可得知每个音节的起始时间及结束时间;再来,将切音后的每个 音节与411个标准汉语音节的汉语声学模型比对(步骤130),此方法是采用隐 藏式马可夫模型作为声学模型,将每个音节与所有411个标准汉语音节比对后 计算出对数机率,根据这些对数机率的高低将411个标准汉语音节排名,当一 个标准汉语音节a的排名高于一个切音后的音节所应对应的标准汉语音节b时, 标准汉语音节a即为混淆音,例如一个切音后的音节所应对应的标准汉语音节 为re(热),然而,le(乐)的排名却高于re(热)时,即可得知学习者将re (热)混淆 为le(乐),找出混淆音le(乐);以此排名来判别是否有混淆音产生(步骤140); 接着,将混淆音加入辨识网络(步骤150),如图2A中的状态220所示,此时由 于有混淆音le(乐)的加入,辨识网络内多了另--条路径;接着重复步骤120、 130、 以及140,直到没有混淆音产生为止,当没有混淆音产生时,停止并输出所有 之前产生的混淆音至混淆音设定档(步骤160)。由于有混淆音le(乐)加入辨识网络,再次重复步骤120进行切音时,路径为 qu-nian-xia-tian-le-si-le,切音的结果会更为精准,此时因为切音结果有所变动, 可能再产生其它的混淆音,需要将切音结果与汉语声学模型再次比对以判别是 否有新的混淆音产生。如图2C所示,图2C所示为依照本专利技术一较佳实施例的 切音结果示意图,状态270为本文档来自技高网...

【技术保护点】
一种混淆音产生及侦测方法,其特征在于,包含: 提供一产生阶段,该产生阶段包含: a.输入一汉语语料; b.利用维特比解码算法中的强迫校准,通过一辨识网络辨识出一最佳路径,切割该汉语语料以得到一切音结果,其中该切音结果为多个 音节; c.将该切音结果与一汉语声学模型比对,其中该汉语声学模型包含多个标准汉语音节; d.判别是否有混淆音产生; e.当混淆音产生时,将混淆音加入该辨识网络,重复步骤b、c、以及d;以及 f.当没有混淆音产生时,停 止并输出所有之前产生的混淆音至一混淆音设定档; 提供一侦测阶段,该侦测阶段包含: g.输入一使用者念出的一汉语语句; h.利用一混淆音辨识网络进行校准,其中该混淆音辨识网络根据该产生阶段输出的该混淆音设定档所建立;  i.决定该汉语语句的最佳路径;以及 j.比较该最佳路径与该标准路径,进行即时语音矫正。

【技术特征摘要】
1. 一种混淆音产生及侦测方法,其特征在于,包含提供一产生阶段,该产生阶段包含a. 输入一汉语语料;b. 利用维特比解码算法中的强迫校准,通过一辨识网络辨识出一最佳路径,切割该汉语语料以得到一切音结果,其中该切音结果为多个音节;c. 将该切音结果与一汉语声学模型比对,其中该汉语声学模型包含多个标准汉语音节;d. 判别是否有混淆音产生;e. 当混淆音产生时,将混淆音加入该辨识网络,重复步骤b、c、以及d;以及f. 当没有混淆音产生时,停止并输出所有之前产生的混淆音至一混淆音设定档;提供一侦测阶段,该侦测阶段包含g. 输入一使用者念出的一汉语语句;h. 利用一混淆音辨识网络进行校准,其中该混淆音辨识网络根据该产生阶段输出的该混淆音设定档所建立;i. 决定该汉语语句的最佳路径;以及j. 比较该最佳路径与该标准路径,进行即时语音矫正。2. 根据权利要求l所述的混淆音产生及侦测方法,其特征在于,由该切 音结果得知每一该音节的起始时间及结束时间。3. 根据权利要求1所述的混淆音产生及侦测方法,其特征在于,该汉语 声学模型为隐藏式马可夫模型。4. 根据权利要求1所述的混淆音产生及侦测方法,其特征在于,该汉语 声学模型包含411个标准汉语音节。5. 根据权利要求1所述的混淆音产生及侦测方法,其特征在于,该辨识 网络在起始时包含一标准路径,该标准路径为该汉语语料的标准语音内容。6. 根据权利要求1所述的混淆音产生及侦测方法,其特征在于,该步骤 c包含音设定档;将每一该音节与所有该标准汉语音节比对以计算出多个对数机率; 根据该对数机率的高低来排名该标准汉语音节;以及当存在一标准汉语音节,该标准汉语音节的排名高于每一该音节所应对应 的标准汉语音节时,该标准汉语音节即为混淆音。7. 根据权利要求1所述的混淆音产生及侦测方法,其特征在于,该方法 以迭代的方法来反复找出混淆音并加入该辨识网络,来逐次提高切咅的正确性 以及评分的客观性。8. —种混淆音产生及侦测系统,其特征在于,包含 一产生系统,包含一辨识网络,用以辨识汉语语料;一汉语声学模型,用以提供多个标准汉语音节,其中该汉语声学模型包含 多个标准汉语音节;一混淆音设定档,用以储存所有产生的混淆音;一语音切割模块,输入一汉语语料,利用维特比解码算法中的强迫校准, 通过该辨识网络辨识出一最佳路径,切割该汉语语料以得到一切音结果,其中 该切音结果为多个音节;以及一混淆音产生模块,将该切音结果与该汉语声学模型比对以判别是否有混 淆音产生,.当混淆音产生时,将混淆音加入该辨识网络,当没有混淆音产生时, 停止并输出所有之前产生的混淆音至该混淆音设定档;其中当该混淆音产生模块有混淆音产生时,该语音切割模块会通过该辨识 网络辨识出一新的最佳路径,再次切割该汉语语料以得到一新的切音结果,并 将该新的切音结果输出至该混淆音产生模块以判别是否有混淆音产生;一侦测系统,包含一混淆音辨识网络,用以辨识一使用者念出的一汉语语句,该混淆音辨识 网络根据该产生阶段输出的该混淆音设定档所建立;一路径辨识模块,利用维特比解码算法中的强迫校准决定该汉语语句的最 佳路径;以及一语音矫...

【专利技术属性】
技术研发人员:张智星王派斌陈江村林正豪
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利