计算机汉语词汇语音输入方法技术

技术编号：2891747 阅读：336 留言：0更新日期：2012-04-11 18:40

一种计算机汉语词汇语音输入方法，其主要步骤包括音节切割、语音辨识、配词以及其藉音节切割区别声母与韵母，并以词的长度区分，由语音辨识产生候选音节后由配词步骤进行音转字的工作，最后经显示步骤以使使用者选取候选词，以达到语音输入目的。（*该技术在2014年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术有关于一种词汇语输入法，特别是一种利用语音输入词汇于计算机的方法，其以词为辨识单位，即对于二字以上的词仅辨识各音节的韵母部分，而二字词或单字词才以整个音节辨识，以提高辨识率与辨识速度的词汇语音输入方法。以语音输入取代以键盘输入中文，不但使不会使用键盘输入法的使用者的最佳选择，更增加计算机使用的普遍性。现有的语音输入法，大抵采用单字辨识，且存在辨识速度慢、误辨率高，使用介面复杂，甚至须使用者先经长时间的正式发音训练等问题。有鉴于上述问题，本专利技术的目的在于提供一种以辨识各词汇的韵母部分的词汇语音输入法。现有的语音输入方式所面临的问题，在汉语语音辨识中存在着38个混淆音组，造成这38个混音组的原因是；中国语中，每个音节可被分割成声母与韵母，一般来说，韵母的辨识率是可以提高的因为从波形及语音的特征参数中可观察到，韵母通常是稳定的周期性信号，且其发音长度也较长，然而声母的辨识率却远小于韵母的辨识率，其原因在于(1)大部分声母的长度相当短，因此一般切割音节的演算法无法精确地将它们选出；(2)大部分会说国语的人，并未受过正式的发音训练，一些卷舌音，如和ㄗ、ㄔ和ㄘ、ㄕ和ㄙ，很多人根本是忽略它们的区别的。根据上述理由，本专利技术的计算机汉语词汇语音输入法，从观察中文字及注音组合成词的关系发现，大部分由二字以上组成的词，它们在发音上的不同除可由408个音节去判别外，其实只要分辨它们韵母的组合，同样可将字数相同的词分辨出来，例如中华民国(ㄓㄨㄥㄏㄨㄚㄇ-ㄣㄍㄨㄛ)与台湾大学(ㄊㄞㄨㄢㄌ丫ㄩㄝ)，这两个词的注音只要从韵母中就可分辨出这两个词“ㄨㄥㄨㄚ-ㄣㄨㄛ”...

【技术保护点】
一种计算机汉语词汇语音输入方法，其特征在于，主要步骤包括：音节切割：借由声母与韵母的语音信号周期稳定程度不同加以分割音节的声母与韵母，使成一序列的语音音框并设定每个音框的语音特征参数；语音辨识：借由一个韵母拜氏网络与一音节拜氏网络以辨识音框并产生候选音节；配词：借由一串列式数据结构为词库以此词库为依据，由候选音节转换为候选词；以及使用者介面（数据转换）：将相应于候选词的数据转换为可显示的电信号，借计算机屏幕与键盘，提供使用者由屏幕中选取正确的候选词；由音节切割、语音辨识、配词与使用者介面等步骤：先由音节切割将由使用者输入的语音信号的音节切割为声母与韵母，再由语音辨识产生音节，再由配词步骤依候选音节的特征，由串列式数据结构的词库中，选配出候选词，借由使用者介面的显示与操作方式，由使用者从候选词中选出正确的输入词。

【技术特征摘要】

【专利技术属性】
技术研发人员：王骏发，许志兴，吴宗宪，
申请(专利权)人：王骏发，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人