一种计算机汉语词汇语音输入方法,其主要步骤包括音节切割、语音辨识、配词以及其藉音节切割区别声母与韵母,并以词的长度区分,由语音辨识产生候选音节后由配词步骤进行音转字的工作,最后经显示步骤以使使用者选取候选词,以达到语音输入目的。(*该技术在2014年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术有关于一种词汇语输入法,特别是一种利用语音输入词汇于计算机的方法,其以词为辨识单位,即对于二字以上的词仅辨识各音节的韵母部分,而二字词或单字词才以整个音节辨识,以提高辨识率与辨识速度的词汇语音输入方法。以语音输入取代以键盘输入中文,不但使不会使用键盘输入法的使用者的最佳选择,更增加计算机使用的普遍性。现有的语音输入法,大抵采用单字辨识,且存在辨识速度慢、误辨率高,使用介面复杂,甚至须使用者先经长时间的正式发音训练等问题。有鉴于上述问题,本专利技术的目的在于提供一种以辨识各词汇的韵母部分的词汇语音输入法。现有的语音输入方式所面临的问题,在汉语语音辨识中存在着38个混淆音组,造成这38个混音组的原因是;中国语中,每个音节可被分割成声母与韵母,一般来说,韵母的辨识率是可以提高的因为从波形及语音的特征参数中可观察到,韵母通常是稳定的周期性信号,且其发音长度也较长,然而声母的辨识率却远小于韵母的辨识率,其原因在于(1)大部分声母的长度相当短,因此一般切割音节的演算法无法精确地将它们选出;(2)大部分会说国语的人,并未受过正式的发音训练,一些卷舌音,如和ㄗ、ㄔ和ㄘ、ㄕ和ㄙ,很多人根本是忽略它们的区别的。根据上述理由,本专利技术的计算机汉语词汇语音输入法,从观察中文字及注音组合成词的关系发现,大部分由二字以上组成的词,它们在发音上的不同除可由408个音节去判别外,其实只要分辨它们韵母的组合,同样可将字数相同的词分辨出来,例如中华民国(ㄓㄨㄥㄏㄨㄚㄇ-ㄣㄍㄨㄛ)与台湾大学(ㄊㄞㄨㄢㄌ丫ㄩㄝ),这两个词的注音只要从韵母中就可分辨出这两个词“ㄨㄥㄨㄚ-ㄣㄨㄛ”与“ㄞㄨㄢㄚㄩㄝ”,这种韵母的组合在语音辨识中是很容易达到高辨识率的,而且辨识速度也可加快,因为本专利技术的词汇输入方法只要去辨识38个韵母就够了,而不是全部的408个音节。此外,在本专利技术八万词目的词库中,共有13000个三字词和11388个四字词,如果所有的韵母组合都可形成词的话,那么,具有相同韵母组合的三字词和四字词的数目分别有0.23(=13000/38)和0.005(=11388/38),这也就是说具有相同韵母组合的词数目是相当少的,否则本专利技术方法也就不可行了。此外,如果把这个方法用在二字词上将会造成组合爆炸的结果,因为具有相同韵母组合的二字词实在太多了,所以本专利技术在辨认二字词的时候必须把声母的辨识也加进来。因此,本专利技术的目的在于提供一种以语音输入汉语汇到电脑的输入方法,其是建立一系统结构,其中包括音节切割、语音辨识、配词与使用者介面等系统将语音经系统的流程处理后,能迅速正确地辨识。以达到输入计算机的目的。本专利技术的,其特征在于,主要步骤包括音节切割借由声母与韵母的语音信号周期稳定程度不同加以分割音节的声母与韵母,使成一序列的语音音框并设定每个音框的语音特征参数;语音辨识借由一个韵母拜氏网络与一音节拜氏网络以辨识音框并产生候选音节;配词借由一串列式数据结构为词库以此词库为依据,由候选音节转换为候选词;以及使用者介面(数据转换)将相应于候选词的数据转换为可显示的电信号,借计算机屏幕与键盘,提供使用者由屏幕中选取正确的候选词;由音节切割、语音辨识、配词与使用者介面等步骤先由音节切割将由使用者输入的语音信号的音节切割为声母与韵母,再由语音辨识产生音节,再由配词步骤依候选音节的特征,由串列式数据结构的词库中,选配出候选词,借由使用者介面的显示与操作方式,由使用者从候选词中选出正确的输入词。所述音节切割步骤中切割音节的方式是根据声母与韵母的周期稳定度不同,而以音框来区分。所述语音辨识步骤将分辨方式区分为单字及二字词与二字以上词两种模式、即先以韵母特征辨识词的长度,其中单字与二字词即以整个音节为单位,由音节拜氏网络加以辨识;二字以上词以韵母根据韵母拜氏网络辨识并产生候选音节的方法。所述配词步骤中词库的数据库结构采用串列式数据结构,其是以词的前两个音的韵母编号组合为指标开始搜寻,并将词库分为二字与二字以上词两大部分。至于本专利技术的详细应用原理、系统结构与流程、作用与功效,则参照下列依附图所作的说明,即可得到完全的了解。图示简单说明附图说明图1本专利技术的方法步骤示意图。图2本专利技术的方法流程图。图3本专利技术的音节切割方式中搜寻稳定韵母区的视窗示意图。图4本专利技术的音节切割流程图。图5本专利技术的语音辨识系统的拜氏网络结构图。图6本专利技术的配词系统的词库结构。图7一个国语音节ㄅㄚ的声母与韵母区示例的频谱图。如图1、2所示,本专利技术的词汇语音输入方法,主要包括音节切割A、语音辨识B、配词C与使用者介面D四个步骤构成。其工作流程当语音信号经麦克风输入电脑后,首先经音节切割A、将音节切为声母与韵母,因为在语音辨识步骤B中的辨识方式是根据词的长度而进行,因此对于所输入的单音,首先由语音辨识步骤B中的韵母拜氏网络21辨出韵母而是二字词时,则须将声母的语音特征先加以保留,待整个词的音节都输入完成、字数确定后,再加以决定是否对声母做辨识。声母与韵母的辨识都同样地以拜氏网络作参考样本进行,但,声母的辨识是以整个音节为辨识单位,而韵母的辨识则是以韵母本身的长度辨识。而且,因为声母的辨识是在韵母之后,因此,在辨识声母时,只要针对辨识出的韵母的前五名找出其相对应的声母参考样本进行辨识即可,如此即可加快辨识速度。不论是二字词或二字以上的词,均取前五名(可随使用者调整)辨识出的音节或韵母的编号做为候选音节的输出。产生候选音节后,即由配词C进行音转字的动作,其言转字的方式,是以一符合快速搜寻要求而设计的词库31为依据,待候选音节配成候选词后,即由使用者介面系统D将这些候选词以一页十个词的方式显示在萤幕上,以供使用者以数字键选出所须的词做输出。以下就是各个主要步骤,详细说明其功能及工作原理一、音节切割基于韵母在语音特性上是一种具有稳定周期的讯号,而大部分的声母不具此特性,本专利技术的音节切割步骤即藉由判定讯号周期的稳定与否,将声母与韵母加以分割,其演算流程如图1、寻找稳定区间的起点(韵母的起点)如图3所示从语音的起点开始,设定长为25.6ms的搜寻视窗,然后在此视窗内找出明显的波峰所在的位置,这些位置在图3中被标示为F1、F2、F3,……Fn等,两个波峰之间即周期,由于语音是一种非定波(nonstationary)的讯号,因此周期并不是一个固定的值,我们先求出一个平均周期值FF=Σi=1NFi/N]]>而后用下式判断此视窗内的周期是否稳定|Fi-F|/F<ε=0.00052、如果对所有在此视窗内的所有周期皆满足上式则此视窗为一稳定的韵母区,而第一个波峰所在的位置即为韵母的起点,反之若上式不满足,则表示稳定区间尚未找到,将此搜寻视窗往后移10ms,然后回到步骤1,一直到找到稳定的区间为止。3、韵母的起点找到后,从语音信号开始到韵母的起点之间即为声母区。上述流程如图4所示。二、语音辨识如图2所示,本专利技术的语音辨识步骤B包括一个专供辨识韵母的韵母拜氏网络21,一个可作声母辨识的音节拜氏网络22与一个线上训练单音网络23。其原理与作用说明如下首先将声母韵母分离后,声母与韵母分别被分成一序列的语音音框,每个音框再求取它们的语音特征参数,音框个数的决定则以实验定之,在我们的系统中是定为10,这些音本文档来自技高网...
【技术保护点】
一种计算机汉语词汇语音输入方法,其特征在于,主要步骤包括:音节切割:借由声母与韵母的语音信号周期稳定程度不同加以分割音节的声母与韵母,使成一序列的语音音框并设定每个音框的语音特征参数;语音辨识:借由一个韵母拜氏网络与一音节拜氏网络以 辨识音框并产生候选音节;配词:借由一串列式数据结构为词库以此词库为依据,由候选音节转换为候选词;以及使用者介面(数据转换):将相应于候选词的数据转换为可显示的电信号,借计算机屏幕与键盘,提供使用者由屏幕中选取正确的候选词;由音节 切割、语音辨识、配词与使用者介面等步骤:先由音节切割将由使用者输入的语音信号的音节切割为声母与韵母,再由语音辨识产生音节,再由配词步骤依候选音节的特征,由串列式数据结构的词库中,选配出候选词,借由使用者介面的显示与操作方式,由使用者从候选词中选出正确的输入词。
【技术特征摘要】
【专利技术属性】
技术研发人员:王骏发,许志兴,吴宗宪,
申请(专利权)人:王骏发,
类型:发明
国别省市:71[中国|台湾]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。