中文电脑的汉语语音输入系统及其方法技术方案

技术编号：2891888 阅读：427 留言：0更新日期：2012-04-11 18:40

一种汉语语音输入系统及其方法，用以将任意文句的汉语语音直接转换成相应的中文文字，该系统及其方法包括声音处理过程及语言解码过程两大部分。其特征在于声音处理过程利用“段落统计模型”计算输入汉语语音的各单音节及声调的机率，进而辨识之；语言解码过程针对声音处理过程送来的一连串音节利用“词类双连中文语言模型”找出对应的中文字。一种包含“智慧型学习技术”的汉语听写机，用本方法将语音输入转换成文字显示。（*该技术在2014年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是关于一种智慧型汉语语音输入方法及汉语听写机。本专利技术是同一专利技术人的台湾专利申请案第78105818号的改良，利用此改良方法，或使得利用汉语语音输入中文文字的方法更为精确。目前中文电脑的输入方法百家争鸣，或用注音，或用字根，或用划笔，但没有一种是众所公认最好的(因为没有一种真正最方便)。这是因为有的输入速度较慢，有的需要特别训练，有的方法特别要背口诀，久了不用会忘掉等，而人人都会、不需训练的注音符号法，则因其速度太慢，而无法通行。在众多中文输入法中，速度最快的是仓颉法、大易法或类似的方法，但此方法却只有专业人员在长期训练下才会用，一般人不常用就会忘掉。事实上，这是现阶段我国社会信息化最大的障碍，因为“中文输入”变成一种专门职业，一般人自然不会常用它。这些方法不方便的基本原因，是尝试把汉字转成几个按键，由键盘输入;但事实上键盘是西方拼音文字下的产物，汉字不是拼音文字，所以由键盘输入就自然不方便了。既然键盘输入不方便，还有什么其他方法可用呢？很多人很早就想到了可用声音输入。只是用声音输入的技术困难太多，几乎是不太可能的事，所以一直没有这方面的方便产品问世。技术上困难的原因有三点(1)需要辨识的词汇太多了，中文常用字至少五千个，常用词至少十万个，这种数字已超出技术可行的范围;(2)中文字的同音字太多，即使知道是什么音，又如何能方便而快速无误地知道是什么字呢？(3)要能“即时”听写汉语，就必须在极短时间内解决如此困难的问题，更是不容易。本专利技术人的美国专利第5，220，639号专利申请案基本上已可以解决上述困难，这是因为(1)选用汉语单音节...

【技术保护点】
一种汉语语音输入方法，用以将任意文句的汉语语音直接转换成相对应的中文文字，该方法包括声音处理过程以及语言解码过程两大部分，其特征在于，该声音处理过程利用“段落统计模型”计算输入汉语语音的每一音节以及声调的机率，进而辨识之；该语言解码过程针对该声音处理过程送来的一连串音节，以“马可夫中文语言模型”找出所对应的中文字。

【技术特征摘要】

【专利技术属性】
技术研发人员：李琳山，
申请(专利权)人：李琳山，
类型：发明
国别省市：71[中国|台湾]

全部详细技术资料下载我是这个专利的主人