语音识别与交互系统及方法技术方案

技术编号：6115748 阅读：176 留言：0更新日期：2012-04-11 18:40

本发明专利技术设计一种新的能广泛应用在PC、手机、家用电器等各种终端设备上的语音识别与交互系统。其目的在于在现有的用户交互系统上，添加更加人性化的中文语音交互方式。本发明专利技术在自己超大词汇量非特定人连续中文语音基础上。整个系统包括：交互设计器、交互执行器、平台抽象库、交互插件、平台API核心库五个部分：交互设计器中提出了一种全新的交互设计方法，通过直观的操作就可以完成整个交互的设计；交互执行器用来解释执行交互脚本；交互插件用于扩展已有交互平台抽象库的功能和增加一些特殊应用；平台抽象库用于实现多平台的可移植性和与具体平台的独立性；平台API核心库通过封装具体平台操作系统的API，方便可被平台抽象库调用。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别与交互系统及方法
本专利技术涉及一种语音识别技术，尤其涉及一种语音词库的保存和扩展的方法，以及通过语音进行交互的系统。
技术介绍
让机器听懂人的语言一直是人类的梦想，让机器听懂中国话更是中国人的梦想。世界上众多的从事信息产业的公司都展示了各自的语音识别技术，尽管实现方式各不相同，但有一点却是大家相同的，那就是全都是基于言语产生模型(Speech Generation Model)的。如各种模板匹配(LPC，复倒谱等)，多模板聚类，隐含马尔可夫链，神经网络模型等等。但恰恰正是基于言语产生模型的语音识别技术，囿于模型本身的缺陷，而没有可能取得最终的成功。因为，既然是基于言语产生模型，那么每个人的语音就必然具有各自独特的声学特征和参数，甚至在不同语境下同一人的话音，其声学特征也会产生明显的变化。因此，基于言语产生模型的语音识别技术天生是“认人的”，使用前的训练必不可少，而且仍不能保证有很高的正确识别率。这离语音识别技术“不认人”的要求相去甚远。不过，在目前尚没有揭示言语模式感知模型(Speech PatterPerception Model)的机制之前，运用言语产生模型亦实属权宜之计和无奈之举。国外虽然有许多语音识别技术，但经过研究实测，运用到中文语音识别效果都不是很好。因此，有必要提供一种新的语音识别的方法，来更高效地进行语音识别，并可以进一步发展基于语音识别的语音交互系统。
技术实现思路
本专利技术的目的在于提供一种能够高效识别语音的语音识别方法。本专利技术的另一目的在于提供一种用于语音识别的语音词库记录方法，其占用的存储空间...

【技术保护点】
１．一种语音识别方法，其特征在于，其包括如下步骤：对语音波形特征进行分析，提取出所述语音对应的音素信息，将所述语音的音素信息转换为拼音或音标信息，通过匹配算法在语音词库中查找与所述拼音或音标信息匹配的文字，完成语音识别的过程。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘兆鹏，
申请(专利权)人：无锡大核科技有限公司，刘兆鹏，
类型：发明
国别省市：32

全部详细技术资料下载我是这个专利的主人