一种数字电视语音识别人机交互系统及方法技术方案

技术编号：5277566 阅读：320 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种数字电视语音识别人机交互系统及方法，系统包括目标语音采集模块、语音分析模块、语义计算模块以及智能控制模块；所述目标语音采集模块包括信号放大模块、向前滤波模块、信号采样模块，数据压缩编码模块；所述语音分析模块包括噪声去除模块、特征提取模块、解码模块；方法包括目标语音采集、语音噪声消除、语音识别处理、命令识别转换、智能控制处理过程；本发明专利技术通过各模块的协同工作，完成对数字家庭生后的数字电视混响声学环境下的抗干扰语音智能识别和语音分析与互动的数字电视人机交互技术，提供先进的数字电视语音语言交互方式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理和语义识别
，以及计算机智能分析、处理并采集语音的技术，具体涉及。
技术介绍
语音识别技术主要是让机器通过识别和理解把语音信号变成相应的文本或者命令的技术。语音识别技术通过语音的采集输入，提取出语音的特征，再运用模型数据库的语音信息特征进行模式匹配，得到语音所包含的信息转换为文字或者命令。根据语音识别的对象不同，在语音识别人物中大体可分为孤立词识别、关键词识别和连续语音识别三类。孤立语音识别运用在识别事先已知的词汇，关键词识别运用在连续的语音当中，但是它并不识别全部文字，而只检测已知的若干关键词的出现，连续语音识别用于识别连续的一个句子或一段话。在现实家庭生活的数字电视混响声学环境下，噪声所造成的语音识别影响比较大。在现实家庭生活中，语音识别的限制主要在于噪声的影响和互动语音的不规范性和任意性。简单地说，由于噪声对用户的语音采样和输入造成影响，在语音识别中会发生理解错误或者用户语音的丢失。用户互动语音的不规范性和任意性在语音识别中的匹配带来的随机的不确定性，在匹配语音当中可能因为语音的不规范性和任意性和匹配错误造成语音的语语义解错误。解决在家庭生活的数字电视混响声学环境下，在用户互动语音不规范性和任意性的情况下，关键词语音识别对这种环境下的连续语音识别有更好的应用。在用户的连续语音命令中，关键词识别能够匹配出已知的关键词所在的位置，并根据关键词的位置和组合，解释出需要执行的命令。因此，本专利技术提出了，目的在于在数字电视的环境下，提供先进的数字电视语音语言交互方式。
技术实现思路
本专利技术的目的在于...

【技术保护点】
一种数字电视语音识别人机交互系统，其特征在于包括：　　实现语音信息的自动采集，以及模拟的语音信息向数字语音信息的转换的目标语音采集模块；负责处理语音信息，在现实家庭生活的数字电视混响声学环境下提取出有用的语音信息，去除噪声杂音，然后得出语音信息数据，转换成为文字信息的语音分析模块；用于理解语音分析模块得出的文字信息的含义，把语音信息解释为能够被执行的命令的语义计算模块；用于接收语义计算模块的命令，执行命令信息的智能控制模块。

【技术特征摘要】

【专利技术属性】
技术研发人员：罗笑南，刘宁，苏嘉伟，薛凯军，陈健民，
申请(专利权)人：广东中大讯通信息有限公司，东莞市聚川电子科技有限公司，
类型：发明
国别省市：81

全部详细技术资料下载我是这个专利的主人