智能电视语音应答系统及方法技术方案

技术编号:8537360 阅读:194 留言:0更新日期:2013-04-04 22:32
本发明专利技术公开了一种智能电视语音应答系统,包括用户身份特征识别模块,语音命令识别模块,以及智能应答模块;还公开了一种智能电视语音应答方法,包括1)获取用户身份特征;2)语音识别,并根据用户身份特征得出符合用户身份特征的命令;3)根据该命令进行知识库的匹配,得出给用户的应答信息,并将应答信息进行反馈。本发明专利技术的智能电视语音应答系统及方法,能够识别出用户的身份特征,同时能够根据上下文来理解用户的意思,准确的对用户的语音输入给出反馈应答,增加了智能电视语音应答的准确度,为用户省去了多次选择的繁琐步骤,节省了时间,提高了智能电视的使用满意度,使智能电视的操作更加人性化。

【技术实现步骤摘要】

本专利技术涉及智能电视领域,尤其是ー种智能电视语音应答方法及系统。
技术介绍
随着电视的智能化以及智能电视的普及,宽带有线电视网集互联网、多媒体、通讯等技术于一体,向家庭用户提供包括数字电视在内的多种交互式服务。智能电视能够很好地适应当今网络飞速发展的趋势,充分有效地利用网络资源。电视机的智能化伴随着的是电视按键操作的难度和繁琐度也将越来越大。因此将语音识别技术融入智能电视的操作系统中,实现控制命令的语音操作将使用户将双手解放出来,仅靠说话就能轻松的完成操作,这将是智能电视领域发展的方向。 语音识别技术是自2000年至今信息
十大重要的科技发展技术之一。它是ー门交叉学科,正逐步成为信息技术中人机接ロ的关键技术。语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%。这些技术已经能够满足通常应用的要求。由于大規模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别ロ语对话系统查询有关的机票、旅游、银行信息,并且取得很好的結果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。再如专利号为201010255337. 9的专利技术专利公开了ー种基于语音命令的视音频播放方法及系统。涉及媒体播放
,只需按动一启动键,用户对所述终端设备的操作均可通过语音命令来完成。用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,井根据视音频播放地址获取视音频流。该专利技术方案主要应用于娱乐设备,尤其应用于车载娱乐设备。语音识别技术应用于智能电视领域,现有的语音应答系统和方法中,一种是采用服务器模式进行语音识别,语音识别模块在服务器端,也就是说用户发出的每条语音控制命令都需要经机顶盒发送给服务器端进行语音识别,再由服务器将识别出的操作命令交由机顶盒进行执行,这样势必会占用信号传输带宽,増加操作时间,降低语音操作的灵敏度;另ー种是采用嵌入式语音识别模式,将语言识别软件及模型写在智能电视的存储器里,识别过程在終端完成,该模式中智能电视的操作命令较固定,需要识别的词汇量不是很大,不会占用存储器大大的空间,所以嵌入式模式与服务器模式相比识别所需的时间更短,可以使用户更快速的完成操作。随着社会的不断发展,信息量也越来越多。这必然引起人们每天生活在众多信息中,不可能对什么都了解的比较清楚,所以信息查询越来越必要。比如在家里不希望定点通过电视来收看天气,希望随时都能够查询,如果使用PC或者手机进行搜索,有些人会认为比较麻烦,还需要输入。因此希望查询的过程越简单越好,那么智能应答系统是最好的选择。只需要说出你所想要获得的信息,智能应答系统就会回复给你所想要的答案。然而语言所能表述的意思具有开放性的特点,同一个命令在不同语境下表达的意思也不同,并且每个用户的年龄、性别都存在差异,这些因素对同一个命令所想要表达的意思也有较大影响,例如当用户使用“选择电影”的命令时,系统出现电影列表以供用户进ー步选择,而系统不能准确地预测用户可能想要观赏的影片类型,使得电影列表不能优先出现用户该类型的影片,用户不得不在繁杂的列表中继续查找。
技术实现思路
本专利技术的目的是克服现有技术中的缺陷,提供一种可以针对用户语音命令,的智能电视语音应答方法及系统。为解决上述问题,本专利技术的ー种智能电视语音应答系统,包括 用户身份特征识别模块,与语音命令识别模块相连,用于获取用户身份特征,并将获取的身份特征信息发送至语音命令识别模块;语音命令识别模块,与智能应答模块相连,用于接收用户语音,并对语音进行识另IJ,以及根据用户身份特征识别模块发送的用户身份信息进行语义识别,得出符合用户身份特征的命令,并将该命令发送至智能应答模块;智能应答模块,用于接收语音命令识别模块发送的符合用户身份特征的命令,根据该命令进行知识库的匹配,得出给用户的应答信息,并将应答信息进行反馈。所述用户身份特征识别模块,包括图像采集単元,与图像分析単元相连,用于采集用户图像,并将采集到的用户图像发送至图像分析単元;图像分析単元,与语音命令识别模块相连,用于接收图像采集单元发送的用户图像,并对用户图像进行识别分析,得出用户身份特征信息并发送至语音命令识别模块。所述图像分析单元,包括基于人脸识别的年龄判断単元,用于对用户的人脸图像进行识别分析,得出用户的年龄信息。所述图像分析単元,包括基于人脸识别的性别判断単元,用于对用户的人脸图像进行识别分析,得出用户的性别信息。所述语音命令识别模块,包括语音采集単元,与语音分析単元相连,用于采集用户语音信息,并将采集到的语音信息发送至语音分析単元;语音分析単元,与语义分析単元相连,用于接收语音采集单元发送的语音信息,并对语音信息进行分析得出对应该语音对应的文字信息,以及将该文字信息发送至语义分析单元;语义分析単元,分别与用户身份特征识别模块和智能应答模块相连,用于接收语音分析单元发送的文字信息以及用户身份特征识别模块发送的用户身份特征信息,并调取所述文字信息对应的命令库中与用户身份特征信息相匹配的命令发送至智能应答模块。所述智能电视语音应答系统还包括TTS模块,与智能应答模块相连,用于将智能应答模块得出给用户的应答信息由文本格式转化成为音频格式进行输出。ー种智能电视语音应答方法,包括以下步骤I)用户身份特征识别获取用户身份特征,并将获取的身份特征信息发送至语音命令识别模块;2)语音命令识别模块,接收用户语音,对语音进行识别,井根据用户身份特征识别 模块发送的用户身份信息进行语义识别,得出符合用户身份特征的命令,并将该命令发送至智能应答模块;3)智能应答模块接收语音命令识别模块发送的符合用户身份特征的命令,根据该命令进行知识库的匹配,得出给用户的应答信息,并将应答信息进行反馈。所述步骤I包括11)图像采集单元采集用户图像,并将采集到的用户图像发送至图像分析単元;12)图像分析単元接收图像采集单元发送的用户图像,并对用户图像进行识别分析,得出用户身份特征信息并发送至语音命令识别模块。所述步骤12)包括以下步骤121)图片预处理,使用户图像中的人脸位置、大小和图像归一化;122)图片区域划分与训练,将用户图像中人脸进行区域划分,划分为多个识别区域,每个识别区域输出不同的灰度值和ニ值化图像;123)区域脸部特征值模板匹配,每个所述识别区域分离出不同的模板匹配単元,计算每个模板匹配単元与匹配模板的特征值,将所述特征值作为神经网络算法的输入层中的输入神经单元,经过神经网络处理算法,得出最佳匹配度的图片結果;124)将所述图片结果进行脸部加权计算;125)图片识别结果知识库反馈。所述本文档来自技高网
...

【技术保护点】
一种智能电视语音应答系统,其特征在于,包括:用户身份特征识别模块,与语音命令识别模块相连,用于获取用户身份特征,并将获取的身份特征信息发送至语音命令识别模块;语音命令识别模块,与智能应答模块相连,用于接收用户语音,并对语音进行识别,以及根据用户身份特征识别模块发送的身份特征信息进行语义识别,得出符合用户身份特征的命令,并将该命令发送至智能应答模块;智能应答模块,用于接收语音命令识别模块发送的符合用户身份特征的命令,根据该命令进行知识库的匹配,得出给用户的应答信息,并将应答信息进行反馈。

【技术特征摘要】
1.一种智能电视语音应答系统,其特征在于,包括用户身份特征识别模块,与语音命令识别模块相连,用于获取用户身份特征,并将获取的身份特征信息发送至语音命令识别模块;语音命令识别模块,与智能应答模块相连,用于接收用户语音,并对语音进行识别,以及根据用户身份特征识别模块发送的身份特征信息进行语义识别,得出符合用户身份特征的命令,并将该命令发送至智能应答模块;智能应答模块,用于接收语音命令识别模块发送的符合用户身份特征的命令,根据该命令进行知识库的匹配,得出给用户的应答信息,并将应答信息进行反馈。2.如权利要求1所述智能电视语音应答系统,其特征在于,所述用户身份特征识别模块,包括图像采集单元,与图像分析单元相连,用于采集用户图像,并将采集到的用户图像发送至图像分析单元;图像分析单元,与语音命令识别模块相连,用于接收图像采集单元发送的用户图像,并对用户图像进行识别分析,得出用户身份特征信息并发送至语音命令识别模块。3.如权利要求2所述智能电视语音应答系统,其特征在于,所述图像分析单元,包括 基于人脸识别的年龄判断单元,用于对用户的人脸图像进行识别分析,得出用户的年龄信息。4.如权利要求2所述智能电视语音应答系统,其特征在于,所述图像分析单元,包括 基于人脸识别的性别判断单元,用于对用户的人脸图像进行识别分析,得出用户的性别信息。5.如权利要求1所述智能电视语音应答系统,其特征在于,所述语音命令识别模块,包括语音采集单元,与语音分析单元相连,用于采集用户语音信息,并将采集到的语音信息发送至语音分析单元;语音分析单元,与语义分析单元相连,用于接收语音采集单元发送的语音信息,并对语音信息进行分析得出对应该语音对应的文字信息,以及将该文字信息发送至语义分析单元;语义分析单元,分别与用户身份特征识别模块和智能应答模块相连,用于接收语音分析单元发送的文字信息以及用户身份特征识别模块发送的身份特征信息,并调取所述文字信息对应的命令库中与身份特征信息相匹配的命令发送至智能应答模块。6.如权利要求1至5任一项所述智能电视语音应答系统,其特征在于,所述智能电视语音应答系统还包括TTS模块,与智能应答...

【专利技术属性】
技术研发人员:常连城
申请(专利权)人:天津三星电子有限公司三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1