一种人机语音图形交互系统及方法技术方案

技术编号:17707371 阅读:160 留言:0更新日期:2018-04-14 19:36
本发明专利技术公开了一种人机语音图形交互系统及方法,该系统包括声音采集模块、语音处理模块以及动态表情反馈模块;声音采集模块,用于获取用户输入的音频信号;语音处理模块,与声音采集模块连接,用于对获取的音频信号进行滤波、降噪、转换处理,输出有效文字信号;动态表情反馈模块,与语音处理模块连接,用于接收有效文字信号,并根据有效文字信号反馈相应的动态图形。因此,采用本发明专利技术提供系统或方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的音频信息提取与辨别,输出有效文字信号,并根据有效文字信号以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。

【技术实现步骤摘要】
一种人机语音图形交互系统及方法
本专利技术涉及智能控制与人机交互领域,特别涉及一种人机语音图形交互系统及方法。
技术介绍
随着人类社会的发展和人类生活质量水平的提高,对智能机器人与用户之间的交互形式要求不断提高,一种更智能化、更和谐化的人机交互系统的需求愈发迫切。目前,大多数人机交互系统的语音识别成功率特别低,无法在嘈杂环境或者用户语音命令表达略模糊时做出准确的信息提取与辨别,处理语音指令的能力非常有限。此外,人机交互系统的回馈机制,呈现形式过于单一,用户的互动体验感不强。因此,现有的人机交互系统有待改善与提高。
技术实现思路
本专利技术目的是提供一种人机语音图形交互系统及方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的信息提取与辨别,输出语音指令,并根据语音指令以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。为实现上述目的,本专利技术提供了如下方案:一种人机语音图形交互系统,所述人机语音图形交互系统包括声音采集模块、语音处理模块以及动态表情反馈模块;所述声音采集模块,用于获取用户输入的音频信号;所述语音处理模块,与所述声音采集模块连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号;所述动态表情反馈模块,与所述语音处理模块连接,用于接收所述有效文字信号,并根据所述有效文字信号反馈相应的动态图形。可选的,所述声音采集模块包括:麦克风接口和外部声道接口;所述麦克风接口用于直接获取用户输入的音频信号;所述外部声道接口用于获取外部声源部件输入的音频信号。可选的,所述语音处理模块包括:无源低通滤波电路、主控芯片、低功率音频运算放大器以及音频转化芯片;所述低功率音频运算放大器与所述无源低通滤波电路、所述主控芯片、所述音频转化芯片均连接;所述主控芯片还与所述音频转化芯片连接;所述无源低通滤波电路还与所述声音采集模块连接;所述主控芯片的型号为AT89S51;所述音频数字转换芯片型号为TLV5580;其中,所述主控芯片包括相等声波产生单元、词汇存储库以及控制单元;所述相等声波产生单元用于产生与所述音频信号振幅相同,相位差180度的相等声波;所述词汇存储库内存储有效词汇和无效词汇;所述无源低通滤波电路用于对获取的所述音频信号进行滤波处理,得到滤波后的音频信号;所述低功率音频运算放大器用于根据所述相等声波,中和所述滤波后的音频信号的噪声,得到声音信号;所述音频转化芯片用于将所述声音信号转化为文字信号;所述控制单元用于根据所述文字信号和所述词汇存储库,剔除无效文字信号,保留有效文字信号。可选的,所述语音处理模块还包括通信串口;所述通信串口与所述语音处理模块、所述动态表情反馈模块均连接,用于将所述有效文字信号传送至所述动态表情反馈模块。可选的,所述动态表情反馈模块具体为显示屏;所述显示屏内置AndroidStudio程序、表情素材存储库以及分类器;通过所述AndroidStudio程序中的python中的serial库的调用进行串口通信获取所述有效文字信号,并根据所述有效文字信号和所述表情素材存储库,调取所述分类器进行表情素材的选择,再使用所述AndroidStudio程序中的pillow库提取所述有效文字信号对应的表情素材,逐帧呈现为动态图形。可选的,所述人机语音图形交互系统还包括外壳、辅助金属元件;所述外壳的材料为阻尼材料;所述辅助金属元件的外部涂层材料为阻尼涂料。可选的,所述人机语音图形交互系统还包括通讯指示灯;所述通讯指示灯与所述动态表情反馈模块连接,用于显示所述动态表情反馈模块的工作状态。本专利技术还提供了一种人机语音图形交互方法,所述人机语音图形交互方法应用于所述的人机语音图形交互系统,所述人机语音图形交互方法包括:获取用户输入的音频信号;根据用户输入的所述音频信号,确定有效文字;将所述有效文字与预先存储的关键词进行匹配,确定所述有效文字的预置值;所述关键词与所述预置值一一对应;根据所述预置值和预先存储的表情素材,确定所述音频信号对应的动态图形;所述预置值还与所述预先存储的表情素材一一对应。可选的,所述根据用户输入的所述音频信号,确定有效文字,具体包括:对用户输入的所述音频信号进行滤波、降噪,得到声音信号;将所述声音信号转化为文字信号,并根据所述文字信号和词汇存储库,剔除无效文字,保留有效文字。可选的,在根据所述预置值和预先存储的表情素材,确定所述音频信号对应的动态图形之前,还包括:判断动态表情反馈模块是否接收到所述预置值,得到第一判断结果;若所述第一判断结果表示所述动态表情模块接收到所述预置值,则输出通讯指示灯闪亮指令和所述预置值对应的动态图形;若所述第一判断结果表示所述动态表情模块未接收到所述预置值,则输出所述通讯指示灯长闪亮指令,并返回将所述有效文字与预先存储的词汇进行匹配确定所述有效文字的预置值的步骤。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术公开了一种人机语音图形交互系统及方法,该系统包括声音采集模块、语音处理模块以及动态表情反馈模块;所述声音采集模块,用于获取用户输入的音频信号;所述语音处理模块,与所述声音采集模块连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号;所述动态表情反馈模块,与所述语音处理模块连接,用于接收所述有效文字信号,并根据所述有效文字信号反馈相应的动态图形。因此,采用本专利技术提供系统或方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的音频信息提取与辨别,输出有效文字信号,并根据有效文字信号以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例人机语音图形交互系统的结构示意图;图2为本专利技术实施例人机语音图形交互系统的平面结构示意图;图3为本专利技术实施例人机语音图形交互系统的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术目的是提供一种人机语音图形交互系统及方法,能够在嘈杂环境或者用户语音命令表达略模糊时做出准确的信息提取与辨别,输出语音指令,并根据语音指令以图形形式反馈与用户,避免呈现形式单一,提高用户的互动体验感。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例人机语音图形交互系统的结构示意图,如图1所示,本专利技术提供的人机语音图形交互系统包括声音采集模块1、语音处理模块2以及动态表情反馈模块3。所述声音采集模块1,用于获取用户输入的音频信号。所述语音处理模块2,与所述声音采集模块1连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号。所述动态表情反馈模块3,与所述语音处理模块2连接,用于接收所述有效本文档来自技高网...
一种人机语音图形交互系统及方法

【技术保护点】
一种人机语音图形交互系统,其特征在于,所述人机语音图形交互系统包括声音采集模块、语音处理模块以及动态表情反馈模块;所述声音采集模块,用于获取用户输入的音频信号;所述语音处理模块,与所述声音采集模块连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号;所述动态表情反馈模块,与所述语音处理模块连接,用于接收所述有效文字信号,并根据所述有效文字信号反馈相应的动态图形。

【技术特征摘要】
1.一种人机语音图形交互系统,其特征在于,所述人机语音图形交互系统包括声音采集模块、语音处理模块以及动态表情反馈模块;所述声音采集模块,用于获取用户输入的音频信号;所述语音处理模块,与所述声音采集模块连接,用于对获取的所述音频信号进行滤波、降噪、转换处理,输出有效文字信号;所述动态表情反馈模块,与所述语音处理模块连接,用于接收所述有效文字信号,并根据所述有效文字信号反馈相应的动态图形。2.根据权利要求1所述的人机语音图形交互系统,其特征在于,所述声音采集模块包括:麦克风接口和外部声道接口;所述麦克风接口用于直接获取用户输入的音频信号;所述外部声道接口用于获取外部声源部件输入的音频信号。3.根据权利要求1所述的人机语音图形交互系统,其特征在于,所述语音处理模块包括:无源低通滤波电路、主控芯片、低功率音频运算放大器以及音频转化芯片;所述低功率音频运算放大器与所述无源低通滤波电路、所述主控芯片、所述音频转化芯片均连接;所述主控芯片还与所述音频转化芯片连接;所述无源低通滤波电路还与所述声音采集模块连接;所述主控芯片的型号为AT89S51;所述音频数字转换芯片型号为TLV5580;其中,所述主控芯片包括相等声波产生单元、词汇存储库以及控制单元;所述相等声波产生单元用于产生与所述音频信号振幅相同、相位差180度的相等声波;所述词汇存储库内存储有效词汇和无效词汇;所述无源低通滤波电路用于对获取的所述音频信号进行滤波处理,得到滤波后的音频信号;所述低功率音频运算放大器用于根据所述相等声波,中和所述滤波后的音频信号的噪声,得到声音信号;所述音频转化芯片用于将所述声音信号转化为文字信号;所述控制单元用于根据所述文字信号和所述词汇存储库,剔除无效文字信号,保留有效文字信号。4.根据权利要求3所述的人机语音图形交互系统,其特征在于,所述语音处理模块还包括通信串口;所述通信串口与所述语音处理模块、所述动态表情反馈模块均连接,用于将所述有效文字信号传送至所述动态表情反馈模块。5.根据权利要求1所述的人机语音图形交互系统,其特征在于,所述动态表情反馈模块具体为显示屏;所述显示屏内置AndroidStudio程序、表情素材存储库以及分...

【专利技术属性】
技术研发人员:左国玉潘婷婷郑涛陈珂鑫
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1