当前位置: 首页 > 专利查询>刘新斌专利>正文

一种用于交互控制的语音虚拟键盘的使用方法技术

技术编号:3910348 阅读:429 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种用于交互控制的语音虚拟键盘的使用方法,这种使用方法通过“给出一组相关结果供用户选择”的方式来实现交互控制,因此不再要求计算机系统高速运行进行一次到位的精确的解析,这一方面降低了对计算机系统软硬件配置的要求而降低了系统的成本、容易普及推广。

【技术实现步骤摘要】

本专利技术属于计算机多媒体信息输入和控制领域,具体涉及一种用于交互控制的语音虛拟键盘的使用方法。
技术介绍
随着计算机技术的不断发展,语音输入技术及其处理技术已经被广泛地应用到了社会生活的各个方面。但是由于语音输入有非常多不确定性和复杂性,现在的计算机系统还难以满足对语音分辨的准确性的要求,尤其是用于实时控制的、计算处理能力并不是十分强大的计算机系统,因此语音输入更多地用于语音转换和保存、传输等不需要解析语音含义的领域,相对而言语音用于人机交互控制领域,其语音解析的准确性是目前的主要问题。现有技术的解决方法,主要是通过多次学习用户的对于每一个音节的发信特征,来提高系统对用户的语音解析的准确性。但是这种方法存在着三个问题难以解决第一是应用前需要事先学习,即用户需要多次反复朗读全部标准语音表,供给计算机系统解析并构建用户的发音数据库,甚至需要采集用户在不同的环境、健康状况等条件下的发音特征,才能构建比较完整的数据库,这无疑大大增加了用户使用的难度,使这种最简单的控制方式变得非常复杂,大大地限制了语音控制的普及使用;第二是要求计算机系统的软件要有很强的智能性,即使在用户的发音都能够被准确解析、辨认的条件下,还能够通过前后文的联系来准确分辨同音多意的词组或者语句,因而不仅要求计算机系统具有十分强大的数据处理和运算能力,还要有非常智能化的软件的支持;第三是由于前两点,现有语音输入还是针对专有用户,还不能使用到口音纷繁的公众场合。如果再把这些要求联合起来,除非使用功能强大、结构复杂、造价高昂的专用系统,才有可能实现语音控制,而对于廉价的控制系统,目前几乎无法实现。专
技术实现思路
针对现有技术中存在的问题,本专利技术提供了 一种对计算机系统要求低的语音虛拟键盘的使用方法,所述使用方法应用在以计算机为控制核心的4系统上,在所述计算机系统上已经构建了与特定的用户相对应的语音虚拟键盘,并且包含有与同一用户相对应的语音数据库,以及与控制目的或对象相关的目标数据库;该使用方法包含有如下步骤A. 启动语音交互控制功能,用户朗读与被控制对象或者目的相关的关键词;B. 计算机系统解析用户的发音,然后在与用户所对应的语音数据库中搜索、比较,得到与该用户的关键词发音相对应的数据代码并根据所得到的数据代码为标的搜索所述目标数据库;C. 判断是否得到相符合的结果如果搜索得到了相关的数据,继续执行步骤D,如果没有搜索得到相关数据,则跳转执行步骤F;D. 再次模糊解析用户输入的关键词,计算机系统解析用户的发音,然后在与用户对应的语音数据库中搜索、比较,得到与该用户的关键词发音相对应的数据代码并根据所得到的数据代码为标的模糊搜索所述目标数据库;E. 判断步骤D是否有相应的目标数据输出,如果有目标数据输出,则执行步骤F;如无目标数据输出,则跳转执行步骤G;F. 通过某种容易被用户感知的方式,利用语音虚拟键盘内所包含的键元素数据库为标识,按照一定规则或顺序输出搜索结果,判断所获得的搜索结果是否为可供选择的目标数据,如果是相应的目标数据,则用语音方式输出各个相应的目标数据,等待用户语音确认或选择;如果不是相应的目标数据,则执行步骤G;G. 根据系统设定,提示用户重新操作,或者重新设置操作入口,或者终止本次服务;H. 判断是否检测到用户的声音指令,如果检测到了有声音输入,则执行步骤I;如果在一定时间内没有4企测到声音输入,则返回步骤F或步骤G;I. 不断精确解析外部的各种声音输入,将解析结果与用户指令词库即键元素数据库中的用户的发音指令数据相比较,判断输入的声音是否与所述用户指令词库中的某个键元素相匹配,如果匹配,则执行步骤J;如果不匹配,则在一定时间内不响应输入信息,等待用户重新输入声音指令,也可以返回步骤F或步骤G;J.判定用户确认或选择的结果是否是最终目标数据,如果是最终的目标数据,则执行步骤K;如果不是最终目标数据,则进一步搜索目标数据库并将搜索得到的结果返回步骤H再次输出;K.将步骤J所得到的最终目标数据向其它执行机构输出,供系统完成预定任务。进一步的,步骤I中所述的键元素为英文字母。更进一步的,所述英文字母为单音节英文字母。进一步的,步骤I中所述的键元素为数字键和功能键。更进一步的,所述数字键为"0-9",所述功能键为"是"和"否"。更进一步的,步骤F中所述的目标数据数量为一个时,通过所述功能键来确认或否则输出结果。进一步的,在步骤F中还包含有以下步骤添加与所述目标凄t据相关的辅助说明的词语并将所述词语与所述目标数据结合起来 一 同输出。进一步的,在步骤J中插入一个用户干涉的环节,用户可以中断4企索而确认中间目标数据作为可执行的目标。本专利技术所述的这种用于交互语音虚拟键盘的使用方法通过"给出 一组相关结果供用户选择"的方式来实现交互控制,因此不再要求计算机系统高速运行进行一次到位的精确的解析,这一方面降低了对计算机系统软硬件配置的要求而降低了系统的成本、容易普及推广;另一方面也只需要使用者朗读一两遍标准发音表,就能基本上实现用户语音含义的模糊辨认;同时由于虚拟语音键盘中包含的指令的数量很少且发音简单,即使系统要求多次采集使用者在不同情况下的指令发音,也很容易完成,因此使用者使用前的朗读等准备工作量大大减少,最大限度地减轻了使用者的准备工作的时间和强度。附图说明图1为用于交互控制语音虚拟键盘的使用方法的一般工作流程图。具体实施例方式下面结合说明书附图和具体实施方式对本专利技术作进一步的描述。图1为本专利技术所述的一种用于交互控制语音虚拟键盘的使用方法的一般工作流程图,本使用方法就是为用户提供一个选择或者确认输出结果的手段,而这里的输出结果,是根据用户输入的关键词从数据库中检索得到的结果,下面按步骤来说明使用方法。当人机交互功能启动后,系统进入"监听,,步骤101,等待用户输入关键词。当系统接收到用户的语音命令后,首先精确解析用户的语音命令的步骤102,然后将解析的结果与"用户语音数据库"103内保存的用户语音相比较,得到与用户语音关键词中发音相对应的命令代码,最后再使用这个命令代码作为标的,搜索目标数据库104,检索到与用户的发音相对应的单词。然后,进入判断步骤105,判断是否得到检索结果如果得到了相应的目标数据,就跳转到步骤108,并通过步骤109添加上适当的辅助说明语音后输出,供用户选择多个结果输出或者确认单一结果输出。如果输出的单个目标数据,就提示用户使用"语音虚拟键盘"中的功能键来确认或者否认输出结果;如果是多个目标数据,则使用"语音虚拟键盘"中的数字键等能够体现一定顺序的键元素添加;在每个输出结果前面,供用户选择。这早的辅助说明词语的作用是让用户更容易理解输出的内容。例如在汽车导航系统中,可以添加上"请您确认您想去的地方是不是,,、"请您从下列目标中选择你想去的目的地,,等词语。如果没有检索到目标结果,则进入步骤106,再次模糊解析用户输入的关键词,然后采用与步骤102相同的方法,再次检索数据库103,得到相对应的命令代码后模糊检索目标数据库104,得到与用户输入的关键词相对应的目标数据。但是这个步骤要求系统要具备一定的智能,不仅能够检索到与用户的发音相对应的单词,还应该在找不到完整的对应目标数据的时候,能够把与用户的发音相对应的一些零散本文档来自技高网
...

【技术保护点】
一种用于交互控制的语音虚拟键盘的使用方法,应用在以计算机为控制核心的系统上,在所述计算机系统上已经构建了与特定的用户相对应的语音虚拟键盘,并且包含有与同一用户相对应的语音数据库,以及与控制目的或对象相关的目标数据库,该使用方法包含有如下步骤: A.启动语音交互控制功能,用户朗读与被控制对象或者目的相关的关键词; B.计算机系统解析用户的发音,然后在与用户所对应的语音数据库中搜索、比较,得到与该用户的关键词发音相对应的数据代码并根据所得到的数据代码为标的搜索所述目标 数据库; C.判断是否得到相符合的结果:如果搜索得到了相关的数据,继续执行步骤D,如果没有搜索得到相关数据,则跳转执行步骤F; D.再次模糊解析用户输入的关键词,计算机系统解析用户的发音,然后在与用户对应的语音数据库中搜索、比较 ,得到与该用户的关键词发音相对应的数据代码并根据所得到的数据代码为标的模糊搜索所述目标数据库; E.判断步骤D是否有相应的目标数据输出,如果有目标数据输出,则执行步骤F;如无目标数据输出,则跳转执行步骤G; F.通过某种容易被用 户感知的方式,利用语音虚拟键盘内所包含的键元素数据库为标识,按照一定规则或顺序输出搜索结果,判断所获得的搜索结果是否为可供选择的目标数据,如果是相应的目标数据,则用语音方式输出各个相应的目标数据,等待用户语音确认或选择;如果不是相应的目标数据,则执行步骤G; G.根据系统设定,提示用户重新操作,或者重新设置操作入口,或者终止本次服务; H.判断是否检测到用户的声音指令,如果检测到了有声音输入,则执行步骤I;如果在一定时间内没有检测到声音输入,则返回步骤F或步骤G;  I.不断精确解析外部的各种声音输入,将解析结果与用户指令词库即键元素数据库中的用户的发音指令数据相比较,判断输入的声音是否与所述用户指令词库中的某个键元素相匹配,如果匹配,则执行步骤J;如果不匹配,则在一定时间内不响应输入信息,等待 用户重新输入声音指令,也可以返回步骤F或步骤G; J.判定用户确认或选择的结果是否是最终目标数据,如果是最终的目标数据,则执行步骤K;如果不是最终目标数据,则进一步搜索目标数据库并将搜索得到的结果返回步骤H再次输出; K.将步骤 J所得到的最终目标数据向其它执行机构输出,供系统完成预定任务。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘新斌
申请(专利权)人:刘新斌
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利