一种语音虚拟键盘用户指令词库的构建方法技术

技术编号：3046351 阅读：455 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种通过少量词汇的精确识别（语音虚拟键盘）和多次交互来实现语音输入和控制的方法。本发明专利技术使用由少量词语如数字０－９以及“是”、“否”词语构成的数量极少的指令词库数据库。当计算机模糊或精确检索到用户语音输入的目标命令后，利用指令词库内的键元素排序输出检索结果供用户选择或确认，然后高精度匹配用户的选择或确认的指令词，实现交互控制。本发明专利技术可应用于汽车导航、过程控制等领域，替代键盘等输入设备。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术公开了一种通过少量词汇的精确识别(语音虚拟键盘)和多次交互来实现低速率高精度语音输入和语音控制的方法。本专利技术属于计算机多媒体信息输入和控制领域，尤其是通过语音信息来实施控制的多媒体
随着计算机技术的不断发展，语音输入技术及其处理技术已经被广泛地应用到了社会生活的各个方面。但是由于语音输入有非常多不确定性和复杂性，现在的计算机系统还难以满足对语音分辨的准确性的要求，尤其是用于实时控制的、计算处理能力并不是十分强大的计算机系统，因此语音输入更多地用于语音转换和保存、传输等不需要解析语音含义的领域，相对而言语音用于人机交互控制领域，其语音解析的准确性是目前的主要问题。现有技术的解决方法，主要是通过多次学习使用者的对于每一个音节的发信特征，来提高系统对使用者的语音解析的准确性。但是这种方法存在着三个问题难以解决第一是应用前需要事先学习，即使用者需要多次反复朗读全部标准语音表，供给计算机系统解析并构建使用者的发音数据库，甚至需要采集使用者在不同的环境、健康状况等条件下的发音特征，才能构建比较完整的数据库，这无疑大大增加了使用者使用的难度，使这种最简单的控制方式变得非常复杂，大大地限制了语音控制的普及使用；第二是要求计算机系统的软件要有很强的智能性，即使在使用者的发音都能够被准确解析、辨认的条件下，还能够通过前后文的联系来准确分辨同音多意的词组或者语句，因而不仅要求计算机系统具有十分强大的数据处理和运算能力，还要有非常智能化的软件的支持；第三是由于前两点，现有语音输入还是针对专有使用者，还不能使用到口音纷繁的公众场合。如果再把这些要求联合起...

【技术保护点】
一种构建用于交互控制的语音虚拟键盘的方法，该方法包含有以下步骤：Ａ．设定该语音虚拟键盘的键元素内容和数量，并按照一定的方式编码排列；Ｂ．按照上述编码排列顺序选定每一个键元素，并使用某种能被使用者明确感知的方式，提示依次使用者朗读每个键元素；Ｃ．计算机系统对于所接收到的、使用者对应于每个键元素的发音进行解析，并将解析得到的结果，存储到计算机系统内非易失性存储器内的特定空间内，并将该解析结果与所对应的键元素相关联；Ｄ．当全部键元素全部被使用者朗读达到设定的次数之后，计算机系统对全部的发音解析结果进行整理，构成一个对应于该使用者的键元素数据库，即该虚拟语音键盘的用户指令词库。

【技术特征摘要】
1.一种构建用于交互控制的语音虚拟键盘的方法，该方法包含有以下步骤A.设定该语音虚拟键盘的键元素内容和数量，并按照一定的方式编码排列；B.按照上述编码排列顺序选定每一个键元素，并使用某种能被使用者明确感知的方式，提示依次使用者朗读每个键元素；C.计算机系统对于所接收到的、使用者对应于每个键元素的发音进行解析，并将解析得到的结果，存储到计算机系统内非易失性存储器内的特定空间内，并将该解析结果与所对应的键元素相关联；D.当全部键元素全部被使用者朗读达到设定的次数之后，计算机系统对全部的发音解析结果进行整理，构成一个对应于该使用者的键元素数据库，即该虚拟语音键盘的用户指令词库。2.权利要求1所述的构建语音虚拟键盘的方法，在步骤B、C中还包含以下步骤E.当计算机系统选定某个键元素要求使用者朗读时，多次提示用户重复朗读该键元素；与此相对应，计算机系统多次解析使用者的有效发音，并将每个解析结果都与该键元素相关联。3.权利要求2所述的构建语音虚拟键盘的方法，在步骤D中还包含以下步骤F.计算机系统将上述与某个键元素相关联的解析结果再次进行解析，找到该使用者朗读某个键元素的发音的、具有普遍意义的特征值；并用这个普遍意义的特征值作为该键元素的相关数据来构建键元素数据库。4.一种用于交互控制的语音虚拟键盘的使用方法，应用在以计算机为控制核心的系统上，该计算机系统上已经构建了与特定的使用者相对应的语音虚拟键盘，并且包含有与同一使用者相对应的语音数据库，以及与控制目的或对象相关的目标数据库；该使用方法包含有如下步骤A.启动语音交互控制功能；B.使用者朗读与被控制对象或者目的相关的关键词；C.计算机系统解析用户的发音，然后在与使用者对应的语音数据库中搜索、比较，得到与该使用者的关键词发音相对应的数据代码；D.用上述代码为标的搜索所述的目标数据库；E.判断是否得到相符合的结果如果搜索得到了相关的数据，继续执行步骤E，如果没有搜索得到相关数据，则跳转执行步骤H；F....

【专利技术属性】
技术研发人员：刘新斌，
申请(专利权)人：刘新斌，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人