计算机实现的语音识别系统训练技术方案

技术编号:3046959 阅读:202 留言:0更新日期:2012-04-11 18:40
计算机实现的语音系统训练,包括,显示一个代表某一概念的图标,提示用户进行包含了被用户确定要与所述图标关联的由任何声音组成的发声,确定发声和图标的关联,把发声和图标的关联保存到计算机可读的介质中。本发明专利技术特别适用于但并不局限于包括车轮定位或者车辆引擎诊断在内的车辆诊断领域。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
专利技术
技术介绍
领域本专利技术涉及训练语音识别系统,更具体地说,本专利技术涉及用于把用户选定的发声和由图标代表的概念关联起来的计算机实现的语音识别系统训练。例如,语音识别系统用在制造、修理、航空以及医疗应用中,在这些应用中它对于用户在执行其它可由计算机控制的机器或者设备执行的手工任务的同时腾出他或她的手来执行手工任务是很重要的。使用麦克风,执行第一任务的用户可控制一个或者多个指定的系统而不必转移时间和/或注意力来专门执行每个额外的任务。这种类型的系统用在自动化应用中允许用户控制连接到计算机上的诸如起重机或者千斤顶之类的设备。这种类型的系统还用在车轮定位处理中,提供反馈和传感器数据以指导用户进行必需的调整从而使得车辆符合指定的定位值。传统的软件应用程序,包括语音识别应用程序,越来越多的把图标作为概念或者预定程序指令集合的图形化速记符。从而,用户可知道当单击或者选择某图标时将发生预定的事件或者事件序列。紧靠图标常常有一个标签或者文本框以进一步说明图标所描述概念的意思。标签或者文本框在语音识别应用程序特别重要,其中必须训练软件和计算机以把用户的口头命令和所需的图标关联起来。通常,用户要重复图标附近显示的特定单词或语句,不管是软件实际需要还是仅仅是为了避免混淆。例如,对于标签附近“save(保存)”的具有软盘外形的图标,用户将训练软件识别用户的“save”发声。从而,避免用户使用可能带来给该用户更多意义或者意思的其它发声或者语句,随着图标所描述概念的内容变得越来越抽象并且越来越难于定义,这个问题变得更加重要。此外,这些语音识别系统对外国语言的适应也是让人担忧的问题,这需要对软件的显示以及有关的语言数据库进行修改从而增加了系统的额外花费和复杂度。如果没有某个语言数据库(例如日语),那么对基本语言(例如英语)不完全精通的人可能就很难理解和/或读出参考单词并因此影响生产率。特别地随着相关联的短语和任务变得越来越复杂,对非母语讲话者来说参考单词也可能会对其记忆力形成挑战从而进一步影响生产率。在极端的情况下,人们可能不精通阅读他们自己的本国语言或者有发音障碍,这对训练和实现主要基于特定单词和相应行为对应关系的语音识别控制系统设置了更多的障碍。即使没有这些困难,把所需效果或者结果和外部强加的效果或者结果的定义关联起来也并不总是很容易。换言之,软件设计者对操作或者操作序列的定义或者速记概念可能并不和用户基于自己的体验对同一操作或者操作序列产生的内在定义完全对应。因此,可能存在用户不能想起特定软件所利用关系的记忆不符的情况,从而需要用户从手头的任务转移不必要的注意力。因此,需要训练对语言基本不敏感并适应单个用户的语音识别系统。在一个方面中,用于训练计算机实现的语音识别系统的方法包括显示代表一个概念的图标,并提示用户发出自己决定与该图标相关联的声音。该方法还包括确认该次发声和该图标的关联,并把该次发声和该图标的关联保存到计算机可读的介质中。在另外一个方面中,计算机可读介质具有使计算机可把用户发出的声音和用户选定的与一个图标相关联的概念关联起来的指令,这里声音可包括用户想和图标关联的任何声音或者声音的组合。这些指令把用户的声音和与选定的图标相关联的概念或者指令集关联起来。然后,存储声音以及声音与图标的概念之间的关系。还有指令把后来的用户声音和存储的声音相比较以确定后来的声音是否和存储的声音相对应。如果相对应,就用存储的声音和图标概念之间的关系来执行和所确定的图标对应的指令集。在又一个方面中,基于计算机的车辆诊断系统包括一个语音识别程序产品,其与计算机处理器一起处理由诸如麦克风之类的语音到信号变换器提供给处理器的信号,并把显示器上显示的图标所代表的概念和用户确定的声音相关联。根据下面的详细介绍以及附图,本专利技术的这些以及其它特征和优点对本领域一般技术人员来说是很明显的。附图简述附图说明图1是描述要在其上实现本专利技术实施例的计算机系统的框图;图2是根据本专利技术方法的框图;图3所显示的代表了图2中方法的一个步骤;图4(a)-4(e)所显示的代表了图2中其它步骤的显示;图5描述了包含多个代表不同概念的图标;图6示意性地表示了一个结合本专利技术语音识别系统训练的车轮定位系统。专利技术详述说话者注册到语音识别软件中并对其训练使得用户能有效地执行多项任务,不必从手头上的任务转移过多的时间或者注意力就可用语音命令输入数据、接收数据并通过计算机操作设备。例如,在操作车轮定位器时,采用本领域普通技术人员公知的方式把利用从传感器得到的测量值所计算出的定位值和根据车辆的规格所需的定位值进行比较。根据这里描述的方法和系统,一个计算机实现的语音识别系统把用户选择的发声和显示到显示器上的图标所代表的概念关联起来。图1是描述在其上实现本专利技术实施例的计算机系统100的框图。计算机系统100包括总线102或者其它用来传递信息的通信机制,以及连接到总线102用来处理信息的一个或者多个处理器104。计算机系统100还包括一个连接到总线102用来存储信息和处理器104要执行指令的主存储器106,例如随机存取存储器(RAM)或者其它动态存储设备。主存储器106还可用来存储临时变量或者其它在处理器104执行指令期间的中间信息。计算机系统100还包括一个连接到总线102用来为处理器104存储静态信息和指令的只读存储器(ROM)108或者其它静态存储设备。还提供连接到总线102用来存储信息和指令的存储设备110,例如磁盘或者光盘。计算机系统100可通过总线102连接到诸如阴极射线管(CRT)之类的显示器112上以向计算机用户显示信息。包括字母键以及其它键在内的输入设备114连接到总线102上用来向处理器104传递选择的信息和命令。另外一种类型的输入设备是诸如鼠标、轨迹球或者光标方向键之类的光标控制件116,用来向处理器104传递选择的方向信息和命令并控制光标在显示器112上移动。这种输入设备通常具有允许设备确定平面上位置的第一个轴(例如x)和第二个轴(例如y)这两个轴上的两个自由度。计算机系统100用来训练语音识别系统将用户所选择的发声和计算机系统显示的图标所代表的概念关联起来。与之一致,计算机系统100向应执行包含在主存储器106中的一个或者多个指令的一个或者多个序列的处理器104,提供训练语音识别系统把用户所选择的发声和图标所代表的概念关联起来。可从诸如存储设备110之类的其它计算机可读的介质把这些指令读进主存储器106。执行包含在主存储器106中的指令序列将导致处理器104执行这里描述的处理步骤。还可用多处理装置中的一个或者多个处理器来执行包含在主存储器106中的指令序列。在可选的实施例中,可用硬连线电路来代替软件指令或者和软件指令一起使用,可以理解不需要硬件电路和软件的特定组合。这些指令可以任何形式提供,比如源代码、汇编代码、对象代码、机器语言、上述形式的压缩或者加密版本以及它们的任何及所有等价形式。“计算机可读介质”是指参与向处理器104提供要执行的指令的任何介质,“程序产品”是指含有计算机可执行程序的那些计算机可读介质。计算机可用介质也可称之为“含有”指令,它包括指令和计算机可用介质关联的所有的方式。计算机可读介质包括,但不仅限于,稳定介质、不稳定介质以及传输介质。例如,稳本文档来自技高网...

【技术保护点】
一种用于训练计算机实现的语音识别系统的方法,包括: (a)显示代表一个概念的图标; (b)提示用户进行包含了被用户确定要与所述图标关联的任何声音的发声; (c)确认所述发声和所述图标的关联;以及 (d)把发声和图标的所述关联保存到计算机可读介质中。

【技术特征摘要】
US 2000-9-1 09/653,9891.一种用于训练计算机实现的语音识别系统的方法,包括(a)显示代表一个概念的图标;(b)提示用户进行包含了被用户确定要与所述图标关联的任何声音的发声;(c)确认所述发声和所述图标的关联;以及(d)把发声和图标的所述关联保存到计算机可读介质中。2.如权利要求1所述的用于训练计算机实现的语音识别系统的方法,其特征在于,所述图标代表一个与车辆诊断相关的概念。3.如权利要求2所述的用于训练计算机实现的语音识别系统的方法,其特征在于,所述图标代表一个与车轮定位相关的概念。4.如权利要求1所述的用于训练计算机实现的语音识别系统的方法,其特征在于,所述确认步骤还包括提示用户重复发声。5.如权利要求4所述的用于训练计算机实现的语音识别系统的方法,还包括(e)提示用户重复与图标相关联的发声;(f)将重复的发声与多个存储的发声相比较来确定相关联的图标;以及(g)显示被确定的图标。6.如权利要求1所述的用于训练计算机实现的语音识别系统的方法,其特征在于,发声是一个单词或者多个单词。7.一种计算机可读介质,包含使得具有至少一个处理器的计算机能将用户发出的声音和与选定图标相关联的概念关联起来的指令,这些指令在被计算机执行时导致计算机执行下面的步骤将用户发出的声音和与选定图标相关联的概念关联起来;以及存储用户发出的声音以及存储的声音和与选定图标相关联概念之间的关系,其中用户发出的声音可包括任何声音或者声音的组合。8.如权利要求7所述的包含指令的计算机可读介质,其特征在于,还安排指令使得计算机执行下面的步骤把用户后来发出的声音和存储的声音相比较以确定后来的声音是否和存储的声音相对应;以及根据存储声音和后来声音之间的对应确定与存储声音相关联的概念。9.如权利要求8所述的包含指令...

【专利技术属性】
技术研发人员:唐纳德L瓦尔楚克斯蒂芬里格斯比
申请(专利权)人:捷装技术公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利