当前位置: 首页 > 专利查询>英特尔公司专利>正文

向语音识别引擎注册言辞以及相关联的目的锚制造技术

技术编号:3046692 阅读:206 留言:0更新日期:2012-04-11 18:40
一种用于通过语音识别引擎注册言辞和相关联的目的锚的方法,所述方法包括:    使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;    对于全部节点的列表中的每个节点而言,    为所述节点获取一个目的锚;    如果目的锚存在,则从所述节点的子节点中以递归方式收集文本,以便形成言辞;以及    通过语音识别引擎注册言辞和目的锚。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及访问万维网,并且特别涉及通过语音识别来访问万维网。
技术介绍
万维网(Web)提供了一个巨大的文档集合,这些文档可以经由因特网来访问。万维网上的很多文档都包含超链接,这些超链接使用户可以跳转到文档内部的其他地方,并使用户可以跳转到其他文档以及其他资源。对万维网文档来说,通用的访问方法是借助一台计算机,所述计算机提供文档的可视显示并且考虑到了用户使用键盘以及诸如鼠标这类定点设备所产生的输入。用户可以使用定点设备来选择超链接并由此使用这些超链接。其他方法也可以用来提供对于万维网文档的访问。特别地,语音识别可以用作一种输入来取代或附加于键盘或定点设备。在缺少或不便使用键盘或鼠标的情况下,语音识别可以允许与基于显示的万维网文档进行有效的交互作用。对那些具有视觉缺陷或者需要在访问万维网的同时能够腾出手和眼睛来处理其他事情的人员来说,这一点是非常有用的。语音识别可能需要使用一个定义有效言辞的语音识别语法来对捕获自用户的言辞进行识别。由于包含在语音识别语法中,因此,诸如“主页”或“后退”这种固定的浏览器命令是很容易识别的。而用于在万维网文档中选择超链接的语法则不像固定命令那样容易定义。由于言辞有可能是不具有更大语境的单字或短语,因此,用于在万维网文档中选择超链接的语音识别可能与其他的语音识别需求不同。万维网文档中的某些超链接可能由图像或图标来表示,而不是由文本来表示。万维网联盟(W3C)正在开发一种语音可扩展标记语言(VoiceXML),以便准许创作那些意图与一个语音浏览器结合使用的万维网文档,其中所述语音浏览器提供一个听觉呈现并且接受语音输入。VoiceXML文档提供了专门设计的信息,以便定义语音识别语法中包含的可允许语音输入。在并未考虑到借助语音输入来选择超链接的需求的情况下,已经创作了数量极大的万维网文档。因此,使一个网络浏览器能对口语言辞做出响应,从而在那些并未创作成定义可允许语音输入的万维网文档中选择超链接,这一点是合乎需要的。
技术实现思路
根据本专利技术的第一方面,提供了一种用于通过语音识别引擎注册言辞和相关联的目的锚的方法,所述方法包括使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;对于全部节点的列表中的每个节点而言,为所述节点获取一个目的锚;如果目的锚存在,则从所述节点的子节点中以递归方式收集文本,以便形成言辞;以及通过语音识别引擎注册言辞和目的锚。根据本专利技术的第二方面,提供了一种一种具有指令序列的计算机可读介质,在由一个处理器执行时,所述指令序列使得处理器执行一种用于通过语音识别引擎注册言辞和相关目的锚的方法,所述方法包括使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;对于全部节点的列表中的每个节点而言,为节点获取一个目的锚;如果目的锚存在,则从节点的子节点中以递归方式收集文本,以便形成言辞;以及通过语音识别引擎注册言辞和目的锚。根据本专利技术的第三方面,提供了一种语音识别系统,包括一个文档分析器,它使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;一个节点分析器,对于全部节点的列表中的每个节点而言,它为节点创建一个目的锚,如果目的锚存在,则从节点的子节点中以递归方式收集文本来形成言辞;以及一个注册引擎,它通过一个有限状态语法控制器注册言辞和目的锚。附图说明图1是关于本专利技术一个实施例的流程图;图2显示了语音导航分析器通过一个语音识别引擎注册超链接的示范性软件例程。图3显示了可以由图2软件例程使用的示范性的getLinkText函数。图4显示了可以由图2软件例程使用的示范性的insertTag函数。图5显示了可以由图2软件例程使用的示范性的getLinkPos函数。图6显示了提供一个黄色背景上具有红色文本的半透明标签的示范性样式。图7是一个示范性的语音识别系统的框图。具体实施例方式为了提供关于本专利技术的全面理解,在以下关于本专利技术的详细描述中阐述了很多特殊细节。然而,对本领域技术人员来说,很明显,可以在不具备这些细节的情况下实施本专利技术。在其他实例中并没有详细描述公知的方法、过程、组件和电路,以免不必要地模糊本专利技术的各个方面。本专利技术包括不同的步骤,以下将对这些步骤进行描述。本专利技术的步骤可以在机器可执行指令中实现,这些指令致使一个以这些指令编程的通用处理器执行所述步骤。作为选择,所述步骤也可以通过硬件或软件的结合来执行。机器可执行指令可以由磁盘、光盘这种计算机可读介质或者电磁波来进行保存和发送。语音导航分析器使用了网络浏览器提供的一个编程接口。所述编程接口可以包括一组对象,这些对象代表的是万维网文档、如何组合这些对象的模型以及一个用于访问和操作这些对象的标准接口。示范性的编程接口是由万维网联盟(W3C)定义的文档对象模型(DOM)。在关于语音导航分析器的描述中,虽然将DOM用于示范性编程接口,然而可以了解的是,网络浏览器提供的不同于DOM的编程接口也可用于实现语音导航分析器。在网络浏览器接收和处理了一个新的万维网文档之后,语音导航分析器将会具有控制权。语音导航分析器可以是网络浏览器的一个插件,它注册一个事件,以使浏览器在接收和处理了一个万维网文档之后把控制权转移给语音导航分析器。语音导航分析器使用浏览器的编程接口来提取新近接收的万维网文档中的所有超链接。语音导航分析器提取和/或创建那些可用于选择超链接的可交谈言辞。并且语音导航分析器向语音识别引擎注册超链接以及可交谈言辞。语音导航分析器可以向万维网文档中的超链接添加可视标签,以便提供一个可用于选择超链接的简明言辞。语音导航分析器注册的信息允许语音识别引擎使用所注册的可交谈言辞而把口语言辞识别为有效语法的全部或是它的一部分。由语音导航分析器注册的信息还使语音识别引擎能够命令浏览器对超链接的选择做出响应,其中所述超链接与语音导航分析器发出的口语言辞相关联。图1是关于本专利技术一个实施例的流程图。浏览器的编程接口被用于获取具有链接10的所有节点的一个列表。对列表中的每个节点依次进行处理,直到处理了所有节点12。所要处理的节点是从列表14中获取的,此外还会检索节点16的HREF属性。由于可以在初始加载了万维网文档之后提供HREF属性,因此超链接节点可以具有一个HREF属性,但是也可以不具有该属性。如果节点不具有HREF属性18,那么关于节点的处理可能会结束,如果存在下一个节点的话,则会对下一个节点进行处理。在其他实施例中,不具有HREF属性的超链接节点可以注册一个空的URI,也可以在向超链接节点添加了HREF属性之后进行注册。如果节点具有HREF属性,则以递归方式检查所述节点的子节点,以便收集那些与链接20相关联的文本或替换文本。并且将会检查双亲节点,以便获取该节点的累计偏移,由此在文档中确定节点的位置22。在到达了指示所述位置是绝对位置的根节点或者到达了一个指示所述位置是相对于一个容器节点的容器(DIV)节点之前,将会接连检查双亲节点。位置信息可以包括x和y偏移,绝对/相对标志以及与偏移相关的节点。在链接节点24的位置附近,可以将一个可视标记串添加到文档中,由此确保有一个可用于选择链接的口语言辞。节点文本、标签串、目的锚以及链接节点位置可以被通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于通过语音识别引擎注册言辞和相关联的目的锚的方法,所述方法包括使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;对于全部节点的列表中的每个节点而言,为所述节点获取一个目的锚;如果目的锚存在,则从所述节点的子节点中以递归方式收集文本,以便形成言辞;以及通过语音识别引擎注册言辞和目的锚。2.权利要求1的方法,其中形成言辞还包括以递归方式来为替换文本检查所述节点的子节点,如果收集的文本是空白,则使用替换文本作为言辞。3.权利要求1的方法,还包括遍历所述节点的双亲节点并且累积位置偏移来获取节点位置。4.权利要求3的方法,还包括如果容器节点是所述节点的一个双亲节点,则将节点位置标记成相对于一个容器节点,否则将节点位置标记为绝对的。5.权利要求3的方法,其中注册还包括通过语音识别引擎注册节点位置。6.权利要求3的方法,其中如果双亲节点隐藏,则使双亲节点临时可视。7.权利要求3的方法,还包括在节点位置附近添加一个可视标签串,并且还通过语音识别引擎注册这个可视标签串。8.一种具有指令序列的计算机可读介质,在由一个处理器执行时,所述指令序列使得处理器执行一种用于通过语音识别引擎注册言辞和相关目的锚的方法,所述方法包括使用浏览器提供的一个编程接口而在浏览器显示的文档中获取具有链接的所有节点的一个列表;对于全部节点的列表中的每个节点而言,为节点获取一个目的锚;如果目的锚存在,则从节点的子节点中以递归方式收集文本,以便形成言辞;以及通过语音识别引擎注册言辞和目的锚。9.权利要求8的计算机可读介质,其中形成言辞还包括以递归方式来为替换文本检查所述节点的子节点,如果收集的文本是空白,则将替换文本用作言辞。10.权利要求8的计算机可读介质,其中所述方法还包括遍历所述节点的双亲节点并且累积位置偏移来获取节点位置。...

【专利技术属性】
技术研发人员:G·吴
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利