本发明专利技术将提供VoiceXML与诸如SALT的话音应用开发工具进行组合的系统和方法。在本发明专利技术的一个方面中,VoiceXML模块包括VoiceXML可执行指令。SALT模块包括话音应用语言标记以执行与VoiceXML模块相关的指令。
【技术实现步骤摘要】
本专利技术涉及话音使能应用的编程,尤其涉及步进式语音标记语言和面向对象的话音应用扩展的组合使用。
技术介绍
计算机用户/接口的发展允许用户与计算机通过语音命令进行交互。已经发展了诸如通过使用VoiceXML(语音可扩展标记语言)的语音入口,使得可使用语音输入来访问因特网的内容。在该结构中,文档服务器(如web服务器)通过VoiceXML解释器处理来自客户的请求。web服务器可以产生VoiceXML的文档和应答,它们由VoiceXML解释器进行处理并可听见地呈现给用户。通过语音识别使用规定的语音命令,用户可以导航网络并监听可听传送的数据。为了允许设计者对用户和话音应用之间的对话进行控制,设计了VoiceXML的开发语言。VoiceXML遵循一种步进式的方法,其中应用控制对话流程,并询问用户,以进行填表或从菜单选择。VoiceXML应用实行多个步骤以将数据呈现给用户或在表单中填充数据。尤其是,VoiceXML遵循一种表单解释算法,它驱动用户和VoiceXML表单或菜单之间的交互。该算法继续循环遍历表单或菜单,直到填充了值、进行了选择或者遇到了异常。还通过诸如话音应用语言标记(SALT)的标记语言扩展的使用,开发了支持话音的使能应用。SALT允许从个人计算机、电话、个人数字助理和其他计算设备对信息、应用和web服务多模式和电话使能访问。SALT扩展了现有的标记语言,如HTML、X-HTML和XML。使用SALT的多模式访问使用户能够以各种不同的方式与应用进行交互,例如使用键盘、话音、鼠标和/或指示笔,或它们的组合。与VoiceXML相反,SALT是基于面向对象的编程方法,其中应用包括各种对象、触发器和事件。面向对象的方法使得应用设计者能够对用户和应用之间的对话流程进行用户化。当在SALT中遇到事件时,基于SALT的应用就根据该事件执行各种命令。这样,用户就可以控制对话流程,这是计算机交互的更有效和/或更自然的形式。当前,利用VoiceXML步进式方法的应用并不利用由面向对象的编程方法(这是诸如SALT的话音应用工具所使用的)所提供的灵活性。因此,VoiceXML应用在处理混合起始情况(其中用户请求几个不同类型的数据)、外部消息和高级呼叫控制时就遇到了困难。从而在VoiceXML中提供SALT的编程灵活性的系统和方法将会是有利的。
技术实现思路
本专利技术提供组合步进式指令执行算法和面向对象的模块的系统和方法。在本专利技术的一个方面,计算机可执行的程序包括步进式模块,其具有根据执行算法以规定顺序执行的指令。面向对象的模块包括具有用于对与指令相关的操作进行初始化的时序触发器。在本专利技术的另一方面,VoiceXML模块包括VoiceXML可执行指令。SALT模块包括话音应用语言标记,以执行与VoiceXML模块相关的指令。在另一实施例中,可以使用VoiceXML模块声明第一和第二VoiceXML字段,并且SALT模块对识别事件进行初始化,以从用户获得话音输入。SALT模块用话音输入的第一部分填充第一VoiceXML字段,并用话音输入的第二部分填充第二VoiceXML字段。此外,SALT包括多个语法,它们识别话音输入并将该输入与特定的语法和/或字段进行相关。本专利技术的又一方面是一种提供交互式用户接口的方法。该方法建立以规定顺序执行指令的步进式对话。该指令包括对象,这些对象用于处理与识别、提示和消息中至少一个有关的事件。当遇到与该指令相关的对象时,进行面向对象的操作。该操作包括在与识别、提示和消息有关的对话中的至少一个但不是所有的事件。附图说明图1是使用步进式模块和面向对象模块的系统框图。图2是计算设备操作环境的平面图。图3是图2计算设备的框图。图4是电话的平面图。图5是通用计算机的框图。图6是客户机/服务器系统结构的框图。图7是根据本专利技术实施例的方法的框图。图8是识别结果和多个语法的框图。图9是根据本专利技术实施例的方法的框图。图10是识别结果和多个字段的框图。图11是根据本专利技术实施例的方法的框图。图12是根据本专利技术实施例的方法的框图。图13是根据本专利技术实施例的方法的框图。图14是根据本专利技术实施例的示例标记页。具体实施例方式图1示出了用于组合步进式语言(如VoiceXML)和面向对象的话音应用开发工具(如SALT)的使用的系统10。系统10包括步进式模块12(如VoiceXML模块)和面向对象的话音应用开发工具模块14(如SALT模块)。步进式模块包括以给定执行算法的规定顺序执行的指令。面向对象的开发工具模块包括进行各种操作的编程对象。如这里所使用的,VoiceXML指的是语音可扩展标记语言,它是W3C(万维网联盟)的候选推荐。VoiceXML2.0版的规范副本可以在www.w3.org/TR/voicexm120找到。此外,SALT指的是由SALT论坛开发的话音应用语言标记。SALT1.0规范的副本可以在www.SALTforum.org找到。VoiceXML根据表单解释算法执行步进式的指令。本专利技术的一个方面包括将一个或多个面向对象的模块14结合在步进式模块12的可执行指令中。面向对象的模块14包括时序触发器,在步进式模块12的执行算法遇到触发时,使操作开始。触发器可以包括各种事件,如错误、异常、消息接收、识别和/或没有识别,或它们的组合。所进行的操作包括诸如话音识别、DTMF识别、音频采集、音频播放和其他的操作。当在步进式模块12的操作下遇到面向对象的模块14(如SALT标记)时,就将SALT标记和VoiceXML模块12之间的交互定义为允许在VoiceXML中使用SALT。例如,当使用SALT标记触发根据多个语法的话音识别时,与将每一单元放置在分开的字段有关的指令就允许在VoiceXML模块中嵌入SALT模块。当利用SALT消息性能时,将消息指令嵌入表单解释算法的循环。将面向对象的模块14嵌入步进式模块12中,从而,与仅仅使用诸如VoiceXML的步进式语言相比增强了最终应用的功能性和灵活性。提供交互式用户接口的方法是在系统10中实现的本专利技术的另一方面。步进式模块12与用户建立步进式对话,该对话以规定顺序执行指令,例如通过VoiceXML表单或菜单。该指令处理与识别提示和/或消息相关的对话事件。当在识别、提示或消息的至少一个但非全部的对话中遇到面向对象的模块14时,该模块14就进行面向对象的操作(如通过执行SALT标记)。在一实施例中,步进式对话包括实现指令的VoiceXML和执行面向对象操作的SALT标记。对于用于开发话音应用的系统的概括描述,对以上所述系统10中可运行的计算设备进行一般描述是有用的。本领域技术人员可以意识到,系统10的部件可以位于单一的计算机中,也可以使用网络连接和协议分布在分布式计算环境中。现在参照图2,在30示出了诸如数据管理设备(PIM、PDA等)的移动设备的示例形式。然而,可以预见,本专利技术也可使用以下所述的其他计算设备实现。例如,电话和/或数据管理设备也可从本专利技术中获利。与现有的便携式个人信息管理设备和其他便携式电子设备相比,这样的设备具有增强的实用性。图2中示出了示例形式的数据管理移动设备30。移动设备包括外壳32,并具有包括显示屏34的用户接口,它使用与指示笔33结合的触摸敏感显示屏本文档来自技高网...
【技术保护点】
一种具有指令的计算机可读媒介,当在计算机上实现该指令时,该指令使计算机处理信息,所述指令包括:步进式模块,包括根据执行算法以规定顺序执行的指令;以及面向对象的模块,包括至少一个对象,所述对象具有用于对与指令相关的操作进行初始 化的时序触发器。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:王冠三,
申请(专利权)人:微软公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。