本发明专利技术提供了一种用于创建声音应用的系统和方法。声音识别处理方法使用基于输入从后端数据源获取数据的动态语法,以创建语音引擎能够识别的期望结果。该处理方法可以从多个后端数据源中的至少一个取回数据,并可以至少部分地使用动态语法构造器基于该数据构造语法。至少部分地使用可重用对话组件将该语法载入声音识别应用。可以使用数据访问服务、XSLT处理器或其它数据访问框架帮助实现异构环境中对数据的访问和操作。
【技术实现步骤摘要】
本专利技术涉及声音识别,并且特别地涉及为声音应用的可重用对 话组件产生动态语法。
技术介绍
声音应用的开发可能极端复杂。缺少可用的专用、标准的或公 知的开发体系结构典型地加剧了这种复杂性。尽管最近的声音应用开发已经采用了部分Web编程模型,但在声音应用和Web应用之间 依然存在显著的差异。为了创建鲁棒的声音应用,通常需要声音应用开发者熟悉很多 编程语言、技术、体系结构和方法。与这一问题相结合的是,声音 应用经常使用专用标记语言来构造。VoiceXML标准的出现消除了 一 些这种复杂性,允许声音开发者更好地专注于其技能。VoiceXML 允许为声音应用采用Web编程模型,并允许通过使用服务器侧框架 对其进行实现,类似于针对Web应用的实现。然而,语音识别比在Web应用中收集数据更容易出错,因为背 景噪声和其它因素可能干扰识别。不同于Web应用,声音应用需要 计算机和用户之间的对话,用以例如确认输入或在没有输入时重新 提示用户。声音应用依赖于语法以获知将识别什么单词或短语。可重用对话组件(RDC),例如可^L实现为JSP 2.0标签的RDC, 是已知的。RDC可以以在Web应用中同样的方式在开发声音应用中 进行辅助。RDC包括用以获取信息单元所需的声音特定的元素,例 如对话、语法和调用流程。使用RDC的开发者无需知道所包括的语 法,而只需明白RDC标签所需要的属性。使用RDC处理用于普通 对话的交互,可以使开发者自如地处理声音应用的更为复杂的领域。然而,现在的RDC框架仅具有接受静态语法的有限能力。为了 拥有包括动态语法的声音应用,开发者需要实现针对其所使用环境 和数据资源的解决方案。客户代码是必需的,这将使具有可重用组 件的目的无法达到。当给予调用者的选项和数据需要从后端源动态 地收集时,这将尤为不便。因此,需要一种实现在声音识别系统中的技术,其中上述缺点 可以被緩解或减轻。还需要一种为可重用对话组件提供动态语法的 系统或处理方法。
技术实现思路
在示例性实施方式中提供了 一种声音识别系统,其使用基于输 入从后端数据源获取数据的动态语法,以便创建语音引擎能够识别 的期望结果。在本专利技术的一种示例性实施方式中,提供了一种用于创建声音 应用的方法。该方法可以包括至少部分地基于输入从多个后端数 据源中的至少 一 个取回数据;至少部分地使用动态语法构造器基于 该数据构造语法;以及至少部分地使用可重用对话组件将该语法载 入该声音应用。另一种实施方式是用于为可重用对话组件产生动态语法的声音 识别系统。该系统可以包括处理器,能够至少部分地基于对该处 理器的输入从多个后端数据源中的至少 一 个取回数据。该处理器可 以被配置用以基于该数据构造动态语法,并至少部分地使用可重用 对话组件将该动态语法载入声音应用。另一种实施方式是计算机可读程序,其被包含在包括用于创建 声音应用的计算机可读程序指令的制品中。该程序可以包括用于 使计算机至少部分地基于输入从多个后端数据源中的至少一个取回 数据的程序指令;用于使计算机至少部分地使用动态语法构造器基 于该数据构造语法的程序指令;以及用于使计算机至少部分地使用 可重用对话组件将该语法载入声音应用的程序指令。附图说明现在将结合附图描述声音识别系统和处理方法的示例性实施方式,其仅作为示例,其中图1是根据本专利技术的一种示例性实施方式的声音识别系统和处理方法的示意性表示;图2是说明了图1的声音识别系统和处理方法与调用者的交互 的流程图3是根据本专利技术的另一种示例性实施方式的声音识别系统和 处理方法的示意性表示;以及图4是根据本专利技术的另 一 种示例性实施方式的声音识别系统和 处理方法的示意性表示。具体实施例方式在此描述的示例性实施方式通过提供用于产生动态语法的处理 方法解决了现有声音识别系统的不足,该处理方法可以基于输入从 一个或多个后端数据源获取数据,以创建语音引擎可以识别的期望 结果。将结合各种可能的声音识别系统和处理方法对示例性实施方 式进行解释。详细的描述仅仅意在示例。示例性实施方式在图1-图4 中示出,但本公开内容不受限于所说明的结构或应用。在根据本专利技术的方面的一种示例性实施方式中,提供了 一种对 可重用对话组件(RDC)框架的附加,其使用服务数据对象(SDO) 架构以允许RDC使用动态语法。SDO框架可以对应用,特别是声音 应用,的数据处理进行筒化和统一。使用SDO框架,可以针对声音 应用实现对来自多数据源(包括异构数据源)数据的统一访问和操 作。这种访问和操作可以就各种数据源被实现,包括关系数据库、 XML数据源、Web服务以及企业信息系统。尽管这种示例性实施方 式使用SDO框架用于访问和操作数据以便为RDC产生动态语法, 但是本公开内容预期使用允许访问和操作来自异构环境中数据源的 数据的其它数据处理框架。在这种示例性实施方式中,动态语法RDC (DGRDC)标签被附 加到RDC框架上,其允许创建通过SDO框架的使用与一个或多个 后端数据源交互的RDC。这简化了需要与后端数据源通信以产生动 态语法的复杂声音应用的开发。这允许对组件的重用,并避免了为 声音应用访问这种数据而编写客户代码。RDC在原子或分离(即, 来自用户的单一信息输入)格式以及复合(即,来自用户的多信息 输入)格式中可用。本公开内容预期原子RDC和/或复合RDC的使 用。参考图1,示出了一种声音识别处理方法的示例性实施方式,并 一般地表示为参考数字10。处理方法IO使用与数据访问服务(DAS) 30和动态语法构造器60交互的RDC 20。 DAS 30与一个或多个数据 源40通信,并能够基于来自数据源的数据创建或产生数据图50。DAS30是为数据应用开发提供统一框架的SDO框架的一部分。 通过使用DAS30,处理方法IO无需开发者为访问和利用声音识别 数据而熟悉各种技术专用的应用编程接口 (API) 。 DAS30可以访 问包括关系数据库,实体Enterprise JavaBeansTM( Java企业柄)组件、 XML页面、Web服务、Java连接器体系结构、JavaServer页面以及 更多的数据源。SDO框架为声音应用作出了贡献,且这些应用都将 与SDO模型相一致。SDO框架也与J2EE模式和实践相结合,由此 有助于将已被证明的体系结构和设计结合进声音应用。处理方法10包括能够通过专用于一些后端数据源40的DAS 30 从数据图50获取数据的声音应用。优选地,声音应用可以检查和/ 或更新包含在数据图50中的数据。本公开内容还预期一种声音应用, 其使用DAS 30以将整个更新集合传回原始数据源40。在处理方法10中,RDC 20将涉及RDC所需信息的输入数据l5 传送给DAS 30。 DAS 30查询数据源40以获取特定的数据搜索 (sought) 。 DAS 30继而产生或创建数据图50。数据图50提供数据的非持久性副本,这允许声音应用即使是在与原始数据源没有连接时也可用该数据工作。数据图50中的数据可以被组织为数据对象的群组,并可以作为图形结构被链接在 一起。数据图50还可以包括描述数据图中所包括数据对象类型的结构的图 表。数据图50还可以维护变化历史或其它跟踪结构,用以跟踪对数 据图的所有修改,以用于监控本文档来自技高网...
【技术保护点】
一种用于创建声音应用的方法,所述方法包括:至少部分地基于输入从多个后端数据源中的至少一个取回数据;至少部分地使用动态语法构造器基于所述数据构造语法;以及至少部分地使用可重用对话组件将所述语法载入所述声音应用。
【技术特征摘要】
US 2006-12-28 11/616,9981.一种用于创建声音应用的方法,所述方法包括至少部分地基于输入从多个后端数据源中的至少一个取回数据;至少部分地使用动态语法构造器基于所述数据构造语法;以及至少部分地使用可重用对话组件将所述语法载入所述声音应用。2. 根据权利要求1所述的方法,其中所述数据是通过数据访问 服务从所述多个后端数据源中的所述至少 一个取回的,并且其中所 述数据访问服务基于所述数据建立数据图。3. 根据权利要求2所述的方法,其中所述动态语法构造器访问 所述数据图的数据对象,以构造所述语法。4. 根据权利要求1所述的方法,其中所述多个后端数据源中的 所述至少一个以XML格式保存数据。5. 根据权利要求3所述的方法,还包括 将所述数据图序列化为XML格式的数据;以及将所述XML格式的数据转换为语音识别语法规范XML语法。6. 根据权利要求2所述的方法,还包括基于所述输入更新所述 多个后端数据源中的所述至少 一个。7. 根据权利要求6所述的方法,还包括产生代表用于所迷多个 后端数据源中的所述至少 一 个的所述更新的逻辑的属性和类。8. —种用于为可重用对话组件产生动态语法的声音识别系统, 所述系统包括处理器,能够至少部分地基于对所述处理器的输入...
【专利技术属性】
技术研发人员:A席尔瓦,BD曼戴利亚,VS穆尔,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。