本发明专利技术涉及一种用于服务于环球网门户应用的语音门户服务器的方法和装置。描述了为门户组件集合建立语音提示菜单的方法、系统和计算机程序产品,包括:获得门户组件列表;建立包括语音菜单项的语音菜单,以激活每个门户组件;获得包含定制信息的门户组件特征文件;以及利用门户组件特征文件中的定制信息调整语音菜单。本发明专利技术实施方式的特征是环球网门户组件可以针对语音聚集器考虑的事项例如在语音门户菜单的层次结构中针对其菜单项的位置处定义用户特性。
【技术实现步骤摘要】
本专利技术涉及用于语音门户服务器的方法和装置。其特别涉及服务于环球网门户应用的语音门户服务器的方法和装置。
技术介绍
许多移动的雇员在汽车内或者诸如下列其他地点花费了相当多的时间,在上述地点语音电话(有线的或者蜂窝的)是唯一可行的通信手段和唯一的访问远程信息源的方法。随着越来越多的工作必须对商务应用进行自助访问,自动语音访问成为关键之需。据估计,大约一半的蜂窝电话呼叫来源于汽车。对于职业劳动者中的相当一部分来说,移动电话已经开发了每周上下班交通时间的数个小时以用于高效的商务目的。提供电话访问的公司相对于那些没有提供电话访问的公司获得了竞争的优势。当新的移动计算设备提供远程访问时,它们小的可视化显示器和受限的输入能力常常会带来令人沮丧和厌烦的体验。例如,利用语音从长列表或菜单中进行项目的选择就要高效得多,其简化了诸如在地址簿中查找姓名、在日历中选择日期或查找具有特定主题行的记录的动作。有些具有残疾的雇员无法使用可视化界面的设备,而另一些雇员无法使用依赖完好的手控制的输入设备。对于这些个人,语音访问不仅具有竞争优势;它还是完成他们的工作的基本需要。如果语音访问不仅是支持语音可视化界面;它就需要对用于谈话交互的应用进行根本上的重新设计。语音界面的主要障碍是计算机生成的语音具有不自然和难于理解的性质。近来在文本到话音连接技术的利用中的突破已经消除了这种限制并使得语音质量可以与人类的话音相比。话音识别的准确性也-->继续得到改进,使得日常生活中成百万的人们使用他们的语音通过说出一个人的名称来“拨打”电话号码、管理他们的投资证券,以及访问天气信息、体育比分或者其他信息。除了技术上的改进,对交谈对话设计的持续细化也带来了比早期语音激活系统所提供的体验高效得多并且愉快得多的用户体验。硬件上的进步也使得能够部署对大量同时的呼叫者的自动支持而无需大量资本的投入。特别是CPU处理能力、存储器和电话接口卡的成本已经通过摩尔定律的法则大大降低。接着出现的最重要的一部分是VoiceXML的可利用性,VoiceXML是由所有主要的话音技术提供者支持的基于开放标准的语音应用设计协议。该标准被设计为允许语音应用在所有企业质量的计算机硬件和操作系统平台上运行。这些公司能够确信它们在VoiceXML应用基础架构上的投资不会将它们锁定到对于关键系统组件的单一提供商。语音应用开发通常需要各种技能、知识和编程技术,包括:专用集成语音响应(IVR)应用开发环境;专用IVR环境和中间件应用之间的接口连接;利用话音识别和话音合成技术;谈话设计以及中间件设计。特别将VoiceXML引入用于消除对私有IVR应用设计环境的需要,以便利用环球网应用设计的基于视图和表单(view-and-form)的模型而自动提供中间件的集成,并创建到话音识别和话音合成技术的标准接口。VoiceXML使得语音应用服务器能够以与环球网应用服务器集成HTML接口能力相同的方式集成语音接口能力。该协议利用在全部访问形态中可共享的通用组件提供模块化的应用设计环境。不仅仅是语音技术得到了发展,环球网门户形式的用户界面技术也得到了发展。门户用作为针对数个环球网应用的简单的、同步统一的访问点。门户提供了一种运行时间平台和工具,它们给出多页面间一致的展示视图、对访问应用的导航控制以及个性化的选择和用户定制内容。IBM WebSphere门户服务器基础架构通过提供以下功能完成上述这些:提供对全体范围内的用户、设备和用户定制选项的信息进行访问;整合商务流程并使其自动化;建立、连接并管理应用。提供-->广泛存在的门户是新一代应用的一部分,新一代应用被设计用于从各种远程访问设备中获得信息并执行事务。此外,门户平台理想地用于通过通用个性化存储并共享的商务逻辑支持语音和可视化访问。大多数现有的自动的语音方案都是利用与到后端商务逻辑和数据的客户界面相结合的私有语音应用环境创建的。这些客户界面难以与常规的GUI环球网访问方案相集成。然而,IBM WebSphere语音应用访问(WVAA)将IBM WebSphere门户服务器的模块化应用设计与VoiceXML相结合,以便将语音访问添加到由WebSphere门户服务器支持的其他形态中。通过建立在VoiceXML之上,不仅语音应用开发者不断扩大的社区可以直接操控WVAA平台,而且平台客户也应该能够在指引话音识别和文本到话音提供之间进行选择。语音界面,如利用WVAA提供的那些语音界面和门户中纯可视化环球网应用相比具有显著的优势。图形用户界面(GUI)趋向于在每一屏上具有大量能够饱和用户的文本。相对于写出的指令,大多数人都会更容易地遵循所说的对话。也许最大的优势是对话焦点——通过一步一步地谈话提示引导用户。另一方面,在自然的谈话中,人们可以以各种方式回答即使是非常简单的问题,经常超出问题的范围之外。例如,他们可以回答问题并然后解释他们的答案。设计一个自动系统,使之能够“理解”这些任意的输入中的大部分通常是相当复杂和不可行的。因此,重要的是引导人们所说的输入,使之与计算机语音识别强度相匹配。基于多个应用部署的体验,为电话访问所设计的语音界面在过去的数年间已经有了显著的发展。所获得的最重要的方面中的一些包括:谈话流必须是高效的、一致的和直观的。使用自信分值避免确认每个条目;确认导航命令在门户中的所有应用中一致;谈话流应该对大多数用户都是“有意义的”。提示必须经过仔细推敲,短而明确。大多数用户都应该清楚到底要对系统说什么。帮助提示必须短。对于每个提示,用户可以简单地不必记住比一条信息还多得多的信息。该系统应该在适当的时候向用户“披露自己”。可以在谈话陷于困境时-->使用依赖于上下文的帮助,并在事情顺利时提供快捷方式以帮助用户逐渐掌握系统。可视化和语音界面之间的另一不同是门户导航。可视化门户设计是基于在一个单独的可看见的页面中展示顶级视图的概念,但大多数用户并不关心页面上的组件来自不同的门户组件。可视化门户组件的导航问题是寻找包含正确应用的页面。为了支持大量应用,门户可以将相似的页面划分为一个页面组。这些可视化概念对于语音界面没有用。尽管这里会有些重叠,例如主要的类型在可视化和语音之间可以是相同的,语音的导航菜单结构很可能非常不同,这是出于以下几点原因:会存在一些只能是可视化的门户组件和一些只能是语音的门户组件;应用可以被放在页面上,因为它们可视化地放在一起很适合,而在语音菜单中不同的组织将更具有意义;并且许多语音目标可以作为快捷方式而不是普通菜单选择实现,以便将提示保持为短提示。换句话说,语音界面决不仅仅是可视化界面简单的语音支持。语音应用的大多数都将是指导性对话设计,因为这些创建起来最简单,并且在很多情况下也是最易于使用的。自动系统控制指导性的对话设计,提供一组特定的选择。这一范例(也已知为系统主动(systeminitiative))对于用户是最易学的,但是对于复杂的应用,它可能是低效的和令人厌烦的。混合主动对话设计允许系统和用户在适当时对对话进行控制。因为大多数语音访问应用都将是指导性对话,因此IBMWebSphere语音应用访问为指导性对话应用提供了高级应用设计环境。重点放在利用针对谈话对话的最佳实现促使迭代实现、调试和加强设计的工具上。图1示出环本文档来自技高网...
【技术保护点】
一种为门户组件集合建立语音提示菜单的方法,包括:获得门户组件列表;建立包括语音菜单项的语音菜单,以激活所述每个门户组件;获得包含定制信息的门户组件特征文件;以及利用所述门户组件特征文件中的所述定制信息调整所述语音菜单。
【技术特征摘要】
GB 2005-8-27 0517542.71.一种为门户组件集合建立语音提示菜单的方法,包括:获得门户组件列表;建立包括语音菜单项的语音菜单,以激活所述每个门户组件;获得包含定制信息的门户组件特征文件;以及利用所述门户组件特征文件中的所述定制信息调整所述语音菜单。2.根据权利要求1的方法,其中所述调整步骤增加用于激活门户组件内功能的语音菜单项。3.根据权利要求1的方法,其中所述定制信息定义所述语音门户菜单中菜单项的位置。4.根据权利要求1、2或3的方法,其中所述调整步骤将用于激活特定菜单项的缺省DTMF键替代为所述特征文件中指定的DTMF键。5.根据前述任一权利要求的方法,其中所述调整步骤向所述语音菜单增加语音识别语法词语。6.一种为门户组件集合建立语音提示菜单的系统,包括:门户组件控制器,用于获得门户组件列表并获得...
【专利技术属性】
技术研发人员:马修詹姆斯庞斯福德,戴维西格伦肖,威廉约翰伊泽德,戴尔鲁滨逊休伊特,塞缪尔乔纳森史密斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。