使用脚本的对话管理制造技术

技术编号:3044653 阅读:229 留言:1更新日期:2012-04-11 18:40
描述了中性表示对话系统和方法(“RNDS”),包括基于信息状态更新方法的多应用、多设备口语对话系统。RNDS包括对话系统的中性表示核心组件,其提供对诸如对话移动模型和指称求解这样的例程的脚本化域专用扩展,提供专用语义表示和相关联例程的轻易替换,以及到用于语言理解(即语音识别和解析)和语言生成的外部组件以及到域专用知识源的干净接口。RNDS还允许与设备群的无缝交互。

【技术实现步骤摘要】
【国外来华专利技术】
本公开一般涉及对话管理,并且更具体地,涉及多应用、多设备 口语对话系统的管理。
技术介绍
对话包括参与者之间会话的语言以及由参与者为会话而构建的 共享中心语境(例如,在后续会话中指称的它是指在会话中较早 所描述的某物)。会话的参与者可以是人、机器、或者人和机器的任 何组合。对话管理包括相对于共享语境对讲话者的话语进行解释,以 及用于对对话参与者之间的交互进行管理的技术和策略。已经为诸如 机器人设备的多模态控制、语音使能教学系统、与汽车内设备会话交 互这样的应用开发了面向行为的对话系统。典型的对话系统结构包括像语音识别器、语言解析器(parser)、语言发生器、语音合成器、以及 对话管理器(DM)的各种组件。该对话系统还可以包括到诸如本体 (ontology)或知识库(KB)的外部专用组件的连接以及对话使能设 备。对话系统的例子见下列文献(i) Lemon, O., A. Gruenstein, S. Peters (2002), Collaborative activities and multi-tasking in dialogue systems, Traitement Automatique des Langues (TAL), 43(2); (ii) Clark, B., J, Fry, M. Ginzton, S. Peters, H. Pon-Barry, Z. Thomsen-Grey (2001), Automated tutoring dialogues for training in shipboard damage control, SIGdial;禾口(iii) Weng, F., L. Cavedon, B. Raghunathan, D. Mirkovic, H. Cheng, H. Schmidt, H, Bratt, R. Mishra, S. Peters, L. Zhao, S. Upson, L. Shriberg, C. Bergmann (2004), A conversational dialogue system for cognitively overloaded users (poster), INTERSPEECH.对话系统的DM是有助亍对话参与者之间交互的监管模块。使用 行为模型(Activity Model)的对话系统特指一种被称为面向行为的对话的对话类型,其是关于正在由用户和机器、计算机、以及/或者机器人(联合)开展的行为的对话。在用户或者讲话者发起系统中,DM 指示通过解释和后端系统响应对从一个组件到另一个组件的输入话 语的处理。在处理中,例如,DM对输入话语的信息输入进行检测和 处理,并且生成系统输出。可以与不同解析器和语言发生组件一起使 用DM。通过行为模型(AM),即所公布的设备能力规范和它们与语 言处理的关系,对与外部设斧的交互进行调解。然而,由于在不同应 用上对话移动(dialogue move)需求的变化、与语言解析器和其它组 件接口中表示法的变化、以及具有领域专用方面的某些处理(例如, 指称求解(reference resolution)),所以对新领域的定制一般需要一些显 著的规划努力。常规的对话管理系统的范围从广泛商业应用但是更受约束的基 于语音扩展标记语言(VXML)的对话建模机制到基于对信息状态进 行更新的TrindiKit方法的语义模型。虽然为特定的领域设计并且实 现了许多对话系统,但是将这些系统应用到新的领域需要相当大的工 程。相反地,基于VXML的对话管理基础结构允许对新的领域灵活 实现基于语音的对话系统,但是仅提供对对话建模中许多问题的肤浅 解决方法。通过引用合并这里通过引用将本说明书中所提到的每个出版物和/或专利技术申请 全部合并到本申请中,如同专门并且单独指定每个独立的出版物和/ 或专利技术申请通过引用合并到本申请中。附图说明图1是根据实施例的中性表示对话系统(RNDS)对话管理器 (DM) (RNDS DM)的方框图2是根据实施例的RNDS的方框图3是根据实施例的用于使用对话移动脚本(DMS)将对话贡献 (dialogue contribution)的描述映射到对话移动的流程图4是根据实施例的用于使用名词短语求解脚本(NPRS)生成相应于设备的数据库査询(名词短语査询)的流程图5是根据实施例用于MP3设备的示例行为模型(AM)的部分;图6是根据实施例用于MP3设备的play命令的示例DMS;图7是根据实施例的对于the song Vertigo by U2的示例名词短语查询(NP査询)对象;图8是根据实施例的名词短语求解规则的例子。在附图中,相同的参考标号代表相同的或者非常类似的组件或行为。为了对任何特定组件或行为的讨论进行标识,在参考标号中最高位数字是首次引入该组件的图号(例如,关于图1首次对组件丄OO进行引入和讨论)。具体实施例方式基于信息状态更新方法,所描述的中性表示(representation-neutral) 对话系统和方法包括多应用、多设备口语对话系统。在这里共同被称 为中性表示对话系统(RNDS)的中性表示对话系统和方法包括对话 系统的中性表示核心组件,其提供对诸如对话移动模型和指称求解这 样的例程的脚本化的域专用扩展。RNDS支持专用语义表示和相关例 程的置换、到用于语言理解(即语音识别和解析)和语言生成的外部组 件以及到域专用知识源的干净接口,从而减少或者消除重新编码任何 核心软件组件的任何需求。如下所述,RNDS还允许与设备群的无缝 交互。RNDS的脚本包括对话移动脚本(DMS)、行为模型和名词短语 求解脚本(NPRS),提供了将RNDS轻松定制到新的对话域和应用 中的能力。此外,RNDS构成了 即插即用对话管理结构的基础, 其中,设备应用编程接口(API)对所定制的对话移动、行为模型、 知识库、以及到核心处理的域专用扩展(例如指称求解)进行封装。这 种即插即用对话管理使得能够进行多设备对话管理,允许将新的对话 使能设备动态添加到现存的多设备对话系统。实施例的RNDS通过使用DMS实现对对话管理的信息状态更新方法。DMS包括一般对话处理与对对话移动进行轻松扩展或定 制的能力的组合,其对从用户到新域的对话贡献进行处理。特别地, 这构成了 RNDS中多设备对话管理的基础,其中,每个设备提供其 自己的DMS(设备专用DMS),该DMS包括从用户话语到设备专用 对话移动的映射。实施例的其它脚本(例如,NPRS)允许对其它对话 处理的定制,例如,名词短语求解(NP求解)(即,将自然语言中的 对象描述映射到数据库中的实际对象)以及行为模型,其中,行为模 型对由对话系统控制的对话使能设备的能力提供描述。将RNDS脚本与来自核心对话管理结构的其它信息(例如,行为 模型(AM))进行组合,以便在RNDS中提供即插即用能力。实施例 的即插即用RNDS允许对新的设备进行对话使能和与DM进行动态 注册,而不需要对DM进行重启或重新编译。例如,在汽车工业的语 境中,这允许将用于汽车的新设备作为对话使能实体出售,随后将该 新设备添加到诸如小汽车或卡车的车辆中的现存对话系统内。通过对DM中现存的对话管本文档来自技高网...

【技术保护点】
一种方法,包括:    对从声信号生成的输入模式进行接收,所述输入模式包括对来自讲话者的对话贡献的描述;    使用对话移动脚本(DMS)对所述描述和所述描述的至少一个参数进行识别,其中,所述DMS对应于设备和应用中的至少一个;以及    使用所述DMS将所述描述映射到对话移动,所述对话移动对应于所述识别的参数并且独立于所述设备和应用。

【技术特征摘要】
【国外来华专利技术】US 2005-5-31 11/142,1961、一种方法,包括对从声信号生成的输入模式进行接收,所述输入模式包括对来自讲话者的对话贡献的描述;使用对话移动脚本(DMS)对所述描述和所述描述的至少一个参数进行识别,其中,所述DMS对应于设备和应用中的至少一个;以及使用所述DMS将所述描述映射到对话移动,所述对话移动对应于所述识别的参数并且独立于所述设备和应用。2、 如权利要求1所述的方法,还包括通过对所述DMS进行重新编程,使得所述对话移动适合于在多 个不同域和多个不同应用中的至少一个上使用。3、 如权利要求l所述的方法,还包括使用所述描述中的名词短语对与所述描述对应的设备和应用中 的至少一个进行识别;选择与所识别的设备和应用中的至少一个对应的名词短语求解 脚本(NPRS),并且通过所选择的NPRS访问名词短语求解规则;以 及使用所述名词短语求解规则对所述描述进行翻译,并且生成与所 述设备和所述描述中的至少一个对应的查询。4、 如权利要求3所述的方法,还包括响应于所述查询,从至少一个数据库中检索由来自所述对话贡献 的对象描述所指称的至少一个对象。5、 如权利要求4所述的方法,其中,所述对象描述包括名词短语。6、 如权利要求3所述的方法,还包括通过对所述NPRS进行重新编程,使得所述名词短语求解规则中 的至少一个规则适合于在多个不同域和多个不同应用中的至少一个 上使用。7、 如权利要求3所述的方法,其中,所述NPRS包括知识库查 询构造规则,可以对所述知识库查询构造规则进行编程,以对于多个 设备中的每个设备定义如何将名词短语对象映射到査询。8、 如权利要求3所述的方法,其中,生成所述查询包括将所述 描述中的名词短语翻译成所述对象。9、 如权利要求l所述的方法,其中,所述描述是基于结构化语 言的描述,其包括所述对话贡献的语义描述、句法描述、音位信息、 话语级别信息以及主题分类中的至少一个。10、 如权利要求l所述的方法,其中,所述映射还包括对所述对 话贡献的至少一个参数进行识别。11、 如权利要求l所述的方法,还包括对所述描述中的变量和所述对话移动的组件之间的匹配进行评分。12、 一种系统,包括基于信息状态更新方法的对话管理器,其包括多个对话移动和一个对应于设备和应用中至少一个的对话移动脚本(DMS),所述对话管理器对从声信号产生的输入模式进行接收,所述输入模式包括对来自 讲话者的对话贡献的描述,所述DMS对所述描述和所述描述的至少 一个参数进行识别,所述DMS将所述描述映射到所述对话移动中与所识别的参数对应的一个对话移动;知识管理器,其连接到所述对话管理器和至少一个数据库;以及设备管理器,其连接到所述对话管理器。13、 如权利要求12所述的系统,其中,通过对所述DMS进行重新编程,使得所述多个对话移动中的至少一个适合于在至少一个不同的域和应用上使用。14、 如权利要求12所述的系统,其中,所述对话管理器还包括名词短语求解器,其连接到多个名词短语求解脚本(NPRS)和多个规则,其中,每个NPRS对应于所述设备和所述应用中的至少一个。15、 如权利要求14所述的系统,其中,所述名词短语求解器使用NPRS来访问所述规则,并且对所识别的描述迸行翻译,以生成对应于所述设备和应用中至少一个的查询。16、 如权利要求14所述的系统,其中,通过对所述NPRS进行重新编程,使得...

【专利技术属性】
技术研发人员:D米尔科维奇L卡维多
申请(专利权)人:罗伯特博世公司
类型:发明
国别省市:US[美国]

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2015年03月19日 03:54
    对话,指两个或更多的人用语言交谈,多指小说或戏剧里的人物之间的。
    0
1
相关领域技术
  • 暂无相关专利