信息检索系统技术方案

技术编号:4261413 阅读:170 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供信息检索系统。用户发话解析单元针对多个属性分别向 用户提出提问语句,根据来自用户的回答语句,对针对各个所述属性的 属性值进行解析。用户数据保持单元保持将所述多个属性和针对各个所 述属性的用户的属性值对应起来的用户数据,作为解析结果。匹配单元 针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值 以上的情况下,从多个对象数据中选出与各个所述属性和各个所述属性 值相匹配的至少一个对象数据候选。对话控制单元向用户侧输出所选出 的各个所述对象数据候选。

【技术实现步骤摘要】

本专利技术涉及信息检索系统中所包含的装置、应用于信息检索系统的 方法、以及存储了程序的存储介质。
技术介绍
随着信息化社会的发展,从存在于网络上的大量且多样的信息中査 找必要信息的信息解析技术、信息检索技术不限于信息产业,而成为与 通信、媒介、广告、内容、流通等灵活应用信息的所有产业强化竞争力 直接联系的重要课题。作为检索存在于网络上的信息的信息解析/信息检索系统,例如,谷歌(Google,注册商标)和雅虎(Yahoo,注册商标)等各种系统已经实 用化。在这些信息解析/信息检索系统中, 一般从所输入的关键字的命中件 数多的信息开始从上到下顺序介绍。因此,用户为了检索希望的信息, 需要正确地输入信息关键字,但是,有时不清楚输入什么样的关键字更 好。因此,作为解决这种课题的技术,例如考虑采用关键字自动扩展技 术和推荐系统等,其中,该关键字自动扩展技术显示与输入关键字一起 使用的关键字,该推荐系统根据大多数用户口头相传的信息来例如介绍 商品。但是,上述这种技术介绍大多数用户推荐的代表性的信息,不一定 能介绍各个用户的个性化的具体信息。因此,提出了如下的信息解析/信息检索技术其能够与用户之间相互对话,在该对话中反复进行逐渐深入的询问,由此提取出用户真正希 望的需要和价值观,来检索该用户潜在意向的信息。这里所谓的潜在意11向是指,人自身没有明确地意识到,也无法明确地对他人进行说明,但 是却模糊地存在着的希望、要求或期待,也可称为潜在要求或真正的希 望。如上所述,在对用户的潜在意向进行解析来检索与该潜在意向对应 的信息的系统中,需要从与用户相互的对话中,正确地提取与系统的属 性信息相匹配的用户潜在意向信息。在日本特开2003-036271号公报中记载了涉及对话型信息检索方法 的技术,在该方法中,蓄积具有由多个属性及其属性值构成的数据结构 的数据,输入用户希望取得的目标属性、用于縮小数据范围的关键属性、 以及关键属性的属性值,使用关键属性和关键属性的属性值来检索目标 属性的属性值,输出检索结果。而且,日本特开2003-036271号公报记载的技术在检索目标属性的 属性值之前,根据所输入的关键属性和关键属性的属性值,计算目标属 性的属性值的分布程度,进行控制以使仅在分布程度收敛于规定范围内 的情况下输出检索结果。但是,在现在提出的信息解析/信息检索技术中,从与用户的对话中 提取用户的潜在意向,所以,需要反映与用户之间的对话结果和检索对 象数据之间的匹配结果,来决定之后应该提问什么样的内容(属性)。但是,日本特开2003-036271号公报记载的技术在检索目标属性的 属性值之前,计算目标属性的属性值的分布程度,所以,虽然在检索前 进行某种程度的縮小输入条件,但是,由于不参照关键属性的属性值和 目标属性的属性值之间的匹配结果,所以,无法将匹配结果反映给之后 的提问。其结果是,产生在对话中无法推荐不匹配的其他属性(检索对 象数据)的问题。并且,产生无法考虑针对某个属性的用户的优先级和 决断状况的问题。因此,寻求如下的信息检索装置、方法以及程序匹配管理装置能 够在与用户的对话中,准确地判断用户的优先级和当前的匹配状况,取 得最佳的匹配结果,能够参照该匹配结果,获得准确的检索结果。在日本特开2000-276487号公报中记载了现有的关于对话型信息检索系统的技术。在日本特开2000-276487号公报中记载了如下技术当对 话次数变多时,缩小范围所需要的时间变多,且误识别变多,所以对对 话次数进行优化。但是,现在提出的信息解析/信息检索技术如上所述,以检索用户潜 在意向的信息为目的,所以需要探听出用户本来潜在意向的内容。该情况下,如果仅从用户探听出信息检索所需要的信息,则无法探 出本来的用户潜在意向。例如,在某人和与其会话的人之间建立了信赖 关系的情况下,某人才说出心里话。并且,当在展开会话的过程中换到 其他话题时,才会坦率地说出之前话题的潜在意向。为了在上述系统中进行这种行动,在与用户的对话中存在如下问题如何进行对话?提出什么样的话题?与用户之间如何形成信赖感和安全 感?因此,寻求如下的对话管理装置、方法、程序、以及潜在意向提取系统能够在用户和系统之间顺畅地展开对话,且能够在展开对话的过程中,给用户带来安全感和信赖感,由此提取用户本来的潜在意向。在日本特开2000-276487号公报中记载了如下技术蓄积过去发生 的事例,从所蓄积的事例中检索与本次发生的事例类似的事例。但是,上述日本特开2000-276487号公报记载的技术参照区域本体 (ontology),根据事例语句的类似度进行聚类(cluster)并蓄积事例语句, 求出与所输入的检索语句类似的事例语句的类似度,根据该类似度来检 索聚类后的类似的事例语句。其中,在该区域本体中存储有蓄积事例和 与存在于作为检索对象的区域中的术语和术语之间的关系有关的知识。艮卩,在上述日本特开2000-276487号公报记载的技术中,仅公开了一种从所蓄积的过去的事例语句中检索与当前的检索语句类似的事例语 句的方法,所以,在从与用户展开的丰富多彩的对话中进行信息提取的 情况下,产生无法进行适当的信息提取的问题。因此,寻求能够从与用户展开的丰富多彩的对话中提取适当信息的 信息挺取装置、方法以及程序。以往,作为对人类的发话(speech)进行解析来识别(提取)谓语和与其对应的语格要素并使用他们进行应答的装置,有日本特开2007-206888号公报记载的应答生成装置。在该现有装置中,针对用户的 发话……制作了居室的全部,包括餐具柜等。,实现系统(装置)的 发话制作了餐具柜?这样的应答。在日本特开2007-206888号公报记 载的装置中,系统的发话候选准备多个,所以,能够随机选择,或者(针 对根据发话候选的生成方法而分类的组)自由设定优先级来选择。此外, 这里所谓的发话不仅包括用户发出声音进行交谈,还包括从键盘的 输入。可以是通过麦克风等输入单元所输入的用户说出的语句,或是用 户通过键盘等输入单元输入的语句、自然语言(用户所说的完整的语句) 以及书面语言(由用户输入的不完整的语句)中的任一种。对于对话、 回答等也同样,涵盖了用户发声的交谈以及键盘输入式的对话和回 答等。但是,作为对话型的信息检索装置,专利申请人研究、开发了阶梯 (laddering)型检索装置。即,研究、开发了如下装置该装置在与用户 的对话中,反复进行逐渐深入的询问,由此引出用户的需要和价值观, 来查找出与所引出的信息相匹配的服务和内容等。为了适当地引出用户 的需要和价值观,要求利用自然的对话使用户抱有亲近感(亲切感)。但是,上述现有装置是识别(提取)谓语和与其对应的语格要素并 使用他们进行应答的方法,应答的生成方法是限制性的,无法有效地表 现出亲近感。并且,在现有装置中,谓语和语格要素仅保留中心语,在应答中不 使用修饰语句。与谓语组合的语格要素在一个候选中仅使用一个。因此, 无法充分地保证对话的自然性。并且,在阶梯型检索装置中,准备几个以获得来自用户的信息为目 的的发话(对用户询问的类别),需要系统主导性地改变话题,但是,在 现有装置中,来自系统的发话是对来自用户的发话进行承接的应答 或单纯的附和,对怎样使系统主导性地本文档来自技高网...

【技术保护点】
一种信息检索装置,该信息检索装置包含: 用户发话解析单元,其通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析; 用户数据保持单元,其保持用户数据,作为所述 用户发话解析单元的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来; 匹配单元,其参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用 户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及 对话控制单元,其向用户侧输出由所述匹配单元选出的各个所述对象数据候选。

【技术特征摘要】
2008.2.15 JP 2008-034743;2008.2.15 JP 2008-034999;1. 一种信息检索装置,该信息检索装置包含用户发话解析单元,其通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;用户数据保持单元,其保持用户数据,作为所述用户发话解析单元的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;匹配单元,其参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及对话控制单元,其向用户侧输出由所述匹配单元选出的各个所述对象数据候选。2. 根据权利要求1所述的信息检索装置,其中, 所述匹配单元包括评价值计算部,其在所述属性值的取得比例小于规定值的情况下, 计算所述用户数据中的针对所述所有属性的各个所述属性值的评价值; 以及属性选择部,其参照规定的属性判定规则,进行与所述评价值计算 部的评价值计算结果对应的属性选择处理。3. 根据权利要求2所述的信息检索装置,其中, 所述属性选择部从进行优先级高的属性开始依次选择进行与用户之间的对话的对话方案。4. 根据权利要求1所述的信息检索装置,其中, 所述对话控制单元从与所述用户的输出优先级高的属性相匹配的所述对象数据候选开始依次进行输出。5. 根据权利要求1所述的信息检索装置,其中,通过对话管理装置进行与用户的对话,该对话管理装置包含对话方案数据库,其存储多个对话方案;方案选择单元,其从所述对话方案数据库中选择与从信息请求单元 所请求的信息有关的对话方案;应答生成单元,其根据由所述方案选择单元所选择的所述对话方案, 生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;行动决定单元,其从回答语句解析单元接受属性和针对所述属性的 属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对 话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个 所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应 答语句的用户回答语句进行解析;以及对话控制单元,其按照由所述行动决定单元所决定的之后的行动, 进行与用户之间的对话控制。6. 根据权利要求5所述的信息检索装置,其中,在对话管理装置中,各个所述对话方案具有通常方案,其引出与 所述属性有关的用户的属性值;以及特别方案,其用于在与用户的对话 中应对来自用户的不规则发话、或顺利地进行与用户的对话。7. 根据权利要求5所述的信息检索装置,其中, 在对话管理装置中,各个所述对话方案对所述属性、所述应答条件、表示符合所述应答条件时随后执行的动作的应答动作进行定义。8. 根据权利要求6所述的信息检索装置,其中, 在对话管理装置中,各个所述对话方案的应答动作包含应答语句继续信息,该应答语句继续信息具有用于继续或结束该对话方案的应答、 或者调出其他对话方案的信息。9. 根据权利要求5所述的信息检索装置,其中,在对话管理装置中,所述行动决定单元根据所述属性和所述属性值 从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案 时,从所述特别方案中进行检索,然后从所述通常方案中进行检索。10. 根据权利要求5所述的信息检索装置,其中,在对话管理装置中,对所述对话方案的各个所述应答动作赋予优先 级,在所述行动决定单元检索了多个所述对话方案的情况下,所述对话 控制单元按照赋予所述应答动作的所述优先级,执行所述各对话方案的 所述应答动作。11. 根据权利要求1所述的信息检索装置,其中,通过潜在意向提 取系统根据与用户之间相互的对话信息来提取用户的潜在意向,所述潜 在意向提取系统包含-对话管理装置,其对用户的用户终端提供应答语句,接受针对所述应答语句的回答语句,按照规定的对话方案进行与用户的对话;回答语句解析装置,其对从所述用户终端接受的用户回答语句进行解析;以及对话信息蓄积装置,其按照每个用户蓄积每个所述对话方案的对话 信息,其中,所述对话管理装置包含.-对话方案数据库,其存储多个对话方案;方案选择单元,其从所述对话方案数据库中选择与从信息请求单元 所请求的信息有关的对话方案;应答生成单元,其根据由所述方案选择单元所选择的所述对话方案, 生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终4山顿;行动决定单元,其从回答语句解析单元接受属性和针对所述属性的 属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对 话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个 所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应 答语句的用户回答语句进行解析;以及对话控制单元,其按照由所述行动决定单元所决定的之后的行动, 进行与用户之间的对话控制。12. 根据权利要求1所述的信息检索装置,其中,通过信息提取装置根据来自用户的回答语句得到属性,所述信息提取装置包含-知识数据库,其系统地对多个领域的多个术语的关系进行分类; 输入单元,其取入输入信息;信息提取单元,当检测出所述输入信息中所包含的提取对象的属性 时,所述信息提取单元使用所述知识数据库中的与所述属性有关的领域 的知识,提取所述输入信息中包含的针对所述属性的属性值;以及提取信息存储单元,其将由所述信息提取单元提取出的所述属性和 该属性的所述属性值对应起来进行存储。13. 根据权利要求12所述的信息检索装置,其中,在所述的信息提取装置中,所述信息提取单元具有信息提取方法决 定部,所述信息提取方法决定部根据规定的指定信息来决定从所述输入 信息中提取所述属性值的提取方法。14. 根据权利要求13所述的信息检索装置,其中, 在所述的信息提取装置中,所述信息提取单元通过所述知识数据库中的与所述属性有关的领域知识和构成所述输入信息的字符串或形态解 析结果之间的匹配,来提取针对所述属性的所述属性值。15. 根据权利要求13所述的信息检索装置,其中, 在所述的信息提取装置中,在所述输入信息是由具有所述属性和所述属性值的对应关系的规定语句结构构成的情况下,所述信息提取单元 通过所述输入信息的句法解析,提取所述规定的语句结构。16. 根据权利要求13所述的信息检索装置,其中, 在所述信息提取装置中,所述信息提取单元提取所述输入信息中所包含的表示用户的意图的信息。17. 根据权利要求1所述的信息检索装置,其中,通过对话系统进 行与用户的对话,该对话系统在人和作为与人之间的界面的装置之间接 收和发送自然语言语句的数据,来进行与人...

【专利技术属性】
技术研发人员:村田稔树北村美穗子介弘达哉山本刚史福岛直士下畑纱遥利池野笃司
申请(专利权)人:冲电气工业株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1