内容检索装置及内容检索方法制造方法及图纸

技术编号:4887795 阅读:192 留言:0更新日期:2012-04-11 18:40
提供一种能够将适合于时事性的关联关键字高效率地提示给用户的内容检索装置。内容检索装置(100)利用关联关键字从内容数据库中检索规定内容,具备:关联区间计算部(106),根据由表示内容数据库(101)所存储的第1内容的数据的多个第1关键字和表示内容数据库(101)所存储的第2内容的数据的多个第2关键字计算出的各内容属性的差异度是否满足规定基准值,按内容属性计算设定为使第1内容和第2内容包含在同一时间区间中的关联区间;以及词典更新部(107),使用按内容属性计算出的关键字间的关联度和上述关联区间,更新存储在词典数据库(102)中的关联度。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用来从大量存储的内容之中检索用户想要使用的内容的内容检索装置。
技术介绍
作为从存储在服务器等中的大量内容之中检索想要的内容的方法,提出了多种从 检索装置侧提示多个关联关键字的方法。这里,所谓关联关键字,是指与用户确定的单词 (关键字)有关联的单词(关键字)。此外,一般根据关键字间的同现数、出现频度等计算 表示相互关联的关键字间的关联程度的关联度。这样的检索装置与存储了内容的内容数据库的数据更新同时更新用来提示关联 关键字的关键字间的关联(例如参照专利文献1)。因而,该检索装置对用户提示基于存储 在内容数据库中的最新内容的关联关键字。但是,用户由指定的关键字想起的关联关键字根据用户不同而分别不同。例如,仅 视听了“男演员A”出演的最近播放的电视剧的用户作为关联关键字而想起在该电视剧中出 演的“女演员B”。另一方面,仅视听了“男演员A”出演的于1年前播放的电视剧的用户作 为关联关键字而想起在该电视剧中出演的“女演员C”。这样,在用户个人的知识不同的情 况下,用户对于“男演员A”想起的关联关键字有可能为不同的关键字。即,在检索装置仅提 示了根据最新的内容生成的关联关键字的情况下,根据用户不同,被提示了不能想起的关 联关键字。结果,有用户不能进行关键字的选择、不能缩减内容的问题。所以,以往为了解决这样的问题,提出了将存储在内容数据库中的所有的内容通 过固定时间的时间区间分类的方法(例如参照专利文献2)。由此,利用专利文献2的方法 的检索装置可以按时间区间构建关键字间的关联。结果,该检索装置能够对用户按多个时 间区间提示根据不同的时间区间的关联生成的关联关键字。例如,该检索装置作为与“男演 员A”关联的关键字,可以将在对应于今年1年间的内容中关联强的“女演员B”和在对应于 去年1年间的内容中关联强的“女演员C”同时提示给用户。这样,通过检索装置提示多个 时间区间中的关联关键字,用户能够选择适合于自己的知识的关联关键字。即,用户能够有 效地进行通过重复关联关键字的选择进行的内容的缩减。[专利文献1]日本特开2007-188225号公报[专利文献2]日本特开2002-183175号公报但是,在利用专利文献2的方法的以往的检索装置中,由于利用固定时间的时间 区间将存储在内容数据库中的所有的内容分类,所以有不能提示与各内容的关键字结构的 变化对应的关联关键字的问题。一般,在内容数据库中存储有属性(类型)不同的多个内容的情况下,内容的关键 字结构较大地变化的频度根据属性不同而大为不同。例如,在电视节目的情况下,新闻节目 在较短的时间间隔中关键字结构较大地变化,而电视剧节目仅一季度一次关键字结构较大 地变化。这样,在内容数据库之中包含有关键字结构较大变化的频度不同的属性的内容的 情况下,如果以往的检索装置决定固定时间以使其适合于关键字结构较大变化的频度较低 的内容,则检索装置不能提示适合于各属性的关键字结构较大变化的频度的具有时事性的 关联关键字。例如,假设在关键字结构较大变化的频度较高的“新闻类型”的内容中,对于关 键字“话题”,关联度较高的关键字在特定的期间中以“国会”一“足球”一“台风”的顺序变 化。在此情况下,以往的检索装置匹配于关键字结构较大变化的频度较低的“电视剧类型” 的内容而决定上述确定的期间包含在1个时间区间中的固定时间。结果,从“国会”、“足球” 及“台风”之中,将对于“话题”关联度最高的关键字作为关联关键字提示。即,有可能有对 于“话题”不是提示作为最适合于时事性的关联关键字的“台风”而是提示“国会”或“足球” 的情况。另一方面,如果以往的检索装置决定固定时间以使其适合于关键字结构较大变化 的频度较高的内容,则检索装置在多个时间区间中提示相同的关联关键字。例如,在以往的 检索装置匹配于关键字结构较大变化的频度较高的“新闻类型”的内容决定了固定时间的 情况下,检索装置在关键字结构较大变化的频度较低的“电视剧类型”的内容中,在多个时 间区间中提示相同的关联关键字。由于检索装置能够对用户一次提示的关键字的数量存在 限制,所以提示多个相同的关键字会造成使用户的选择分支的范围变窄。结果,在用户选择 关键字时,产生多余的检索步骤的可能性变高。即,在以往的检索装置中,用户不能有效地 检索内容。
技术实现思路
所以,本专利技术的目的是解决上述问题,提供一种能够将适合于时事性的关联关键 字高效率地提示给用户的内容检索装置。为了达到上述目的,有关本专利技术的内容检索装置,利用与表示内容的数据的关键 字关联的关联关键字,从按表示内容的分类的内容属性存储内容的内容数据库中检索规定 的内容,其特征在于,具备词典数据库,按表示规定的时间区间的关联区间,存储表示是包 含在上述关联区间中的内容且属于由上述内容属性表示的分类的内容的数据的多个关键 字间的关联度;关联区间计算机构,根据通过表示存储在上述内容数据库中的第1内容的 数据的多个第ι关键字和表示存储在上述内容数据库中的第2内容的数据的多个第2关键 字计算出的每个上述内容属性的差异度是否满足规定基准值,按上述内容属性计算设定为 使上述第1内容和上述第2内容包含在同一时间区间中的关联区间;词典更新机构,在包含 于由上述关联区间计算机构计算出的关联区间中的内容中,使用按上述内容属性计算出的 关键字间的关联度、以及上述关联区间,更新存储在上述词典数据库中的关联度;以及输出 生成机构,根据存储在上述词典数据库中的关联度,生成用来将与用户输入的关键字关联 的关联关键字按上述关联区间输出的输出信息。由此,在从混合存储有关键字结构变化的频度不同的属性的内容的内容数据库中 检索内容的情况下,内容检索装置通过根据按内容属性计算出的关联区间更新词典数据 库,由此能够将适合于时事性的关联关键字高效率地提示给用户。具体而言,在关键字结构较大变化的频度较高的属性的内容的情况下,内容检索 装置更新词典数据库以成为比其他属性短的时间的关联区间,所以能够将适合于时事性的关键字提示给用户。另一方面,在关键字结构较大变化的频度较低的属性的内容的情况下, 内容检索装置更新词典数据库以成为比其他属性长的时间的关联区间,所以不会在多个关 联区间中提示同一个关键字,即能够高效率地提示关键字。进而,在从存储有关键字结构非周期性变化的属性的内容的内容数据库中检索内 容的情况下,内容检索装置通过根据按照内容关键字结构的变化计算出的关联区间来更新 词典数据库,能够将适合于时事性的关联关键字高效率地提示给用户。具体而言,在关键字结构以较短的周期变化时,内容检索装置更新词典数据库以 成为比其他短的时间的关联区间,所以能够将适合于时事性的关键字提示给用户。另一方 面,在关键字结构以较长的周期变化时,内容检索装置更新词典数据库以成为比其他长的 时间的关联区间,所以不会在多个关联区间中提示同一个关键字,即能够高效率地提示关 键字。此外,也可以其特征在于,上述关联区间计算机构在将包含在存储于上述词典数 据库中的最新的关联区间中的内容作为上述第2内容,计算关联区间。由此,在将新的时间区间的内容追加到内容数据库中的情况下,根据新的时间区 间与在上次更新时计算出的关联区间的关键字结构的差异度决定新的关联区间,所以能够 将适合于时事性本文档来自技高网
...

【技术保护点】
一种内容检索装置,利用与表示内容的数据的关键字相关联的关联关键字,从内容数据库中检索规定内容,该内容数据库按表示内容的分类的内容属性存储有内容,上述内容检索装置的特征在于,具备:词典数据库,按表示规定的时间区间的关联区间,存储对作为上述关联区间所包含的内容且属于由上述内容属性表示的分类的内容的数据进行表示的多个关键字间的关联度;关联区间计算机构,根据通过表示上述内容数据库所存储的第1内容的数据的多个第1关键字以及表示上述内容数据库所存储的第2内容的数据的多个第2关键字来计算的各上述内容属性的差异度是否满足规定基准值,按上述内容属性计算被设定为上述第1内容和上述第2内容包含在同一时间区间中的关联区间;词典更新机构,在由上述关联区间计算机构计算的关联区间所包含的内容中,使用按上述内容属性计算的关键字间的关联度、以及上述关联区间,更新上述词典数据库所存储的关联度;以及输出生成机构,根据上述词典数据库所存储的关联度,生成用于按上述关联区间输出与用户输入的关键字相关联的关联关键字的输出信息。

【技术特征摘要】
【国外来华专利技术】JP 2008-3-10 2008-059914一种内容检索装置,利用与表示内容的数据的关键字相关联的关联关键字,从内容数据库中检索规定内容,该内容数据库按表示内容的分类的内容属性存储有内容,上述内容检索装置的特征在于,具备词典数据库,按表示规定的时间区间的关联区间,存储对作为上述关联区间所包含的内容且属于由上述内容属性表示的分类的内容的数据进行表示的多个关键字间的关联度;关联区间计算机构,根据通过表示上述内容数据库所存储的第1内容的数据的多个第1关键字以及表示上述内容数据库所存储的第2内容的数据的多个第2关键字来计算的各上述内容属性的差异度是否满足规定基准值,按上述内容属性计算被设定为上述第1内容和上述第2内容包含在同一时间区间中的关联区间;词典更新机构,在由上述关联区间计算机构计算的关联区间所包含的内容中,使用按上述内容属性计算的关键字间的关联度、以及上述关联区间,更新上述词典数据库所存储的关联度;以及输出生成机构,根据上述词典数据库所存储的关联度,生成用于按上述关联区间输出与用户输入的关键字相关联的关联关键字的输出信息。2.如权利要求1所述的内容检索装置,其特征在于,上述关联区间计算机构在上述差异度超过规定基准值的情况下,计算通过对应于上述 第1内容的时间区间来决定的关联区间,在上述差异度是规定基准值以下的情况下,计算 通过将上述词典数据库所存储的最新的关联区间与对应于上述第1内容的时间区间相加 得到的时间区间来决定的关联区间。3.如权利要求2所述的内容检索装置,其特征在于,上述关联区间计算机构将存储在上述词典数据库中的最新的关联区间所包含的内容 作为上述第2内容,来计算关联区间。4.如权利要求3所述的内容检索装置,其特征在于,上述关联区间计算机构根据上述第1关键字中的出现频度高的规定数量的关键字与 上述第2关键字中的出现频度高的规定数量的关键字之间的差异度是否满足规定基准值, 来计算关联区间。5.如权利要求2所述的内容检索装置,其特征在于,上述关联区间计算机构将与上次新添加在上述内容数据库中的内容对应的时间区间 中的、预定长度时间的时间区间所包含的内容作为上述第2内容,来计算关联区间。6.如权利要求1所述的内容检索装置,其特征在于,上述内容检索装置还具备属性取得机构,取得与用户输入的关键字相关联的内容属性;以及关联关键字取得机构,通过参照上述词典数据库,按关联区间取得与上述用户输入的 关键字和由上述属性取得机构取得的内容属性对应的关联关键字;上述输出生成机构生成用于输出由上述关联关键字取得机构取得的关联关键字的上 述输出信息。7.如权利要求6所述的内容检索装置,其特征在于,上述关联关键字取得机构在由上述属性取得机构取得了多个内容属性的...

【专利技术属性】
技术研发人员:高田和豊续木贵史松浦聪
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1