额外丰富内容元数据生成器制造技术

技术编号:11173173 阅读:84 留言:0更新日期:2015-03-20 02:31
本公开涉及额外丰富内容元数据生成器。在一个实施方式中,方法包括接收与由内容提供者提供的内容项相关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括内容元数据的语言变化版本;将内容元数据连同额外元数据存储在存储设备中,其中内容元数据被存储为与额外元数据关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关元数据;识别存储为与相关元数据关联的额外的相关元数据,额外的相关元数据包括相关元数据的语言变化版本;以及增加一个或多个额外搜索项至搜索请求,一个或多个额外搜索项对应于额外相关元数据。

【技术实现步骤摘要】
额外丰富内容元数据生成器
本公开内容总体上涉及用于内容元数据生成的方法和装置。
技术介绍
随着新的混合网络(除了具有广播能力(例如,地面电视(TV)、卫星TV、电缆TV), 还具有宽带因特网能力(例如,数字用户线路(DSL)或者电缆))的迅速发展,流媒体内容 变得越来越流行。现在用户可利用和可进入包括多媒体和视听觉(AV)内容的越来越多的 内容。这样大量的增加可能随着传统的广播产业通过开发新一代的机顶盒(STB)和能够流 传送和回放此类内容的配套设备(例如,计算机、移动电话、平板电脑、手持设备等)进入互 联网电视机顶盒业务(OTT)汇聚世界而进一步增加。TV用户现在期望TV内容搜索与它们 在因特网世界中一样简单、丰富和高效。
技术实现思路
因此,根据本专利技术的一个方面,提出一种方法,包括:接收与由内容提供者提供的 内容项有关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括内容元 数据的语言变化版本;将内容元数据连同额外元数据存储在存储设备中,其中,内容元数据 被存储为与额外元数据关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版 本表示的一个或多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项 的相关元数据;识别存储为与相关元数据关联的额外的相关的元数据,额外的相关的元数 据包括相关元数据的语言变化版本;以及增加一个或多个额外的搜索项至搜索请求,一个 或多个额外的搜索项对应于额外的相关的元数据。 根据本专利技术的另一个方面,提出一种装置,包括:管理单元,可操作地接收与由内 容提供者提供的内容项相关的内容元数据;创建单元,可操作地从一个或多个外部源检索 额外元数据,额外元数据包括内容元数据的语言变化版本;存储单元,可操作地存储内容元 数据连同额外元数据,其中,内容元数据被存储为与额外元数据关联;其中,管理单元被另 外可操作为:接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或 多个搜索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关元数据; 识别存储为与相关元数据关联的额外的相关的元数据,额外的相关的元数据包括相关元数 据的语言变化版本;以及增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜 索项对应于额外的相关的元数据。 根据本专利技术的又一方面,提出一种或多种计算机可读有形存储介质,利用包括计 算机可执行指令的软件编码并且当软件被执行时,可操作为:接收与由内容提供者提供的 内容项相关的内容元数据;从一个或多个外部源检索额外元数据,额外元数据包括所接收 的内容元数据的语言变化版本;将所接收的内容元数据连同额外元数据存储在存储设备 中,其中,所接收的内容元数据被存储为与额外元数据关联;接收来自用户的搜索请求,搜 索请求包括以第一语言变化版本表示的一个或多个搜索项;在所接收的内容元数据或者额 外元数据中识别匹配一个或多个搜索项的相关元数据;识别存储为与所识别的相关元数据 关联的额外的相关的元数据,额外的相关的元数据包括所识别的相关元数据的语言变化版 本;以及增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜索项对应于额外 的相关的元数据。 【附图说明】 结合附图,从以下详细描述中将更充分地理解并领会本专利技术,在附图中: 图1是根据本专利技术的实施方式构造和操作的系统的简化框图示图; 图2是根据本专利技术的实施方式构造和操作的包括额外丰富(extra-rich,超丰富) 内容元数据生成器的系统的简化框图示图; 图3是描述根据本专利技术的实施方式的操作额外丰富内容元数据生成器的方法的 流程图;和 图4是根据本专利技术的实施方式的与具体演员相关的不同的元数据之间的关系的 方框图示图。 【具体实施方式】 概述 在一个实施方式中,方法包括接收与由内容提供者提供的内容项相关的内容元数 据;从一个或多个外部源检索额外元数据,额外元数据包括内容元数据的语言变化版本; 将内容元数据与额外元数据存储在存储设备中,其中,内容元数据被存储为与额外元数据 关联;接收来自用户的搜索请求,搜索请求包括以第一语言变化版本表示的一个或多个搜 索项;在内容元数据或者额外元数据中识别匹配一个或多个搜索项的相关的元数据;识别 存储为与相关的元数据关联的额外的相关的元数据,额外的相关的元数据包括相关的元数 据的语言变化版本;并且增加一个或多个额外的搜索项至搜索请求,一个或多个额外的搜 索项对应于额外的相关的元数据。 示例性实施方式 在以下描述中,阐述大量的具体细节以提供对本专利技术的各种原理的全面理解。然 而,本领域技术人员将理解不是所有这些细节始终必要地需要用于实践本专利技术。在此情况 下,为了避免不必要地使一般概念模糊,并未详细地示出众所周知的电路、控制逻辑、和用 于惯用算法和处理的计算机程序指令的细节。 虽然本专利技术的原理在此被大量地描述为与电视广播和OTT环境以及相关的电视 应用有关,这个是为方便展现起见选择的示例,没有限制性。 类似地,虽然本专利技术的原理在此被大量地描述为与汉语语言变化版本和格式有 关,这个是为方便展现起见选择的示例,没有限制性。 在一些国家中和/或对于某些语言,使用传统的远程控制搜索内容(诸如TV节 目、与演员/导演等相关的额外的信息)不容易、不方便、和甚至有时不可能。例如,使用通 常仅支持拉丁字的传统的远程控制来输入汉字是困难的。因此,在传统的电视广播世界的 这些区域中,内容搜索不被看做是重要的业务范围。然而,电视广播产业正在进入具有用作 用于内容消耗的新媒体的配套设备(例如,个人计算机、智能电话、平板电脑等)的提升的 多屏融合世界。这些配套设备提供包括新的和更加便利的搜索的新的功能和语言输入能 力。实际上,用户现在可以使用不同的输入类型例如,诸如绘制或者键入字(例如,中文简 体字和繁体字)的人工录入、声音录入等搜索。因此,可靠的跨平台内容搜索支持变为此类 国家和/或语言的重要的发行物。 并且,TV用户现在期望内容搜索与他们在因特网世界中一样简单和高效。通常, 提供搜索因特网以发现包含一个或多个指定关键字的内容的搜索引擎(软件程序),并 且返回与含有关键字的内容链接的搜索结果条目。诸如Google(www. google, com)或者 Yahoo(www. yahoo, com)的广泛搜索引擎使用网络爬虫(Web crawler)访问非常大量的内 容项(例如,网页)。然后,称为索引器的另一个程序解析这些内容项并且基于每个内容项 的元数据创建搜索索引。每个搜索引擎使用专有算法创建索引以理想地仅返回用于每个查 询的有意义的搜索结果。然而,由于某些语言的复杂性和多样性,原始的内容元数据可能无 法提供足够的信息以允许搜索引擎返回一致的和/或精确的搜索结果。再次参考中文语言 示例,不同类型的书面中文格式在不同的区域中存在。简体中文通常在中国大陆使用,而繁 体中文在香港和台湾使用。此外,这些不同的区域也可以使用不同的方言。事实上,普通话 是中国大陆的官方语言(也被称作汉语拼音-在下文中称为拼音),然而,广东话广泛地用 于香港或者甚至在中国大陆的南部(威妥玛式拼音法(Wade-本文档来自技高网...

【技术保护点】
一种方法,包括:接收与由内容提供者提供的内容项有关的内容元数据;从一个或多个外部源检索额外元数据,所述额外元数据包括所述内容元数据的语言变化版本;将所述内容元数据连同所述额外元数据存储在存储设备中,其中,所述内容元数据被存储为与所述额外元数据关联;接收来自用户的搜索请求,所述搜索请求包括以第一语言变化版本表示的一个或多个搜索项;在所述内容元数据或者所述额外元数据中识别匹配所述一个或多个搜索项的相关元数据;识别存储为与所述相关元数据关联的额外的相关的元数据,所述额外的相关的元数据包括所述相关元数据的语言变化版本;以及增加一个或多个额外的搜索项至所述搜索请求,所述一个或多个额外的搜索项对应于所述额外的相关的元数据。

【技术特征摘要】
2013.09.03 US 14/016,4181. 一种方法,包括: 接收与由内容提供者提供的内容项有关的内容元数据; 从一个或多个外部源检索额外元数据,所述额外元数据包括所述内容元数据的语言变 化版本; 将所述内容元数据连同所述额外元数据存储在存储设备中,其中,所述内容元数据被 存储为与所述额外元数据关联; 接收来自用户的搜索请求,所述搜索请求包括以第一语言变化版本表示的一个或多个 搜索项; 在所述内容元数据或者所述额外元数据中识别匹配所述一个或多个搜索项的相关元 数据; 识别存储为与所述相关元数据关联的额外的相关的元数据,所述额外的相关的元数据 包括所述相关元数据的语言变化版本;以及 增加一个或多个额外的搜索项至所述搜索请求,所述一个或多个额外的搜索项对应于 所述额外的相关的元数据。2. 根据权利要求1所述的方法,其中,所述从一个或多个外部源检索额外元数据包括:采集和解析一个或多个网络源,其中,所述一个或多个网络源包括以不同的语言变化 版本提供额外元数据的一个或多个网络入口;和 从所采集和所解析的一个或多个网络源中的每一个提取所述额外元数据。3. 根据权利要求1所述的方法,其中,所述从一个或多个外部源检索额外元数据包括 检索与所述内容元数据的子集相关的额外元数据。4. 根据权利要求3所述的方法,其中,所述内容元数据的所述子集包括以下的至少一 个: 演员名字; 导演名字; 片名;和 版权和/或区域信息。5. 根据权利要求1所述的方法,其中,所述额外元数据包括以下语言变化版本的至少 一个: 书面格式; 发音格式;和 社交共用名字。6. 根据权利要求5所述的方法,其中,所述书面格式包括简体中文和/或繁体中文。7. 根据权利要求5所述的方法,其中,所述发音格式包括香港、台湾通用和/或汉语拼 音。8. 根据权利要求5所述的方法,其中,对应于所述发音格式的简写创建另外的语言变 化版本。9. 根据权利要求8所述的方法,其中,所述简写通过采用发音格式的每个所述额外元 数据的每个单词的首个字母创建。10. 根据权利要求8所述的方法,其中,包括以第一语言变化版本表示的一个或多个搜 索项的所述搜索请求为发音格式的简写。11. 根据权利要求1所述的方法,所述方法进一步包括: 创建限定如何排列和显示搜索结果的权重规则;和 应用所述权重规则至使用包括所述一个或多个搜索项和所述一个或多个额外的搜索 项的所述搜索请求获得的搜索结果。12. 根据权利要求11所述的方法,其中,限定如何排列和显示搜索结果的所述权重规 则包括将以对应于所述第一语言变化版本的语言变化版本的搜索结果排列为高于其他搜 索结果。13. 根据权利要求...

【专利技术属性】
技术研发人员:李宇亮克里斯·米尔斯伊恩·R·谢尔顿斯图尔特·P·阿什比安德鲁·瓦伦廷
申请(专利权)人:思科技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1