用于自动建立网络上信息对象之间层次结构的方法和系统技术方案

技术编号：3540890 阅读：212 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了用于自动建立特定领域中的对象类别之间的层次结构的系统和方法。所述方法包括：获取与预定领域相关的一组ＵＲＬ；检索得到与所述ＵＲＬ组中的各个ＵＲＬ相对应的网站的集合；针对所述网站集合中的每个网站提取出一个层次结构，所述层次结构上的每个节点代表所述网站中涉及的所述预定领域的一个对象类别；以及集成提取出的所有所述层次结构以生成集成层次结构。在一个实施例中，本发明专利技术还包括提取出对象实例，以及将不带有类别信息的实例映射到集成层次结构上的相应节点的方法。根据本发明专利技术的系统和方法可以更有效地建立对象类别之间的层次结构。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息层次结构(hierarchy)的自动建立以及Web上的领域 (domain)知识收集以及层次结构建立/生成，更具体而言，本专利技术涉及用于自动建立网络上针对特定领域中的信息对象之间的层次结构的方法和系
技术介绍
计算机已经成为现代生活必不可少的工具，它可以帮助用户找到感兴趣的信息，这在当今大量信息在Web上不断积累的因特网时代尤其明显。虽然计算机在进行诸如计算、存储或搜索之类的信息处理时速度很快，但其无法理解信息，这成为智能信息处理的主要障碍。为了解决这个问题，最近用于智能信息处理的语义相关研究变得非常流行。例如，在T. Berners-Lee 、 J. Hendler禾口 0. Lassila的题为"The Semantic Web " (Scientific American, 2001年5月，第28-37页)、Nigel Shabolt、 Tim Bemers-Lee和Wendy Hall的题为"The Semantic Web Revisited" (IEEE Intelligent Systems 21(3)，第96-101页，2006年5月、6月)以及E. Hyvonen (编者)的题为"Semantic Web Kick-Off in Finland — Vision, Technologies, Research, and Applications" (HIIT Publications, 2002-001, Helsinki Institute for Information Technology (HIIT...

【技术保护点】
一种用于自动建立网络上信息对象之间的层次结构的方法，包括：　获取与预定领域相关的一组ＵＲＬ；　检索得到与所述ＵＲＬ组中的各个ＵＲＬ相对应的网站的集合；　针对所述网站集合中的每个网站提取出一个层次结构，所述层次结构上的每个节点代表所述网站中涉及的所述预定领域的一个信息对象类别；以及　集成提取出的所有所述层次结构以生成对应于所述预定领域的集成层次结构。

【技术特征摘要】

【专利技术属性】
技术研发人员：李建强，赵彧，赵凯，福岛俊一，
申请(专利权)人：日电中国有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人