基于本体的资源发现系统及方法技术方案

技术编号:11637690 阅读:99 留言:0更新日期:2015-06-24 12:23
本发明专利技术公开了一种基于本体的资源发现系统及方法,所述的系统包括:实例与类匹配模块,用于将资源或/和请求映射至本体类(指资源本体);编码模块,用于对资源或/和请求进行分别编码;资源注册模块,用于将资源在与其编码拥有最长共同前缀的节点处注册,并将该资源信息传输至合适位置,且提供并维护资源信息;资源查询模块,用于按照请求编码生成的集合,在覆盖网络中查询合适的、可用的资源等;本发明专利技术以本体层次结构为基础,实现了资源与请求编码算法;在此基础上,进一步实现了资源注册与资源查询算法。使基于结构化P2P的资源发现协议可以有效支持复杂查询,并提高了查全率与查准率。

【技术实现步骤摘要】

本专利技术涉及一种信息检索方法,更具体的说,本专利技术主要涉及一种。
技术介绍
随着信息技术的发展,分布式系统已成为人类解决问题的重要工具。分布式系统最基本、最重要的功能是实现资源的无障碍共享,而资源发现(Resource Discovery)是分布式系统实现资源共享的基础与关键。资源发现是指根据用户请求,返回满足用户要求资源信息的过程。由于具有良好的扩展性和健壮性,拥有高效率、低开销的请求转发算法;因此基于结构化P2P的资源发现协议是目前构建分布式系统的最佳选择。但现实并非如此,无法有效支持复杂查询(Complex Query)阻碍了其在现实中的应用。高效合理的复杂查询算法,是资源发现拥有良好性能的重要保障之一。资源发现协议支持的资源查询方式越多,为用户提供的服务就越丰富;而且实际应用中,资源多以多属性范围方式进行约束,复杂查询更加符合用户的请求模式,因此能否支持复杂查询对资源发现协议具有十分重要的意义。对该问题的研宄一直是资源发现研宄领域的热点,具有代表性的策略有:多覆盖网络策略与属性组合编码策略。多覆盖网络策略为系统中每个属性均构建一个覆盖网络,每个属性的覆盖网络维护了所有拥有该属性资源的信息。改进编码算法,使编码的顺序与属性值大小具有固定对应关系。最终同时解决范围查询与多属性查询问题。多覆盖网络策略思路简单,易于在已有基于结构化P2P的资源发现系统上进行扩展。如果一个资源拥有η个属性,则整个系统需要维护该资源信息的η个拷贝;当资源种类很多、属性数量很大时,会浪费大量系统资源。该策略效率不高,每次查询所涉及的覆盖网络,会有大量资源信息并不属于欲请求资源,系统将花费大量时间排除无用信息。属性组合编码策略对所有可能出现的属性组合进行编码,形成多维编码空间。空间中每个坐标轴代表一个属性,坐标轴的值代表了该属性的取值范围,然后利用SFC(Space Filled Curve,空间填充曲线)将多维空间映射到I维空间上来。具体策略是:利用SFC对编码空间递归编码,递归深度为d,其中d是空间维数,每次递归将所在子空间分割为η个子空间(η提前给定),每个子空间均赋予一个唯一的η位编码。SFC通过且仅一次通过空间中的所有点,并且仅一次进入与退出空间,因此空间中各点的编码是唯一的。用户进行查询时,系统首先根据用户描述中的属性约束,将欲请求的资源映射到编码空间的一点上进行编码,然后再将请求转发至该编码所存储的节点进行查询。如果该查询是范围查询,则将映射得到编码空间的一个子空间上,然后将请求转发至合适节点,此时可能是多个节点。采用属性组合编码策略,当属性数量很大、属性取值范围很广时,编码会十分复杂。存在大量没有实际意义的属性组合的编码,造成编码空间利用率低。该策略的扩展性差,当系统中出现新类型资源并引入了新属性时需要改变所有已有编码。这些策略主要采用基于语法的、完全对称的资源匹配方式。系统根据用户所提供的约束,将已有资源与约束中的属性按照一一对应的规则进行匹配,必须完全匹配才被认为是合适资源。该方式思想简单、易实现,但其无法满足今后资源发现协议发展的要求,主要原因如下: (O资源提供者与用户需要事先约定属性描述细节,如属性名称、属性值的单位等。目前,在大规模分布系统中,资源提供者与用户多属于不同组织,建立在不同平台上,使用了不同描述方式,必须使用大量中间件进行转化。事先进行约定的成本过高,可操作性不强。(2)灵活性不足,无法方便地进行扩展。分布式系统中资源类型将日益丰富,新属性随之逐渐增加,系统必须有良好的灵活性,可以随着新属性的加入而方便地扩展,目前基于语法的策略很难达到这一要求。(3)性能不理想,查准率与查全率低。由于存在不同资源具有相似、甚至相同描述的可能,还存在部分资源描述不完整、不规范的情况,所以传统方式中资源查准率并不理想。基于语法的查询只返回与描述约束完全一致的资源,其它满足要求,但描述不匹配的相关资源会被忽略,使得系统查全率低。
技术实现思路
本专利技术的目的之一在于针对上述不足,提供一种,以期望解决现有技术中资源信息的不同描述方式需使用中间件进行转化,灵活性不足,无法方便的进行扩展,且查准率与查全率低下等技术问题。为解决上述的技术问题,本专利技术采用以下技术方案: 本专利技术一方面提供了一种基于本体的资源发现系统,所述的系统包括: 实例与类匹配模块,用于将资源或/和请求映射至本体类(指资源本体); 编码模块,用于对资源或/和请求进行分别编码; 资源注册模块,用于将资源在与其编码拥有最长共同前缀的节点处注册,并将该资源信息传输至合适位置,且提供并维护资源信息; 资源查询模块,用于按照请求编码生成的集合,在覆盖网络中查询合适的、可用的资源; 覆盖网络,用于组织节点,负责新节点加入的相关动作,当有新节点出现时,节点按照慢加入方式进入覆盖网络。作为优选,进一步的技术方案是:所述编码模块用于为本体类中所有Superclass-Subclass关系赋予一个ce,再采用贝叶斯网络法将资源映射至相应的本体叶子类,最后,组合从根类到对应类路径上的所有ce,生成资源编码。更进一步的技术方案是:所述编码模块为本体类中所有Superclass-Subclass关系赋予一个ce时,同一个父类与其子类之间的所有Superclass-Subclass关系上的ce各不相同。更进一步的技术方案是:所述编码模块用于为本体类中所有Superclass-Subclass关系赋予一个ce,再采用贝叶斯网络法将请求映射至所有本体类,最后,组合从根类到对应类路径上的所有ce,生成请求编码。本专利技术另一方面还提供了一种基于本体的资源发现的实现方法,其特征在于所述的方法包括如下步骤: 步骤1、实例与类匹配模块将资源或/和请求映射至本体类; 步骤2、编码模块对资源或/和请求进行分别编码; 步骤3、资源注册模块将资源在与其编码拥有最长共同前缀的节点处注册,并将该资源信息传输至合适位置,且提供并维护资源信息; 步骤4、资源查询模块按照请求编码生成的集合,在覆盖网络中查询合适的、可用的资源; 作为优选,进一步的技术方案是所述的方法还包括:覆盖网络组织节点,负责新节点加入的相关动作,当有新节点出现时,节点按照慢加入方式进入覆盖网络。更进一步的技术方案是所述资源查询模块在覆盖网络中查询资源的步骤为: 步骤41:将用户请求转发至目的节点,并转步骤42 ; 步骤42:目的节点查看是否存储有满足该请求的资源的信息,若没有则返回空,并转步骤44,否则将合适资源信息加入结果集,并转步骤43 ; 步骤43:目的节点检测本地叶子集与请求的资源编码集是否有交集,如果没有,则转步骤44,否则将请求发送给交集中的所有节点,并转步骤42; 步骤44:查询结束。更进一步的技术方案是:所述编码模块进行资源编码的方式为将本体类中所有Superclass-Subclass关系赋予一个ce,再采用贝叶斯网络法将资源映射至相应的本体叶子类,最后,组合从根类到对应类路径上的所有ce,生成资源编码。更进一步的技术方案是:所述编码模块为本体类中所有Superclass-Subclass关系赋予一个ce时,同一个父类与其子类之间的所有Superclass-Subclas本文档来自技高网
...

【技术保护点】
一种基于本体的资源发现系统,其特征在于所述的系统包括:实例与类匹配模块,用于将资源或/和请求映射至本体类;编码模块,用于对资源或/和请求进行分别编码;资源注册模块,用于将资源在与其编码拥有最长共同前缀的节点处注册,并将该资源信息传输至合适位置,且提供并维护资源信息;资源查询模块,用于按照请求编码生成的集合,在覆盖网络中查询合适的、可用的资源;覆盖网络,用于组织节点,负责新节点加入的相关动作,当有新节点出现时,节点按照慢加入方式进入覆盖网络。

【技术特征摘要】

【专利技术属性】
技术研发人员:苗壮李阳乔艳玲徐伟光王家宝陆建江张千千
申请(专利权)人:中国人民解放军理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1