一种基于语义网的信息查询方法技术

技术编号:10692687 阅读:209 留言:0更新日期:2014-11-26 19:37
本发明专利技术涉公开了一种基于语义网的信息查询方法,用于根据特定的语义查询语句在本体库中查找与语义查询语句相匹配的本体类实例并对查询结果进行排序,所述方法包括以下步骤:S101、遍历本体实例图。S103、根据所述的本体类实例与各查询关键字之间的语义关系路径的权重和语义关系路径的数量,综合计算当前本体类实例与查询关键字之间的相关性。104根据所述的本体类实例与各查询关键字之间的相关性以及各查询关键字的权重,综合计算每个本体类实例与查询关键字集合之间的相关性。S105、按照所述相关性从大到小的顺序对所述的本体类实例进行排序。本发明专利技术有效提高了语义网信息查询的查准率和查全率。

【技术实现步骤摘要】
【专利摘要】本专利技术涉公开了,用于根据特定的语义查询语句在本体库中查找与语义查询语句相匹配的本体类实例并对查询结果进行排序,所述方法包括以下步骤:S101、遍历本体实例图。S103、根据所述的本体类实例与各查询关键字之间的语义关系路径的权重和语义关系路径的数量,综合计算当前本体类实例与查询关键字之间的相关性。104根据所述的本体类实例与各查询关键字之间的相关性以及各查询关键字的权重,综合计算每个本体类实例与查询关键字集合之间的相关性。S105、按照所述相关性从大到小的顺序对所述的本体类实例进行排序。本专利技术有效提高了语义网信息查询的查准率和查全率。【专利说明】
本专利技术涉及信息网络
,特别是涉及。
技术介绍
传统的信息查询技术主要使用基于关键字的查询方法,该方法主要通过把表征用户查询请求的关键字与资源的信息内容进行严格的机械匹配来实现。由于关键字的查询方法本身缺少知识表示和语义处理能力,仅仅进行关键字的匹配无法反映用户查询请求中的语义关系,从而导致查询结果的查准率偏低。语义网是由Tim Berners-Lee提出的一种新型网络体系结构,它能够为网络中的源文档添加语义信息,从而使计算机能够理解语义信息文档。本体是实现语义网的关键技术,它是知识表示的重要方法,能以一种形式化的、机器可处理的表示来描述概念之间的语义。由于本体具有良好的概念层次结构和对逻辑推理的支持,因而在信息检索中得到了广泛的应用。 近年来,国内外已经有许多基于语义网的查询技术的研究。Liu等通过构建一个基于关键词及其之间语义关系的概念关系图,实现了对关键字查询过程中语义关系的识别,但这一算法缺少对语义关系的权重分析以及对查询结果的排序。Castells等提出了一种基于本体的信息检索框架,该框架使用算法对每个语义关系赋以权重,并对查询结果按照向量空间模型进行排序,然而这一算法对语义关系的权重计算粒度较粗,并且忽略了语义关系之间的差异。Zhou等提出了一种基于关系模型的链接排序方法,该算法通过构建具有主、外键关系模型的链接结构,从而实现对查询结果的排序,但这一算法没有考虑链接之间的特异性和多样性以及关键字的涵盖范围和识别能力等问题。因此,如何提高语义网查询的有效性和准确性仍是信息检索领域研究的重点和难点。 本体是描述概念及概念之间语义关系的数据模型,它能够通过概念之间的关系来描述概念的语义,本体通常由Schema及其实例组成,它被表示在一个包括RDF特征、对象属性、数据类型属性以及反向属性的OWL-Lite子集中,通常具有以下定义: 定义ISchema S被定义为三元组〈C,D,P〉,其中C是类集,D是数据类型集,P是属性集。所有类、属性和数据类型都通过URI被准确表示,并且对于任意d e C,r e C U D,有属性p(d, r) e P,其中d和r分别被称为ρ的领域和范围。 定义2基于Schema S =〈C,D,P〉的实例图被定义为一个有向图G =〈V,E>,其中V是实例集,E是V中实例间的关系集。在实体图中,一个资源表示一个类的实例。令表示实例C e C U D的一个集合,对于每个ν e V,当V.type = c时,贝U v e 。令表示属性实例P(d,r) e P的集合,对于每个e (Vi, ν」)e E,当e = p, Vi e , Vj e 时,则e (Vi, Vj) e ,其中Vi和Vj分别为e的主体和客体。 定义3语义路径sp是Schema S =〈C, D, P〉中的一个属性序列P1 ((I1, r)P2 (d2, r2)...pm(dm, rm),其中Pi (屯,e P并且巧和di+1是相同的类或具有相同的父类。 定义4 对于语义路径 sp = P1 (d” T1) p2 (d2, r2)…pm (dm, rm), ip = e! (S1, O1)e2(s2, o2) "'(Sm, om)是sp的一个语义路径实例,当ei (Si, Oi) e 并且对于所有h有Oi = si+1时,贝丨J S1, om分别是ip的源和目的。 定义5用户查询Q被定义为二元组〈T,K〉,其中T是类集,K是关键字集。对于一个给定的Schema S =〈C,D, P〉以及一个基于S的实例图G =〈V,E>,语义搜索就是查找Q=<T, K〉的答案集Α,其中T e C。对于每个资源a e A,需要在G中至少有一个从资源a到数值为s的语义路径实例,其中a e 且数值s包含关键字k e K。
技术实现思路
为克服以上存在的问题,本专利技术提出了如下的技术方案: ,用于根据特定的语义查询语句在本体库中查找与语义查询语句相匹配的本体类实例并对查询结果进行排序,其包括以下步骤: S101、遍历本体实例图,并返回与语义查询语句中的本体类型相匹配,且与语义查询语句中的查询关键字相关联的本体类实例。 S102、针对所述的每个本体类实例分别查找当前本体类实例与各查询关键字之间的所有的语义关系路径,并分别计算语义关系路径的权重。 S103、根据所述的本体类实例与各查询关键字之间的语义关系路径的权重和语义关系路径的数量,综合计算当前本体类实例与查询关键字之间的相关性。 S104根据所述的本体类实例与各查询关键字之间的相关性以及各查询关键字的权重,综合计算每个本体类实例与查询关键字集合之间的相关性。 S105、按照所述相关性从大到小的顺序对所述的本体类实例进行排序。 进一步的,步骤102中所述的计算语义关系的权重具体包括: S2011、计算本体框架图中各本体类之间以及本体类与数据类型之间属性的权重。 S2012、根据本体框架图中的各属性的权重计算本体类到数据类型之间的语义关系路径的权重。 S2013、使用本体框架图中的语义关系路径的权重替代本体实例图中所对应的语义关系路径实例的权重。 进一步的,所述步骤S2011具体计算方法为: w (p (d, r)) = α.I (p (d, r)) + β.MI (ρ (d, r)) 式中,p(d, r)表示从本体框架图中本体类d到本体类或本体数据类型r的属性,I (P (d, r))表示属性ρ (d, r)发生时所产生的信息量,MI (p (d, r))表示属性p (d, r)在d和r之间的相互信息度量值,α, β分别为权重参数,且OS α, β ^ 10 其中,所述的I (ρ (d, r))具体计算方法为: 【权利要求】1.,用于根据特定的语义查询语句在本体库中查找与语义查询语句相匹配的本体类实例并对查询结果进行排序,其特征包括以下步骤: 5101、遍历本体实例图,并返回与语义查询语句中的本体类型相匹配,且与语义查询语句中的查询关键字相关联的本体类实例。 5102、针对所述的每个本体类实例分别查找当前本体类实例与各查询关键字之间的所有的语义关系路径,并分别计算语义关系路径的权重。 5103、根据所述的本体类实例与各查询关键字之间的语义关系路径的权重和语义关系路径的数量,综合计算当前本体类实例与查询关键字之间的相关性。 S104根据所述的本体类实例与各查询关键字之间的相关性以及各查询关键字的权重,综合计算每个本体类本文档来自技高网
...

【技术保护点】
一种基于语义网的信息查询方法,用于根据特定的语义查询语句在本体库中查找与语义查询语句相匹配的本体类实例并对查询结果进行排序,其特征包括以下步骤:S101、遍历本体实例图,并返回与语义查询语句中的本体类型相匹配,且与语义查询语句中的查询关键字相关联的本体类实例。S102、针对所述的每个本体类实例分别查找当前本体类实例与各查询关键字之间的所有的语义关系路径,并分别计算语义关系路径的权重。S103、根据所述的本体类实例与各查询关键字之间的语义关系路径的权重和语义关系路径的数量,综合计算当前本体类实例与查询关键字之间的相关性。S104根据所述的本体类实例与各查询关键字之间的相关性以及各查询关键字的权重,综合计算每个本体类实例与查询关键字集合之间的相关性。S105、按照所述相关性从大到小的顺序对所述的本体类实例进行排序。

【技术特征摘要】

【专利技术属性】
技术研发人员:夏美翠时鸿涛姜华范玉堂姜翠娥
申请(专利权)人:青岛农业大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1