System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及信息,尤其涉及用于知识图谱的正则路径查询的基准测试方法及装置。
技术介绍
1、知识图谱已成为人工智能技术研发的重要支柱。它具备了强大的语义处理和数据关联能力,为智能化发展打下了坚实的基础。资源描述框架(resource descriptionframework,rdf)成为了知识图谱的事实标准,并得到广泛应用。rdf模型使用类似图形的数据结构以可扩展的方式来描述万维网上的资源以及资源之间相互关系。相应地,万维网联盟(world wide web consortium,w3c)提出了sparql查询语言作为rdf模型的标准图查询语言,用于从rdf图中检索数据。正则路径查询是用于检查两个顶点之间是否存在一条路径,且这条路径必须符合使用正则表达式指定的路径模式。由于正则路径查询的表达性很高,很多查询语言都试图实现这个特性,比如g、pgql,sparql也通过引入属性路径(propertypath)实现正则路径查询。近些年正则路径查询被广泛研究和讨论,已经成为一个焦点问题。
2、近年来,知识图谱规模以前所未有的速度增长,包含数百万个顶点(106)和数亿条边(108)的知识图谱已经常见。如dbpedia、yago和freebase等,影响着越来越多的领域。管理和查询如此庞大的知识图谱带来了巨大的挑战。为解决这些挑战,过去二十年开发了各种三元组存储系统,并开发了多个基准测试来评估和改进它们的性能。尽管许多现有基准测试对通用的sparql查询有用,但目前还缺乏针对正则路径查询(rpqs)设计的基准测试。但现有的基准测试未
3、sp2bench是一个针对sparql查询性能的基准测试框架。基准测试基于dblp场景,包括数据生成器和一组精心设计的基准查询。通过数据生成器支持创建类似于数据库系统和逻辑编程(dblp)的大型rdf文档,反映了原始dblp数据集中遇到的关键特征和社会世界分布。生成的文档涵盖各种rdf构造,如空白节点。同时设计了17个有意义的基准查询,涵盖了最重要的sparql构造和操作符组合,同时在复杂性和结果大小等特征上有所变化。这些查询经过深入研究数据特征的设计,可以预测查询对sparql引擎所带来的挑战,有助于解释基准测试结果。通过数据生成和查询设计,sp2bench提供了全面的sparql性能评估框架,旨在测试sparql引擎在不同情境下可能面临的挑战,并为引擎性能的改进提供支持。
4、lubm是一个针对网络本体语言(owl)知识库系统的基准测试工具。提供了一个针对大规模owl应用的合成数据集,可扩展到任意大小,具有代表性的大学领域本体论。这些数据集反映了语义网领域的特殊概念和结构,如类和属性,旨在模拟真实语义网系统中的数据。同时包含14个具有多种属性的查询,旨在评估系统对不同类型查询的回答能力。通过比较系统在回答这些查询时的性能,可以评估系统的推理能力、存储机制和查询响应时间等方面的表现。
5、作为主要的导航查询形式,正则路径查询在知识图领域引起了相当大的关注,近些年被广泛研究和讨论,已经成为一个焦点问题。目前所有的测试基准都不是针对正则路径查询而设计的,因而不能很好的反应rpqs的独特性和性能需求,如模式匹配和路径遍历,全面评估三元组存储系统处理rpq语句的能力方面存在空白。
技术实现思路
1、为解决现有问题,本公开提供一种用于知识图谱的正则路径查询的基准测试方法及装置、终端和存储介质。
2、本公开采用以下的技术方案。
3、本公开的实施例提供一种用于知识图谱的正则路径查询的基准测试方法,所述用于知识图谱的正则路径查询的基准测试方法包括:通过数据生成器基于目标三元组存储系统创建模拟真实世界的图结构数据;通过基准测试查询集对所述图结构数据进行数据查询,得到查询结果,其中,所述基准测试查询集覆盖正则路径查询中的路径遍历模式、复杂性级别和操作符的各种组合;基于所述查询结果对所述目标三元组存储系统进行评估。
4、本公开的另一实施例提供了一种用于知识图谱的正则路径查询的基准测试装置,所述配置装置包括:数据生成模块,配置为通过数据生成器基于目标三元组存储系统创建模拟真实世界的图结构数据;数据查询模块,配置为通过基准测试查询集对所述图结构数据进行数据查询,得到查询结果,其中,所述基准测试查询集覆盖正则路径查询中的路径遍历模式、复杂性级别和操作符的各种组合;结果评估模块,配置为基于所述查询结果对所述目标三元组存储系统进行评估。
5、本公开的基准测试查询集覆盖正则路径查询中的路径遍历模式、复杂性级别和操作符的各种组合,解决了rdf系统中的rpq的独特需求,可以全面评估rpq算法的效率和性能,从而可以揭示当前rpq算法中的缺陷以及未来优化的方向。
本文档来自技高网...【技术保护点】
1.一种用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述用于知识图谱的正则路径查询的基准测试方法包括:
2.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述图结构数据符合幂律分布。
3.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,创建模拟真实世界的图结构数据包括:每隔N年进行数据插入,N根据数据规模自定义。
4.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述数据生成器提供了用于确定三元组数量的参数,并且具有平台无关性和可扩展性。
5.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述基准测试查询集包括第一查询、第二查询、第三查询、第四查询、第五查询、第六查询、第七查询、第八查询、第九查询、第十查询和第十一查询;
6.根据权利要求5所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述第一查询包括第一子查询、第二子查询和第三子查询,所述第一子查询用于测试引擎如何处理深层递归关系,所述第
7.根据权利要求5所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述第二查询包括第四子查询、第五子查询和第六子查询,所述第四子查询用于测试基本属性检索的效率,所述第五子查询增加检索维度,所述第六子查询添加属性,以评估引擎处理复杂检索的能力。
8.根据权利要求5所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述第四查询包括第七子查询、第八子查询和第九子查询,所述第七子查询用于评估引擎在无限递归遍历和大型数据集上的处理能力,所述第八子查询通过跟踪共同作者路径并考虑层次前辈关系,增加了查询的复杂性,以检验系统对分层数据的管理能力,所述第九子查询用于评估执行非零长度路径遍历的效率。
9.一种用于知识图谱的正则路径查询的基准测试装置,其特征在于,所述用于知识图谱的正则路径查询的基准测试装置包括:
...【技术特征摘要】
1.一种用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述用于知识图谱的正则路径查询的基准测试方法包括:
2.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述图结构数据符合幂律分布。
3.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,创建模拟真实世界的图结构数据包括:每隔n年进行数据插入,n根据数据规模自定义。
4.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述数据生成器提供了用于确定三元组数量的参数,并且具有平台无关性和可扩展性。
5.根据权利要求1所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述基准测试查询集包括第一查询、第二查询、第三查询、第四查询、第五查询、第六查询、第七查询、第八查询、第九查询、第十查询和第十一查询;
6.根据权利要求5所述的用于知识图谱的正则路径查询的基准测试方法,其特征在于,所述第一查询包括第一子查询、第...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。