System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国土调查数据的图谱构建方法、系统及介质技术方案_技高网

国土调查数据的图谱构建方法、系统及介质技术方案

技术编号:41982103 阅读:10 留言:0更新日期:2024-07-12 12:12
本发明专利技术提供国土调查数据的图谱构建方法、系统及介质,涉及国土图谱技术领域,方法包括:获取国土调查数据集,国土调查数据包含地理位置信息;由总服务器:按照地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集;对区块数据集赋予区块编码,并关联分服务器的处理编码;将区块数据集上传至关联的分服务器上;由分服务器:清除区块数据集内重复的国土调查数据,得到第一数据集;从第一数据集中抽取实体、属性和关系,构建三元组,得到三元组子集;由数据库服务器:对来自不同分服务器的三元组子集进行语义融合,得到三元组集合;将三元组集合存储于Neo4j图数据库中,得到知识图谱。提高了大规模数据集的处理效率。

【技术实现步骤摘要】

本专利技术涉及国土图谱,具体涉及国土调查数据的图谱构建方法、系统及介质


技术介绍

1、国土调查是为了全面细化和完善全国土地利用基础数据;由于收集的国土调查数据量巨大,从国土调查数据中抽取到的数据量仍旧巨大,且由于国土调查数据来源的多样性和复杂性,数据质量参差不齐,国土调查数据中存在大量的噪声、重复或错误数据;不仅如此,随着数据量的增加,数据安全问题愈发突出,大量数据的集中处理增加了数据泄露的风险;利用传统数据处理方法处理大规模数据集时,处理效率慢。


技术实现思路

1、本专利技术的目的在于提供国土调查数据的图谱构建方法、系统及介质,所要解决的技术问题是提高大规模数据集的处理效率。

2、本专利技术通过下述技术方案实现:

3、第一方面提供国土调查数据的图谱构建方法,包括以下步骤:

4、s100、获取国土调查数据集,上述国土调查数据集中的任一国土调查数据包含地理位置信息;将上述国土调查数据集上传至总服务器;

5、由上述总服务器进行以下操作:

6、s200、按照上述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集;

7、s300、对每一上述区块数据集赋予唯一的编码,得到区块编码;将上述区块编码与分服务器的处理编码进行关联;

8、s400、通过上述区块编码和处理编码,将上述区块数据集上传至关联的分服务器上;

9、由上述分服务器进行以下操作:

10、s500、清除上述区块数据集内重复的国土调查数据,得到第一数据集;

11、s600、从上述第一数据集中抽取实体、属性和关系,构建三元组;若干上述三元组构成三元组子集,将上述三元组子集上传至数据库服务器;

12、由上述数据库服务器进行以下操作:

13、s700、对来自不同上述分服务器的三元组子集进行语义融合,得到三元组集合;

14、s800、将上述三元组集合存储于neo4j图数据库中,得到知识图谱。

15、采用总服务器与分服务器协同工作,实现了数据的分布式处理。通过将国土调查数据集按照地理位置信息分割成若干区块数据集,并分别上传至关联的分服务器上,充分利用多台服务器的计算能力,避免单一服务器处理大规模数据集时的性能瓶颈,从而提高计算效率;

16、通过将区块数据集分配到不同的分服务器上,可以实现负载均衡,使得每台服务器处理的数据量相对均衡,避免了某些服务器过载而其他服务器空闲的情况;这种资源利用的优化不仅提高了处理效率,还有助于延长服务器的使用寿命。

17、为每个区块数据集赋予了唯一的编码,并与分服务器的处理编码进行关联,这种编码关联的方式使得数据管理变得简单高效,无论是数据的上传、下载还是处理,都可以通过编码快速定位到相应的区块数据集和分服务器,减少了数据管理的复杂性和错误率。

18、在分服务器上进行的重复数据清除操作,能够有效减少数据集中的冗余数据,从而减小后续处理的数据量,提高处理效率;同时,减少冗余数据也有助于节省存储空间,降低存储成本。

19、通过数据库服务器对来自不同分服务器的三元组子集进行语义融合,可以得到一个统一的三元组集合,进而构建出完整的知识图谱。这种语义融合的方式不仅实现了数据的整合和统一,还能够在一定程度上消除数据之间的不一致性和矛盾,提高了知识图谱的准确性和可靠性。

20、将三元组集合存储于neo4j图数据库中,能够充分利用图数据库在存储和查询复杂关系数据方面的优势;neo4j图数据库采用图结构存储数据,能够高效地处理节点和关系之间的复杂查询,支持高效的图遍历算法,从而提高了知识图谱的查询效率和响应速度。

21、综上,该方法通过分布式处理、负载均衡、编码关联、重复数据清除、语义融合以及neo4j图数据库的高效存储与查询等技术手段,显著提高了大规模数据集的处理效率,为构建高效、准确、可靠的国土调查数据图谱提供了有力的支持。

22、进一步的,上述国土调查数据集中的任一国土调查数据包含数据收集时间;

23、上述总服务器配置有收集时间范围;

24、由上述总服务器在对国土调查数据集进行分割处理之前,清除收集时间范围外的国土调查数据。

25、首先,国土调查数据集包括了关于国土的各种详细信息的国土调查数据,该国土调查数据还包括了数据收集的时间,这一时间戳可以帮助确定数据的时效性和准确性。

26、然后,总服务器被配置了一个特定的收集时间范围,通过这个时间范围,总服务器可以确定哪些数据是需要的,哪些数据是已经过时或不再需要的。

27、接下来,当总服务器需要对国土调查数据集进行分割处理时,它首先会进行一个预处理步骤:清除收集时间范围外的国土调查数据,确保在后续的数据处理和分析中,只使用那些在规定时间范围内的、具有时效性和准确性的数据。

28、进一步的,按照上述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集,具体步骤包括:

29、s210、上述总服务器预先设置有经度分割数量和纬度分割数量;

30、s220、从上述国土调查数据集中获取国土区域的边界经度和边界纬度;

31、s230、通过上述边界经度确定经度跨度,通过边界纬度确定纬度跨度;

32、s240、通过上述经度分割数量等间距分割经度跨度,得到若干经度分割线;通过纬度分割数量等间距分割纬度跨度,得到若干纬度分割线;

33、s250、若干上述经度分割线和纬度分割线相交,得到若干区块数据集;上述区块数据集是由相邻的经度分割线和纬度分割线围成的封闭区域。

34、上述总服务器根据实际需求或预设规则,设置了将国土调查数据集分割为区块数据集所需的经度分割数量和纬度分割数量,提取出国土区域的边界信息,确定国土区域的大致范围;以边界信息确定经度跨度和纬度跨度,以此反映国土区域在地球表面的大致面积。再利用设置的经度分割数量和纬度分割数量对国土区域进行有效的分割,得到若干具有明确边界和地理位置信息的区块数据集。

35、进一步的,上述分服务器将重复的国土调查数据定义为所有字段均相同。

36、上述分服务器根据重复的国土调查数据的定义,清除所有字段均相同的国土调查数据,解决数据冗余的问题,提高数据质量和处理效率。

37、第二方面提供国土调查数据的图谱构建系统,该图谱构建系统采用上述的图谱构建方法;

38、该图谱构建系统包括:

39、数据采集模块,用于获取包含地理位置信息的国土调查数据,得到国土调查数据集;

40、总服务器,与上述数据采集模块连接;

41、上述总服务器用于进行以下操作:

42、接收国土调查数据集;

43、按照上述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集;

44、对每一上述区块数据集赋予唯一的编码,本文档来自技高网...

【技术保护点】

1.国土调查数据的图谱构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,所述国土调查数据集中的任一国土调查数据包含数据收集时间;

3.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,按照所述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集,具体步骤包括:

4.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,所述分服务器将重复的国土调查数据定义为所有字段均相同。

5.国土调查数据的图谱构建系统,其特征在于,该图谱构建系统采用权利要求1~4任一项所述的图谱构建方法;

6.根据权利要求5所述的国土调查数据的图谱构建系统,其特征在于,所述数据采集模块(10)用于获取包含地理位置信息和数据收集时间的国土调查数据;

7.根据权利要求5所述的国土调查数据的图谱构建系统,其特征在于,所述总服务器(20)用于按照所述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集,具体步骤包括:

8.根据权利要求5所述的国土调查数据的图谱构建系统,其特征在于,所述分服务器(30)用于将重复的国土调查数据定义为所有字段均相同。

9.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至4中任意一项所述的图谱构建方法。

...

【技术特征摘要】

1.国土调查数据的图谱构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,所述国土调查数据集中的任一国土调查数据包含数据收集时间;

3.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,按照所述地理位置信息对国土调查数据集进行分割处理,得到若干区块数据集,具体步骤包括:

4.根据权利要求1所述的国土调查数据的图谱构建方法,其特征在于,所述分服务器将重复的国土调查数据定义为所有字段均相同。

5.国土调查数据的图谱构建系统,其特征在于,该图谱构建系统采用权利要求1~4任一项所述的图谱构建方法;

6.根据...

【专利技术属性】
技术研发人员:申作锋管锐李军生
申请(专利权)人:潍坊市勘察测绘研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1