System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于知识图谱的政务数据立方体构建方法、设备及介质技术_技高网

基于知识图谱的政务数据立方体构建方法、设备及介质技术

技术编号:42889725 阅读:7 留言:0更新日期:2024-09-30 15:10
本发明专利技术公开了一种基于知识图谱的政务数据立方体构建方法、设备及介质,该方法包括:获取政务服务数据并对所述政务服务数据进行维度预处理,以获得多维度数据;对所述多维度数据进行实体提取和关系抽取,以获得所述多维度数据中每个维度数据所对应的实体数据及实体关系数据;根据所述实体数据及实体关系数据构建政务服务事项多维度知识图谱;通过预设的立方体构建模型对所述政务服务事项多维度知识图谱进行立方体构建处理,以构建原始政务数据立方体;对所述原始政务数据立方体进行优化和索引处理,以获得新的所述政务数据立方体。采用本发明专利技术能使数据维度更全面,展示更直观,且数据分析处理及查询效率高。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于知识图谱的政务数据立方体构建方法。


技术介绍

1、政务服务方面数据通常分散在不同的系统中,缺乏有效的整合和利用。其次,政务数据资源日益丰富,但数据的整合、分析和利用面临诸多挑战,传统的数据处理方法难以高效处理大规模、异构化的政务数据,难以满足复杂的数据分析需求。另一方面,直接从政务服务元数据构建数据立方,会导致数据维护不全,数据不全面等问题,导致数据分析及查询有所缺漏。


技术实现思路

1、本专利技术所要解决的技术问题在于,提供一种基于知识图谱的政务数据立方体构建方法、设备及介质,能使数据维度更全面,展示更直观,且数据分析处理及查询效率高。

2、为了解决上述技术问题,本专利技术提供了一种基于知识图谱的政务数据立方体构建方法,包括:获取政务服务数据并对所述政务服务数据进行维度预处理,以获得多维度数据;对所述多维度数据进行实体提取和关系抽取,以获得所述多维度数据中每个维度数据所对应的实体数据及实体关系数据;根据所述实体数据及实体关系数据构建政务服务事项多维度知识图谱;通过预设的立方体构建模型对所述政务服务事项多维度知识图谱进行立方体构建处理,以构建原始政务数据立方体;对所述原始政务数据立方体进行优化和索引处理,以获得新的所述政务数据立方体。

3、作为上述方案的改进,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤包括:将所述政务服务数据中的政务服务事项数据作为维度基准数据;将与所述政务服务事项数据相关的基础数据作为相应的所述维度基准数据的维度基础数据;通过所述维度基准数据和维度基础数据构建多维度数据。

4、作为上述方案的改进,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤之后还包括:对所述多维度数据进行数据清洗,以确保数据一致性;对所述多维度数据中的每个数据分别赋予相应的id。

5、作为上述方案的改进,所述对所述多维度数据进行实体提取和关系抽取,以获得每个维度数据所对应的实体数据及实体关系数据的步骤包括:根据所述多维度数据中的维度基准数据id进行实体识别,以获得政务服务事项的实体数据;抽取识别后的所述实体数据的关联关系情况,以获得实体关系数据。

6、作为上述方案的改进,所述抽取识别后的所述实体数据的关系情况,以获得实体关系数据的步骤包括:抽取识别后的所述实体数据的关联关系情况,以获得实体初始关系数据;根据所述实体初始关系数据的关联关系程度进行分类加权,以获得相应的关系程度值;根据实体初始关系数据及其关系程度值构建所述实体关系数据。

7、作为上述方案的改进,所述通过预设的立方体构建模型对所述政务服务事项多维度知识图谱进行立方体构建处理,以构建政务数据立方体的步骤包括:将所述政务服务事项多维度知识图谱中的维度基准数据id作为基础,对相应维度列数据进行编码处理,并使用surrogate keys替换原始维度值,以通过处理后的图谱数据库构建基础立方体;通过mapreduce构建算法对所述基础立方体进行立方体构建处理,以获得政务数据立方体。

8、作为上述方案的改进,所述通过mapreduce构建算法对所述基础立方体进行立方体构建处理,以获得政务数据立方体的步骤包括:对所述基础立方体进行数据切片并形成键值对;通过预设去除规则去除至少一个维度,以生成新的键值对;将具有相同键的值进行聚合计算,以获得最小值的键值对,并输出新的所述基础立方体;循环执行上述步骤,直至新的所述基础立方体的维度组合数达到预设的最大维度组合数时,将当前的所述基础立方体作为政务数据立方体。

9、作为上述方案的改进,所述对所述政务数据立方体进行优化和索引处理,以获得新的所述政务数据立方体的步骤包括:通过dwarf算法对政务数据立方体进行数据压缩优化,以获得优化后的政务数据立方体;通过b+树算法为优化后的所述政务数据立方体构建索引,以获得所述政务数据立方体的索引数据结构。

10、本专利技术还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

11、本专利技术还提供了一种存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

12、实施本专利技术,具有如下有益效果:

13、本专利技术通过将政务服务数据构建知识图谱,可以把独立的事项、事项基础数据以及事项与事项之间的关系串联起来,确保政务服务数据内容可以覆盖全部数据;并在此基础上再转化为政务数据立方体,可以让数据维度更全面,展示更直观,同时基于知识图谱的网路关系,可以更好的支持政务服务数据更多维度的拓展,大大提高数据分析处理效率。通过基于知识图谱的政务数据立方体进行政务服务数据查询时,可以更加便捷地获取实时及准确的数据分析结果,从而更好地支持决策制定和业务发展。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的政务数据立方体构建方法,其特征在于,包括:

2.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤包括:

3.根据权利要求2所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤之后还包括:

4.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述多维度数据进行实体提取和关系抽取,以获得每个维度数据所对应的实体数据及实体关系数据的步骤包括:

5.根据权利要求4所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述抽取识别后的所述实体数据的关系情况,以获得实体关系数据的步骤包括:

6.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述通过预设的立方体构建模型对所述政务服务事项多维度知识图谱进行立方体构建处理,以构建政务数据立方体的步骤包括:

7.根据权利要求6所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述通过MapReduce构建算法对所述基础立方体进行立方体构建处理,以获得政务数据立方体的步骤包括:

8.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述政务数据立方体进行优化和索引处理,以获得新的所述政务数据立方体的步骤包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法的步骤。

10.一种存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于知识图谱的政务数据立方体构建方法,其特征在于,包括:

2.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤包括:

3.根据权利要求2所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述政务服务数据进行维度预处理,以获得多维度数据的步骤之后还包括:

4.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述对所述多维度数据进行实体提取和关系抽取,以获得每个维度数据所对应的实体数据及实体关系数据的步骤包括:

5.根据权利要求4所述的基于知识图谱的政务数据立方体构建方法,其特征在于,所述抽取识别后的所述实体数据的关系情况,以获得实体关系数据的步骤包括:

6.根据权利要求1所述的基于知识图谱的政务数据立方体构建方法,...

【专利技术属性】
技术研发人员:卢伟广莫晓烨伦晓滢张煜国张丽巧
申请(专利权)人:广东金赋科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1