零代码获取最佳维度关联的方法和系统技术方案

技术编号：36816641 阅读：33 留言：0更新日期：2023-03-12 00:27

本公开涉及零代码获取最佳维度关联的方法和系统。自动进行表关联的方法包括：基于数据仓库中的全部维度及其之间的相似度，为所述数据仓库建立维度关联模型；以及基于用户输入，使用所述维度关联模型输出所述数据仓库中的关联数据表。的关联数据表。的关联数据表。

全部详细技术资料下载

【技术实现步骤摘要】
零代码获取最佳维度关联的方法和系统

[0001]本公开总体上涉及大数据领域，更具体地涉及零代码获取最佳维度关联的方法和系统。

技术介绍

[0002]在结构化数据应用过程中都需要进行表关联，表关联都不可避免的需要维度关联操作。例如，现有全国各地区2019年的汽车产量表，为统计2019年汽车行业各省份的总产量，需要在数仓中，查找出“省份”维表。通过关联全国各地区的产量表和全国省份信息表(维度表)计算获得各省份的总产量模型。
[0003]目前在表关联过程中，维度及关联路径的确定，基本上都是基于业务模型调研从而确定关联维度。由于数年的累积，数仓中的模型非常的多，少的集市可达到上千上万个模型，多的有几十万甚至几百万个模型，BI建模过程中超过一半的时间花费在查找关联维度上。与此同时，由于数仓维护及建模人员的流动问题，数仓中有些表的字段名或其描述出现变动，导致很多时候开发人员无法准确定位到这些维度及维度表。
[0004]因此，现有技术中存在对于针对数据仓库零代码(即，自动地)获取最佳维度关联的技术。

技术实现思路

[0005]在下文中给出了关于本公开的简要概述，以便提供关于本公开的一些方面的基本理解。但是，应当理解，这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分，也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念，以此作为稍后给出的更详细描述的前序。
[0006]根据本公开的一个方面，提供一种自动进行表关联的方法，包括：基...

【技术保护点】

【技术特征摘要】
1.一种自动进行表关联的方法，包括：基于数据仓库中的全部维度及其之间的相似度，为所述数据仓库建立维度关联模型；以及基于用户输入，使用所述维度关联模型输出所述数据仓库中的关联数据表。2.根据权利要求1所述的方法，其中建立维度关联模型包括：从所述数据仓库中提取全部维度；计算所提取的维度的字段名称及对应字段内容的相似度；基于维度的相似度构建图模型以获取所述图模型中维度的关联路径。3.根据权利要求2所述的方法，还包括：基于不同的维度粒度筛选关联维度；及基于筛选所得的关联维度...

【专利技术属性】
技术研发人员：郭枝虾，王学敏，梁宝林，孟维业，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人