数据仓库的指标口径变化识别方法、装置和存储介质制造方法及图纸

技术编号:38752916 阅读:24 留言:0更新日期:2023-09-09 11:19
本公开涉及数据仓库的指标口径变化识别方法、装置和存储介质。上述方法包括周期性获取数据仓库对应的当前任务脚本数据;将当前任务脚本数据进行指标口径解析,得到当前指标关键信息,当前指标关键信息用于表征当前任务脚本数据中至少一个指标对应的指标内容信息;将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,历史指标关键信息为基于前一周期的任务脚本数据进行指标口径解析得到的指标关键信息,比对结果用于指示指标的指标口径一致性;基于比对结果确定指标口径变化的目标指标。本公开可以快速准确地识别出海量数据中的指标口径变化的指标,减少人力投入,避免指标口径维护滞后的问题。避免指标口径维护滞后的问题。避免指标口径维护滞后的问题。

【技术实现步骤摘要】
数据仓库的指标口径变化识别方法、装置和存储介质


[0001]本公开涉及数据仓库
,尤其涉及数据仓库的指标口径变化识别方法、装置、存储介质和电子设备。

技术介绍

[0002]随着信息技术的快速发展,线上数据呈爆发式增长,而业务的快速发展需要借助大数据赋能业务,数据支撑业务运营决策。海量数据使用过程中数据指标的沉淀越来越多,达到百万级甚至更多,指标加工复杂多样且指标口径更新频率很高,现有技术中通常需要人工走读代码确定指标口径是否有变化,过程耗费时间和人力,且容易出错。

技术实现思路

[0003]为了解决上述提出的至少一个技术问题,本公开提出了数据仓库的指标口径变化识别方法、装置、存储介质和电子设备。
[0004]根据本公开的一方面,提供了一种数据仓库的指标口径变化识别方法,其包括:
[0005]周期性获取数据仓库对应的当前任务脚本数据;
[0006]将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息,所述当前指标关键信息用于表征所述当前任务脚本数据中至少一个指标对应的指标内容信息;
[0007]将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,所述历史指标关键信息为基于前一周期的任务脚本数据进行指标口径解析得到的指标关键信息,所述比对结果用于指示指标的指标口径一致性;
[0008]基于所述比对结果确定指标口径变化的目标指标。
[0009]在一些可能的实施方式中,所述当前指标关键信息包括指标所属的业务名称,在所述将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息之后,所述方法还包括:
[0010]构建所述业务名称对应的当前指标数据表;
[0011]将所述当前指标关键信息存储至所述当前指标数据表,所述当前指标数据表中每一表记录用于记载一个指标对应的指标内容信息。
[0012]在一些可能的实施方式中,在所述将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息之后,所述方法还包括:
[0013]获取所述当前指标关键信息的解析时间信息;
[0014]在所述构建所述业务名称对应的当前指标数据表之后,所述方法还包括:
[0015]基于所述解析时间信息生成所述当前指标数据表对应的版本信息。
[0016]在一些可能的实施方式中,所述指标内容信息包指标对应的数据表名称和指标名称,所述将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,包括:
[0017]基于所述业务名称和所述当前指标数据表对应的版本信息获取历史指标数据表,
所述历史指标数据表为所述历史指标关键信息对应的指标数据表,所述历史指标数据表的版本信息与所述当前指标数据表对应的版本信息在时序上连续;
[0018]基于所述数据表名称和所述指标名称将所述当前指标数据表和所述历史指标数据表中的表记录进行一一对比,得到比对结果。
[0019]在一些可能的实施方式中,所述指标内容信息包括指标口径配置信息,所述基于所述数据表名称和所述指标名称将所述当前指标数据表和所述历史指标数据表中的表记录进行一一对比,得到比对结果包括:
[0020]基于所述数据表名称和所述指标名称,将所述当前指标数据表和所述历史指标数据表中同一指标的表记录进行指标口径配置信息的信息匹配;
[0021]若指标口径配置信息不同,确定所述指标的比对结果为指标口径变化。
[0022]在一些可能的实施方式中,在所述基于所述比对结果确定指标口径变化的目标指标之后,方法还包括:
[0023]构建指标变化清单;
[0024]将目标指标存储至所述指标变化清单。
[0025]在一些可能的实施方式中,在所述将目标指标存储至所述指标变化清单之后,所述方法还包括:
[0026]将所述当前指标变化清单发送目标端,以在所述目标端的预设界面上显示所述当前指标变化清单。
[0027]根据本公开的第二方面,提供数据仓库的指标口径变化识别装置,所述装置包括:
[0028]数据获取模块,用于周期性获取数据仓库对应的当前任务脚本数据;
[0029]指标口径解析模块,用于将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息,所述当前指标关键信息用于表征所述当前任务脚本数据中至少一个指标对应的指标内容信息;
[0030]对比模块,用于将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,所述历史指标关键信息为基于前一周期的任务脚本数据进行指标口径解析得到的指标关键信息,所述比对结果用于指示指标的指标口径一致性;
[0031]目标指标确定模块,用于基于所述比对结果确定指标口径变化的目标指标。
[0032]根据本公开的第三方面,提供了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面中任意一项所述的数据仓库的指标口径变化识别方法。
[0033]根据本公开的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面中任意一项所述的数据仓库的指标口径变化识别方法。
[0034]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
[0035]实施本公开,具有如下有益效果:
[0036]周期性获取数据仓库对应的当前任务脚本数据;将当前任务脚本数据进行指标口径解析,得到当前指标关键信息,当前指标关键信息用于表征当前任务脚本数据中至少一
个指标对应的指标内容信息;通过解析任务脚本数据,分析数据仓库中所有指标涉及的表、表之间的关联关系以及指标口径定义等关键信息;将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,历史指标关键信息为基于前一周期的任务脚本数据进行指标口径解析得到的指标关键信息,比对结果用于指示指标的指标口径一致性;将当前任务脚本解析出的指标关键信息与上一周期解析出的指标关键信息进行对比,确定出指标口径变化的目标指标。快速准确地识别出海量数据中的指标口径变化的指标,减少人力投入,避免指标口径维护滞后的问题。
[0037]根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0038]为了更清楚地说明本说明书实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0039]图1示出根据本公开实施例的一种应用环境的示意图;
[0040]图2示出根据本公开实施例的一种数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据仓库的指标口径变化识别方法,其特征在于,所述方法包括:周期性获取数据仓库对应的当前任务脚本数据;将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息,所述当前指标关键信息用于表征所述当前任务脚本数据中至少一个指标对应的指标内容信息;将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,所述历史指标关键信息为基于前一周期的任务脚本数据进行指标口径解析得到的指标关键信息,所述比对结果用于指示指标的指标口径一致性;基于所述比对结果确定指标口径变化的目标指标。2.根据权利要求1所述的方法,其特征在于,所述当前指标关键信息包括指标所属的业务名称,在所述将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息之后,所述方法还包括:构建所述业务名称对应的当前指标数据表;将所述当前指标关键信息存储至所述当前指标数据表,所述当前指标数据表中每一表记录用于记载一个指标对应的指标内容信息。3.根据权利要求2所述的方法,其特征在于,在所述将所述当前任务脚本数据进行指标口径解析,得到当前指标关键信息之后,所述方法还包括:获取所述当前指标关键信息的解析时间信息;在所述构建所述业务名称对应的当前指标数据表之后,所述方法还包括:基于所述解析时间信息生成所述当前指标数据表对应的版本信息。4.根据权利要求3所述的方法,其特征在于,所述指标内容信息包指标对应的数据表名称和指标名称,所述将当前指标关键信息和历史指标关键信息进行指标内容信息对比,得到比对结果,包括:基于所述业务名称和所述当前指标数据表对应的版本信息获取历史指标数据表,所述历史指标数据表为所述历史指标关键信息对应的指标数据表,所述历史指标数据表的版本信息与所述当前指标数据表对应的版本信息在时序上连续;基于所述数据表名称和所述指标名称将所述当前指标数据表和所述历史指标数据表中的表记录进行一一对比,得到比对结果。5.根据权利要求4所述的方法,其特征在于,所述指标内容信息包括指标口径配置信息,所述基于所述数据表名称和所述指标名称将所述当前指标数据表和所述历史指标数据表...

【专利技术属性】
技术研发人员:甘红伟林晶晶
申请(专利权)人:连连杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1