衍生元数据构建方法及装置制造方法及图纸

技术编号:32970321 阅读:13 留言:0更新日期:2022-04-09 11:35
本发明专利技术实施例公开了一种衍生元数据构建方法及装置。该方法通过确定衍生数据源,以及从衍生数据源中选择的各原生元数据,并获取衍生元数据对应的预设衍生策略,进而基于该预设衍生策略以及衍生数据源中各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据,实现了衍生元数据的自动构建,该方法通过预设衍生策略实现衍生元数据对应的被描述数据的确定,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。保证了衍生元数据的一致性。保证了衍生元数据的一致性。

【技术实现步骤摘要】
衍生元数据构建方法及装置


[0001]本专利技术实施例涉及元数据
,尤其涉及一种衍生元数据构建方法及装置。

技术介绍

[0002]元数据可以是描述数据的数据,衍生元数据为无法直接获取,即不直接存在于数据库中,需要根据业务需求衍生出来的元数据。在原始医疗业务软件数据库中,提供了以患者为中心的多维度数据。用户基于科研或者其他目的获取数据后,往往需要由用户自行进行整理,计算出符合当前场景需求的数据。
[0003]比如,首次术前血红蛋白值,在元数据中本不存在这样的概念,因此,无法直接提取到首次术前血红蛋白值对应的详细数据,需要用户自定义并完成相应计算工作量。然而,这种人为定义并计算衍生元数据对应的被描述数据的方式,当不同用户需要获取同样的衍生元数据时,可能会由于主观认知的偏差,导致存在不同的衍生元数据结果,进而影响后续相关业务的开展。

技术实现思路

[0004]本专利技术实施例提供了一种衍生元数据构建方法及装置,以解决主观原因所导致的衍生元数据的创建结果存在偏差的技术问题。
[0005]第一方面,本专利技术实施例提供了一种衍生元数据构建方法,所述方法包括:
[0006]确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;
[0007]获取衍生元数据对应的预设衍生策略;
[0008]基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
[0009]可选的,所述方法还包括:
[0010]获取衍生元数据对应的衍生配置信息;
[0011]基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略。
[0012]可选的,所述基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略,包括:
[0013]确定样本数据源以及从所述样本数据源中选择的各样本元数据,其中,所述样本数据源包括各所述样本元数据对应的被描述数据;
[0014]基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息;
[0015]获取所述预览信息的校验结果,若所述校验结果为校验通过,则将所述衍生配置信息确定为所述衍生元数据对应的预设衍生策略。
[0016]可选的,所述基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息,包括:
[0017]基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句;
[0018]基于所述数据操作语句以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息。
[0019]可选的,所述基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句,包括:
[0020]获取用户在技术视图界面中针对操作关键词配置的关键词信息,将所述关键词信息确定为衍生配置信息;
[0021]基于所述衍生配置信息生成所述衍生元数据对应的数据操作语句。
[0022]可选的,所述方法还包括:
[0023]确定各所述衍生元数据对应的预设衍生策略的调用次数;
[0024]基于各所述调用次数,在各所述衍生元数据中确定沉淀元数据;
[0025]将所述沉淀元数据作为原生元数据添加至技术视图界面中。
[0026]可选的,所述基于各所述调用次数,在各所述衍生元数据中确定沉淀元数据,包括:
[0027]针对各所述衍生元数据,将所述调用次数满足预设次数阈值的衍生元数据确定为沉淀元数据;或者,
[0028]按照各所述调用次数从大到小的顺序,对各所述衍生元数据进行排序,基于排序结果确定沉淀元数据。
[0029]可选的,所述确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,包括:
[0030]在技术视图界面中展示各预设数据源,获取用户在所述技术视图界面中执行的拖拽操作或创建操作,基于所述拖拽操作或创建操作确定衍生数据源;
[0031]在所述技术视图界面中展示所述衍生数据源包含的各原生元数据,获取所述用户在所述技术视图界面中执行的选定操作,基于所述选定操作确定所述用户从所述衍生数据源中选择的各原生元数据。
[0032]可选的,所述在所述技术视图界面中展示各预设数据源,包括:
[0033]在所述技术视图界面中,展示至少一种逻辑层所包含的各预设数据源;
[0034]其中,所述逻辑层为数据湖层、数据中心层、数据领域层或数据集市层。
[0035]第二方面,本专利技术实施例还提供了一种衍生元数据构建装置,所述装置包括:
[0036]元数据确定模块,用于确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;
[0037]策略获取模块,用于获取衍生元数据对应的预设衍生策略;
[0038]策略执行模块,用于基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
[0039]第三方面,本专利技术实施例还提供了一种电子设备,所述电子设备包括:
[0040]一个或多个处理器;
[0041]存储装置,用于存储一个或多个程序,
[0042]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例提供的衍生元数据构建方法。
[0043]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例提供的衍生元数据构建方法。
[0044]上述专利技术中的实施例具有如下优点或有益效果:
[0045]通过确定衍生数据源,以及从衍生数据源中选择的各原生元数据,并获取衍生元数据对应的预设衍生策略,进而基于该预设衍生策略以及衍生数据源中各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据,实现了衍生元数据的自动构建,该方法通过预设衍生策略实现衍生元数据对应的被描述数据的确定,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。
附图说明
[0046]为了更加清楚地说明本专利技术示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本专利技术所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
[0047]图1A为本专利技术实施例一所提供的一种衍生元数据构建方法的流程示意图;
[0048]图1B为本专利技术实施例一所提供的一种显示界面的示意图;
[0049]图2为本专利技术实施例二所提供的一种衍生元数据构建方法的流程示意图;
[0050]图3为本专利技术实施例三所提供的一种衍生元数据构建方法的流程示意图;...

【技术保护点】

【技术特征摘要】
1.一种衍生元数据构建方法,其特征在于,所述方法包括:确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;获取衍生元数据对应的预设衍生策略;基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取衍生元数据对应的衍生配置信息;基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略。3.根据权利要求2所述的方法,其特征在于,所述基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略,包括:确定样本数据源以及从所述样本数据源中选择的各样本元数据,其中,所述样本数据源包括各所述样本元数据对应的被描述数据;基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息;获取所述预览信息的校验结果,若所述校验结果为校验通过,则将所述衍生配置信息确定为所述衍生元数据对应的预设衍生策略。4.根据权利要求3所述的方法,其特征在于,所述基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息,包括:基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句;基于所述数据操作语句以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息。5.根据权利要求4所述的方法,其特征在于,所述基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句,包括:获取用户在技术视图界面中针对操作关键词配置的关键词信息,将所述关键词信息确定为衍生配置信息;基于所述衍生配置信息生成所述衍生元数据对应的数据操作语句。6.根据权利...

【专利技术属性】
技术研发人员:刘新辉康定
申请(专利权)人:上海柯林布瑞信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1