数据表关联信息的确定方法、装置和计算机设备制造方法及图纸

技术编号:33740684 阅读:39 留言:0更新日期:2022-06-08 21:38
本申请涉及一种数据表关联信息的确定方法、装置和计算机设备。涉及大数据技术领域。所述方法包括:获取数据表信息集合、以及目标应用系统对应的各数据表的标识信息;所述数据表信息集合包括多个数据表信息;根据所述各数据表的标识信息、以及所述目标应用系统中的数据表索引顺序,在所述数据表信息集合中选择目标数据表信息;根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,并将所述目标数据表的各关联链、以及各所述关联链的关联强度,作为所述目标应用系统的数据表关联信息。采用本方法能够提升确定数据表关联信息的效率。定数据表关联信息的效率。定数据表关联信息的效率。

【技术实现步骤摘要】
数据表关联信息的确定方法、装置和计算机设备


[0001]本申请涉及大数据
,特别是涉及一种数据表关联信息的确定方法、装置和计算机设备。

技术介绍

[0002]随着大数据技术的发展,不同应用系统对应的数据表来源于数据库中的不同数据表,或是来源于数据库中的不同数据表的衍生表,使得确定应用系统对应的数据表关联信息,成为了一大难题。数据表关联信息包括该数据表的关联链以及该关联链的关联强度。
[0003]传统技术中,通常采用人工检索的方式,确定数据表、以及该数据表的各衍生表的关联信息,但是该方法工作量较大、耗时较长、且无法完整获取所有隐含相关关系表,从而导致确定数据表关联信息的效率较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种数据表关联信息的确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种数据表关联信息的确定方法。所述方法包括:
[0006]获取数据表信息集合、以及目标应用系统对应的各数据表的标识信息;所述数据表信息集合包括多个数据表信息;
[0007]根据所述各数据表的标识信息、以及所述目标应用系统中的数据表索引顺序,在所述数据表信息集合中选择目标数据表信息;
[0008]根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,并将所述目标数据表的各关联链、以及各所述关联链的关联强度,作为所述目标应用系统的数据表关联信息。
[0009]可选的,所述数据表信息包括数据表的标识信息,所述根据所述各数据表的标识信息、以及所述目标应用系统中的数据表索引顺序,在所述数据表信息集合中选择目标数据表信息,包括:
[0010]根据所述目标应用系统中的数据表索引顺序,确定排列在索引序列首位的目标数据表;
[0011]在所述数据表信息集合中,确定所述目标数据表的标识信息对应的目标数据表信息。
[0012]可选的,所述数据表信息包括数据表的标识信息、所述数据表索引的各数据表的标识信息、以及所述数据表与所述数据表索引的各数据表之间的操作信息,所述数据表关联算法包括数据表定位算法和关联强度算法;所述根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,包括:
[0013]根据所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据
表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定所述目标数据表的各关联链;所述关联链包括中的各数据表的标识信息按照索引顺序排列;
[0014]针对每个关联链,根据所述关联链中各相邻的数据表的操作信息、以及关联强度算法,确定所述关联链对应的关联强度。
[0015]可选的,所述根据所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定所述目标数据表的各关联链,包括:
[0016]根据所述目标数据表的标识信息、所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定各初始数据表关联链;
[0017]对各所述初始数据表关联链进行去重处理,得到所述目标数据表的各关联链。
[0018]可选的,所述根据所述关联链中各相邻的数据表信息的操作信息、以及关联强度算法,确定所述关联链对应的关联强度,包括:
[0019]根据所述关联链中每对相邻的数据表信息的操作信息和关联强度算法,确定每对相邻的数据表信息对应的关联强度;
[0020]根据各所述相邻的数据表信息对应的关联强度,确定所述关联链对应的关联强度。
[0021]可选的,所述方法还包括:
[0022]将所述目标应用系统的数据表关联信息中的各所述关联链,按照各所述关联链对应的关联强度从大到小的顺序进行排序,得到所述目标应用系统的排序后的数据表关联信息。
[0023]第二方面,本申请还提供了一种数据表关联信息的确定装置。所述装置包括:
[0024]获取模块,用于获取数据表信息集合、以及目标应用系统对应的各数据表的标识信息;所述数据表信息集合包括多个数据表信息;
[0025]选择模块,用于根据所述各数据表的标识信息,按照所述目标应用系统中的索引顺序,在所述数据表信息集合中选择目标数据表信息;
[0026]确定模块,用于根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,并将所述目标数据表的各关联链、以及各所述关联链的关联强度,作为所述目标应用系统的数据表关联信息。
[0027]可选的,所述数据表信息包括数据表的标识信息,所述选择模块,具体用于:
[0028]根据所述目标应用系统中的数据表索引顺序,确定排列在索引序列首位的目标数据表;
[0029]在所述数据表信息集合中,确定所述目标数据表的标识信息对应的目标数据表信息。
[0030]可选的,所述数据表信息包括数据表的标识信息、所述数据表索引的各数据表的标识信息、以及所述数据表与所述数据表索引的各数据表之间的操作信息,所述数据表关联算法包括数据表定位算法和关联强度算法;所述确定模块,具体用于:
[0031]根据所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定所述目标数据表的各关联链;所述关联链包括中的各数据表的标识信息按照索引顺序排列;
[0032]针对每个关联链,根据所述关联链中各相邻的数据表的操作信息、以及关联强度算法,确定所述关联链对应的关联强度。
[0033]可选的,所述确定模块,具体用于:
[0034]根据所述目标数据表的标识信息、所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定各初始数据表关联链;
[0035]对各所述初始数据表关联链进行去重处理,得到所述目标数据表的各关联链。
[0036]可选的,所述确定模块,具体用于:
[0037]根据所述关联链中每对相邻的数据表信息的操作信息和关联强度算法,确定每对相邻的数据表信息对应的关联强度;
[0038]根据各所述相邻的数据表信息对应的关联强度,确定所述关联链对应的关联强度。
[0039]可选的,所述装置还包括:
[0040]排序模块,用于将所述目标应用系统的数据表关联信息中的各所述关联链,按照各所述关联链对应的关联强度从大到小的顺序进行排序,得到所述目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据表关联信息的确定方法,其特征在于,所述方法包括:获取数据表信息集合、以及目标应用系统对应的各数据表的标识信息;所述数据表信息集合包括多个数据表信息;根据所述各数据表的标识信息、以及所述目标应用系统中的数据表索引顺序,在所述数据表信息集合中选择目标数据表信息;根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,并将所述目标数据表的各关联链、以及各所述关联链的关联强度,作为所述目标应用系统的数据表关联信息。2.根据权利要求1所述的方法,其特征在于,所述数据表信息包括数据表的标识信息,所述根据所述各数据表的标识信息、以及所述目标应用系统中的数据表索引顺序,在所述数据表信息集合中选择目标数据表信息,包括:根据所述目标应用系统中的数据表索引顺序,确定排列在索引序列首位的目标数据表;在所述数据表信息集合中,确定所述目标数据表的标识信息对应的目标数据表信息。3.根据权利要求1所述的方法,其特征在于,所述数据表信息包括数据表的标识信息、所述数据表索引的各数据表的标识信息、以及所述数据表与所述数据表索引的各数据表之间的操作信息,所述数据表关联算法包括数据表定位算法和关联强度算法;所述根据所述目标数据表信息和所述数据表信息集合,通过数据表关联算法确定所述目标数据表的各关联链、以及各所述关联链对应的关联强度,包括:根据所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定所述目标数据表的各关联链;所述关联链包括中的各数据表的标识信息按照索引顺序排列;针对每个关联链,根据所述关联链中各相邻的数据表的操作信息、以及关联强度算法,确定所述关联链对应的关联强度。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标数据表索引的各数据表的标识信息、所述数据表信息集合中各数据表的标识信息、所述数据表信息集合中各数据表索引的数据表的标识信息、以及数据表定位算法,确定所述目标数据表...

【专利技术属性】
技术研发人员:马文莹张林林刘致远袁亚辉
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1