一种对标处理的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:21398909 阅读:26 留言:0更新日期:2019-06-19 06:58
一种对标处理的方法、装置、计算机存储介质及终端,包括:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。本发明专利技术实施例根据匹配度信息进行对标处理,提升了原始表和目标表的对标处理效率,降低了对标处理时发生错误的概率。

【技术实现步骤摘要】
一种对标处理的方法、装置、计算机存储介质及终端
本文涉及但不限于数据处理技术,尤指一种对标处理的方法、装置、计算机存储介质及终端。
技术介绍
在数据治理中,标准化是提高原始表数据治理效率和质量的一种重要手段;对标是完成数据标准化的前期准备中的重要环节;相关技术中的对标处理包括:通过人工将原始表与目标表进行复杂的规则配置、字段映射后完成对标处理;例如:来源于A的一张原始表“卡口车辆特征表”英文名为a,有卡口编号、卡口名称、过车时间三个字段,要将这张原始表完成对标,需要创建一个对应的目标表“卡口车辆特征表”英文名为b,表a与表b之间,先要进行表级映射,再把三个字段依次进行字段映射,接下来进行规则配置,比如卡口名称是由卡口编号得来的,需要配置编码转换名称规则,过车时间需要配置统一的时间规则等,以此完成一张表的对标处理。在实际应用中,一张原始表可能有上百个字段,人工对标包括:创建对应的目标表、进行表级映射、字段级映射、规则配置等,会消耗大量的时间和人工资源;另外,由人工进行上百个字段的规则配置,很难避免发生错误,后期排查效率低、实现困难。综上,如何提升原始表和目标表的对标处理效率,降低对标处理时发生错误的概率,成为对标处理工作需要解决的问题。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种对标处理的方法、装置、计算机存储介质及终端,能够提升原始表和目标表的对标处理效率,降低对标处理时发生错误的概率。本专利技术实施例提供了一种对标处理的方法,对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。可选的,所述从所有第一标准表中确定用于与原始表进行对标的第二标准表包括:对计算获得的原始表与各第一标准表的各字段的匹配度进行累加统计,获得对应于各第一标准表的匹配度之和;按照预设策略从匹配度之和排序在前的预设张第一标准表中,确定其中之一作为所述第二标准表;或,反馈显示计算获得的原始表与各第一标准表的各字段的匹配度;根据接收到的外部指令,从所述第一标准表中选择其中之一作为所述第二标准表。可选的,所述进行对标处理包括:将所述第二标准表中,与所述原始表匹配度大于预设匹配度阈值的字段,添加预先建立的目标表中,并建立该原始表字段与添加至目标表字段的映射关系;对建立映射关系的字段,将所述第二标准表中该字段的配置规则添加至所述目标表中。可选的,所述进行对标处理还包括:将所述原始表中,与所述第二标准表匹配度小于所述匹配度阈值的字段,添加到所述目标表中。另一方面,本专利技术实施例还提供一种对标处理的装置,包括:计算单元、确定单元和处理单元;其中,计算单元用于:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;确定单元用于:根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;处理单元用于:对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。可选的,所述确定单元具体用于:对计算获得的原始表与各第一标准表的各字段的匹配度进行累加统计,获得对应于各第一标准表的匹配度之和;按照预设策略从匹配度之和排序在前的预设张第一标准表中,确定其中之一作为所述第二标准表;或,反馈显示计算获得的原始表与各第一标准表的各字段的匹配度;根据接收到的外部指令,从所述第一标准表中选择其中之一作为所述第二标准表。可选的,所述处理单元具体用于:将所述第二标准表中,与所述原始表匹配度大于预设匹配度阈值的字段,添加预先建立的目标表中,并建立该原始表字段与添加至目标表字段的映射关系;对建立映射关系的字段,将所述第二标准表中该字段的配置规则添加至所述目标表中。可选的,所述处理单元还用于:将所述原始表中,与所述第二标准表匹配度小于所述匹配度阈值的字段,添加到所述目标表中。再一方面,本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述对标处理的方法。还一方面,本专利技术实施例还提供一种终端,包括:存储器和处理器;其中,处理器被配置为执行存储器中的程序指令;程序指令在处理器读取执行以下操作:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。与相关技术相比,本申请技术方案包括:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。本专利技术实施例根据匹配度信息进行对标处理,提升了原始表和目标表的对标处理效率,降低了对标处理时发生错误的概率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例对标处理的方法的流程图;图2为本专利技术实施例对标处理的装置的结构框图;图3为本专利技术应用示例计算获得匹配度的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1为本专利技术实施例对标处理的方法的流程图,如图1所示,包括:步骤101、对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;步骤102、根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;可选的,本专利技术实施例从所有第一标准表中确定用于与原始表进行对标的第二标准表包括:对计算获得的原始表与各第一标准表的各字段的匹配度进行累加统计,获得对应于各第一标准表的匹配度之和;按照预设策略从匹配度之和排序在前的预设张第一标准表中,确定其中之一作为所述第二标准表;或,反馈显示计算获得的原始表与各第一标准表的各字段的匹配度;根据接收到的外部指令,从所述第一标准表中选择其中之一作为所述第二标准表。需要说明的是,本专利技术实施例预设张标准表可以包括三张标准表;确定其中之一作为所述第二标准表可以包括:接收用户查看预设张标准表后输入的选择其中之一的选择指令后,确定的第二标准表;或者,预设默认设置的排序在前的某一张第一标准表。步骤103、对确定的第二标准表,根据本文档来自技高网...

【技术保护点】
1.一种对标处理的方法,其特征在于,包括:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。

【技术特征摘要】
1.一种对标处理的方法,其特征在于,包括:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第二标准表;对确定的第二标准表,根据第二标准表与原始表各字段的匹配度,进行对标处理。2.根据权利要求1所述的方法,其特征在于,所述从所有第一标准表中确定用于与原始表进行对标的第二标准表包括:对计算获得的原始表与各第一标准表的各字段的匹配度进行累加统计,获得对应于各第一标准表的匹配度之和;按照预设策略从匹配度之和排序在前的预设张第一标准表中,确定其中之一作为所述第二标准表;或,反馈显示计算获得的原始表与各第一标准表的各字段的匹配度;根据接收到的外部指令,从所述第一标准表中选择其中之一作为所述第二标准表。3.根据权利要求1或2所述的方法,其特征在于,所述进行对标处理包括:将所述第二标准表中,与所述原始表匹配度大于预设匹配度阈值的字段,添加预先建立的目标表中,并建立该原始表字段与添加至目标表字段的映射关系;对建立映射关系的字段,将所述第二标准表中该字段的配置规则添加至所述目标表中。4.根据权利要求3所述的方法,其特征在于,所述进行对标处理还包括:将所述原始表中,与所述第二标准表匹配度小于所述匹配度阈值的字段,添加到所述目标表中。5.一种对标处理的装置,其特征在于,包括:计算单元、确定单元和处理单元;其中,计算单元用于:对各第一标准表,分别计算原始表和第一标准表各字段的匹配度;确定单元用于:根据计算获得的原始表与各第一标准表的各字段的匹配度,从所有第一标准表中确定用于与原始表进行对标的第...

【专利技术属性】
技术研发人员:张毅然裴博润
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1