基于数据标签的数据确权方法及系统技术方案

技术编号:39059968 阅读:13 留言:0更新日期:2023-10-12 19:53
本发明专利技术提供一种基于数据标签的数据确权方法及系统,属于大数据技术领域,通过关联数据标签的原始加工数据,分析相关加工数据本身的特性和特征,计算获取数据标签的贡献比例,从而让数据标签的贡献归属具有可靠的量化依据和衡量标准,使得标签使用者或维护方可以根据标签的贡献情况,来衡量标签的权益归属,明确数据标签的贡献成分。确数据标签的贡献成分。确数据标签的贡献成分。

【技术实现步骤摘要】
基于数据标签的数据确权方法及系统


[0001]本专利技术属于大数据
,具体涉及一种基于数据标签的数据确权方法、系统、电子设备以及存储介质。

技术介绍

[0002]数据标签是数据资源的一种表现形式,由于其对于电子商务领域的联机交易场景或金融保险领域的背景调查等业务分析具有针对性和可解读性,在数据加工、分析和建模中被广泛地使用。基于数据标签的大规模使用,其带来的业务价值被越来越多人关注。标签的归属方或维护方希望将其业务价值可以转换为实际的金钱收益,在一定程度上分摊标签加工和维护所带来的人力成本和机器成本。因此,需要对数据标签进行确权归属的评估。
[0003]数据资源确权是对交易的数据资源进行身份认证以确定数据资源的真正拥有者(即数据源)。数据资源确权是保证数据资源安全性和可靠性的前提,只有经过数据资源确权的数据才能明确数据的真实来源,才能保证数据资源安全性和可靠性,才能发挥数据资源的真正价值。而数据标签通常是由多份基础数据经过加工、计算而来,基础数据对于数据标签而言具有一定的贡献度;但是,基础数据可能来自于不同的数据属主,使得数据标签在贡献确权方面存在一定的困难,进而使得数据标签的业务价值转换为金钱收益的过程更加难以实现。
[0004]在现有技术中,存在利用区块链技术进行数据的价值评估和确权的技术方案,但是存在的弊端如下:1)因为利用区块链技术对数据进行确权,需要依赖区块链技术加密和数字认证技术,针对很多并没有上链的数据无法实现;2)并没有对数据标签这一特殊的数据资产进行明确的确权分析,只能基于数字认证一刀切式的将数据划归至某一主体名下,并不能进行高效精准地实现数据标签的贡献确权。
[0005]因此,亟需较精准的一种基于数据标签的数据确权方法。

技术实现思路

[0006]本专利技术提供一种基于数据标签的数据确权方法、系统、电子设备以及存储介质,用以克服现有技术中存在的至少一个技术问题。
[0007]为实现上述目的,本专利技术提供一种基于数据标签的数据确权方法,方法包括,获取标的数据标签的元数据信息和存储位置信息;
[0008]根据元数据信息调用所述标的数据标签的血缘关系信息;其中,所述血缘关系信息包括所述标的数据标签关联的所有原始数据参数;
[0009]根据所述血缘关系信息调用所述标的数据标签关联的各个原始数据对应的存储位置信息和归属方;
[0010]根据所述标的数据标签关联的各个原始数据对应的存储位置信息调用所述标的数据标签关联的各个原始数据,并将所述标的数据标签与各个原始数据分别组成关联数据;
[0011]基于关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例;
[0012]根据所述贡献比例以及各个原始数据的归属方,确定所述归属方对于所述标的数据标签的贡献比例,并根据所述归属方对于所述标的数据标签的贡献比例进行标的数据标签的确权。
[0013]进一步,优选的,将所述标的数据标签与各个原始数据分别组成关联数据的方法包括,
[0014]获取所调用的所述标的数据标签关联的各个原始数据的数据库名以及数据表名;
[0015]将所述标的数据标签与每个原始数据形成一个关联组合;
[0016]针对每个关联组合,根据所述关联组合中的数据库以及数据表在SQL操作语句中的内连接条件构造新的内连接,获得所述标的数据标签与各个原始数据组成的关联数据。
[0017]进一步,优选的,基于关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例的方法包括,
[0018]根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;
[0019]分别对各个关联数据的各个特征因子和各个特征因子对应的权重进行加权求和;
[0020]对各个关联数据对应的加权求和结果进行归一化处理,确定各个原始数据对于所述标的数据标签的贡献比例。
[0021]进一步,优选的,根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;
[0022]对所述特征因子以及各个特征因子对应的权重进行设定;其中,特征因子包括饱和度、信息熵和一致性;
[0023]通过JAVA程序暴露用于获取关联数据的各个特征因子对应的权重的API接口;
[0024]通过所述API接口获取各个关联数据的各个特征因子对应的权重。
[0025]进一步,优选的,根据元数据信息调用所述标的数据标签的血缘关系信息的方法包括,
[0026]通过JAVA程序暴露用于调用数据标签的血缘关系信息的API接口;
[0027]利用所述标的数据标签的元数据信息通过所述API接口调用标的数据标签的血缘关系信息,获得所述标的数据标签关联的所有原始数据参数;其中,所述标的数据标签的元数据信息包括标的数据标签所在的集群、数据库、数据表以及字段信息。
[0028]进一步,优选的,根据所述标的数据标签关联的各个原始数据对应的存储位置信息调用所述标的数据标签关联的各个原始数据的方法包括,
[0029]根据所述标的数据标签以及所述标的数据标签关联的各个原始数据的存储位置信息,组装用于数据读取的SQL操作语句;
[0030]将所述SQL操作语句作为参数传入对应的数据库接口;
[0031]在对应的数据库中获取所述标的数据标签以及所述标的数据标签关联的各个原始数据的明细数据;
[0032]将所获取的所述标的数据标签以及所述标的数据标签关联的各个原始数据的明细数据返回以用于贡献分析。
[0033]为了解决上述问题,本专利技术还提供一种基于数据标签的数据确权系统,包括:
[0034]元数据信息获取单元,用于获取标的数据标签的元数据信息和存储位置信息;
[0035]关联数据获取单元,用于根据元数据信息调用所述标的数据标签的血缘关系信息;其中,所述血缘关系信息包括所述标的数据标签关联的所有原始数据参数;根据所述血缘关系信息调用所述标的数据标签关联的各个原始数据对应的存储位置信息和归属方;根据所述标的数据标签关联的各个原始数据对应的存储位置信息调用所述标的数据标签关联的各个原始数据,并将所述标的数据标签与各个原始数据分别组成关联数据;
[0036]贡献比例获取单元,用于基于关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例;根据所述贡献比例以及各个原始数据的归属方,确定所述归属方对于所述标的数据标签的贡献比例,并根据所述归属方对于所述标的数据标签的贡献比例进行标的数据标签的确权。
[0037]进一步,优选的,所述关联数据获取单元还包括调用模块、关联组合模块和关联数据模块;
[0038]所述调用模块,用于获取所调用的所述标的数据标签关联的各个原始数据的数据库名以及数据表名;
[0039]所述关联组合模块,用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据标签的数据确权方法,其特征在于,方法包括:获取标的数据标签的元数据信息和存储位置信息;根据所述元数据信息调用所述标的数据标签的血缘关系信息;其中,所述血缘关系信息包括所述标的数据标签关联的所有原始数据参数;根据所述血缘关系信息调用所述标的数据标签关联的各个原始数据对应的存储位置信息和归属方;根据所述标的数据标签关联的各个原始数据对应的存储位置信息调用所述标的数据标签关联的各个原始数据,并将所述标的数据标签与各个原始数据分别组成关联数据;基于所述关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例;根据所述贡献比例以及各个原始数据的归属方,确定所述归属方对于所述标的数据标签的贡献比例,并根据所述归属方对于所述标的数据标签的贡献比例进行标的数据标签的确权。2.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,将所述标的数据标签与各个原始数据分别组成关联数据的方法包括,获取所调用的所述标的数据标签关联的各个原始数据的数据库名以及数据表名;将所述标的数据标签与每个原始数据形成一个关联组合;针对每个关联组合,根据所述关联组合中的数据库以及数据表在SQL操作语句中的内连接条件构造新的内连接,获得所述标的数据标签与各个原始数据组成的关联数据。3.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,基于关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例的方法包括,根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;分别对各个关联数据的各个特征因子和各个特征因子对应的权重进行加权求和;对各个关联数据对应的加权求和结果进行归一化处理,确定各个原始数据对于所述标的数据标签的贡献比例。4.根据权利要求3所述的基于数据标签的数据确权方法,其特征在于,根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;对所述特征因子以及各个特征因子对应的权重进行设定;其中,特征因子包括饱和度、信息熵和一致性;通过JAVA程序暴露用于获取关联数据的各个特征因子对应的权重的API接口;通过所述API接口获取各个关联数据的各个特征因子对应的权重。5.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,根据所述元数据信息调用所述标的数据标签的血缘关系信息的方法包括,通过JAVA程序暴露用于调用数据标签的血缘关系信息的API接口;利用所述标的数据标签的元数据信息通过所述API接口调用标的数据标签的血缘关系信息,获得所述标的数据标签关联的所有原始数据参数;其中,所述标的数据标签的元数据...

【专利技术属性】
技术研发人员:何俊乐陈伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1