【技术实现步骤摘要】
基于数据标签的数据确权方法及系统
[0001]本专利技术属于大数据
,具体涉及一种基于数据标签的数据确权方法、系统、电子设备以及存储介质。
技术介绍
[0002]数据标签是数据资源的一种表现形式,由于其对于电子商务领域的联机交易场景或金融保险领域的背景调查等业务分析具有针对性和可解读性,在数据加工、分析和建模中被广泛地使用。基于数据标签的大规模使用,其带来的业务价值被越来越多人关注。标签的归属方或维护方希望将其业务价值可以转换为实际的金钱收益,在一定程度上分摊标签加工和维护所带来的人力成本和机器成本。因此,需要对数据标签进行确权归属的评估。
[0003]数据资源确权是对交易的数据资源进行身份认证以确定数据资源的真正拥有者(即数据源)。数据资源确权是保证数据资源安全性和可靠性的前提,只有经过数据资源确权的数据才能明确数据的真实来源,才能保证数据资源安全性和可靠性,才能发挥数据资源的真正价值。而数据标签通常是由多份基础数据经过加工、计算而来,基础数据对于数据标签而言具有一定的贡献度;但是,基础数据可能来自于不同的数据属主,使得数据标签在贡献确权方面存在一定的困难,进而使得数据标签的业务价值转换为金钱收益的过程更加难以实现。
[0004]在现有技术中,存在利用区块链技术进行数据的价值评估和确权的技术方案,但是存在的弊端如下:1)因为利用区块链技术对数据进行确权,需要依赖区块链技术加密和数字认证技术,针对很多并没有上链的数据无法实现;2)并没有对数据标签这一特殊的数据资产进行明确的确权分析,只能基于数字 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据标签的数据确权方法,其特征在于,方法包括:获取标的数据标签的元数据信息和存储位置信息;根据所述元数据信息调用所述标的数据标签的血缘关系信息;其中,所述血缘关系信息包括所述标的数据标签关联的所有原始数据参数;根据所述血缘关系信息调用所述标的数据标签关联的各个原始数据对应的存储位置信息和归属方;根据所述标的数据标签关联的各个原始数据对应的存储位置信息调用所述标的数据标签关联的各个原始数据,并将所述标的数据标签与各个原始数据分别组成关联数据;基于所述关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例;根据所述贡献比例以及各个原始数据的归属方,确定所述归属方对于所述标的数据标签的贡献比例,并根据所述归属方对于所述标的数据标签的贡献比例进行标的数据标签的确权。2.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,将所述标的数据标签与各个原始数据分别组成关联数据的方法包括,获取所调用的所述标的数据标签关联的各个原始数据的数据库名以及数据表名;将所述标的数据标签与每个原始数据形成一个关联组合;针对每个关联组合,根据所述关联组合中的数据库以及数据表在SQL操作语句中的内连接条件构造新的内连接,获得所述标的数据标签与各个原始数据组成的关联数据。3.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,基于关联数据利用预设的特征因子以及各个特征因子对应的权重,确定各个原始数据对于所述标的数据标签的贡献比例的方法包括,根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;分别对各个关联数据的各个特征因子和各个特征因子对应的权重进行加权求和;对各个关联数据对应的加权求和结果进行归一化处理,确定各个原始数据对于所述标的数据标签的贡献比例。4.根据权利要求3所述的基于数据标签的数据确权方法,其特征在于,根据预设的特征因子以及各个特征因子对应的权重,获取各个关联数据的各个特征因子对应的权重;对所述特征因子以及各个特征因子对应的权重进行设定;其中,特征因子包括饱和度、信息熵和一致性;通过JAVA程序暴露用于获取关联数据的各个特征因子对应的权重的API接口;通过所述API接口获取各个关联数据的各个特征因子对应的权重。5.根据权利要求1所述的基于数据标签的数据确权方法,其特征在于,根据所述元数据信息调用所述标的数据标签的血缘关系信息的方法包括,通过JAVA程序暴露用于调用数据标签的血缘关系信息的API接口;利用所述标的数据标签的元数据信息通过所述API接口调用标的数据标签的血缘关系信息,获得所述标的数据标签关联的所有原始数据参数;其中,所述标的数据标签的元数据...
【专利技术属性】
技术研发人员:何俊乐,陈伟,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。