当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于多分类器融合的多标准数据确权方法技术

技术编号:38155842 阅读:13 留言:0更新日期:2023-07-13 09:24
本发明专利技术的一种基于多分类器融合的多标准数据确权方法,包括:根据“三分原则”确定确权分类标准,确定待确权数据的数据属性描述;将数据属性描述以向量的形式表示,根据确权分类标准将向量进行切分和整合,作为确权分类模型的输入向量;构建包含两级SVM分类器的确权分类模型,利用初级SVM分类器对数据的权力主体、竞争性、排他性进行分类;对初级SVM分类器得到的分类信息进行整合并输入到次级SVM分类器,得到数据确权结果。本发明专利技术通过构建确权数据的数据属性描述,再利用确权分类模型与多分类器融合技术对数据进行确权,克服了机器学习算法中存在的假设空间表达能力不足的问题,提高了分类的准确性,保证了数据的安全性和价值。保证了数据的安全性和价值。保证了数据的安全性和价值。

【技术实现步骤摘要】
一种基于多分类器融合的多标准数据确权方法


[0001]本专利技术涉及数据安全管理
,具体涉及一种基于多分类器融合的多标准数据确权方法。

技术介绍

[0002]随着数字化时代的到来,各种数据规模大幅增加,这些数据来源多样、格式复杂、质量参差不齐。并且随着数据技术的不断进步,人工智能、机器学习等技术的应用越来越广泛,对数据的准确性和可靠性要求也越来越高。在这种情况下,数据确权作为一项重要的数据管理手段,它可以帮助用户识别和区分数据的价值,保证数据的完整性、可信度和可靠性,并支持数据的应用和分析,从而更好地满足用户需要。目前,随着数据安全问题日益突出,数据确权也成为保护数据安全的重要手段之一。它可以通过对数据的来源、采集、传输、存储、处理等环节进行管控,降低数据被攻击和滥用的风险。近年来,许多人都在数据确权领域进行研究,但是因为数据来源不清晰、数据分类困难、法律法规等问题的存在,数据确权还存在着争议和分歧,面临着多重困境。

技术实现思路

[0003]为解决上述技术问题,本专利技术的目的是提供一种基于多分类器融合的多标准数据确权方法,通过构建确权数据的数据属性描述,再利用确权分类模型与多分类器融合技术对数据进行确权,克服了机器学习算法中存在的假设空间表达能力不足的问题,提高了分类的准确性,保证了数据的安全性和价值。
[0004]本专利技术提供一种基于多分类器融合的多标准数据确权方法,包括:
[0005]步骤1:根据数据确权的“三分原则”确定确权分类标准,根据确权分类标准确定待确权数据的数据属性描述;
[0006]步骤2:将数据属性描述以向量的形式表示,根据不同的确权分类标准将向量进行切分和整合,作为确权分类模型的多个分类器的输入向量;
[0007]步骤3:构建包含3个初级SVM分类器和1个次级SVM分类器的确权分类模型,并利用训练好的初级SVM分类器对数据的权力主体、竞争性、排他性进行分类;
[0008]步骤4:通过多分类器融合技术,对3个初级SVM分类器得到的分类信息进行整合,将整合后的分类信息输入到次级SVM分类器,得到数据权力主体拥有哪些产权类型,实现多标准分类。
[0009]进一步的,所述步骤1具体为:
[0010]步骤1.1:根据数据确权的“三分原则”,即分割、分类、分级的原则,确定确权分类标准;
[0011]步骤1.2:根据确权分类标准定确权数据的数据属性描述。
[0012]进一步的,所述步骤1.1中的确权分类标准为:
[0013](1)根据数据确权的分割原则,将数据的产权分为基础数据产权、衍生数据产权和
数据公有产权3种产权类型;
[0014](2)根据数据确权的分类原则,根据数据主体的不同,将数据权力主体分为:个人数据、企业数据和社会数据;
[0015](3)根据数据确权的分级原则,按照竞争性和排他性对数据进行不同级别的划分,将数据分为私有品、准公共品和公共品。
[0016]进一步的:
[0017]基础数据产权包括:管理权、安全权、转让权、修改更正权、被遗忘权、知情同意权、可携带权、收益权、控制权;
[0018]衍生数据产权包括:使用权、剩余控制权、剩余索取权;
[0019]数据公有产权包括:控制权、开放权、管理权。
[0020]进一步的,所述步骤1.2中的确权数据的数据属性描述包括如下条件属性:
[0021]数据的直接提供者;是否涉及隐私数据,包括但不限于个人姓名、电话、住址、职业、学历、偏好、习惯、旅游记录、购物记录、浏览记录;数据的使用是否合法或得到授权;数据的产生方式;数据是否涉及到自然资源数据、经济社会数据、与国家安全相关的数据;数据的使用是否存在较大的外部收益的产生;数据的传播是否会减少该数据的效益或增加成本;数据是否涉及相关核心利益;数据的使用是否存在内部人员和外部人员的权限不一样;是否有约定数据内容不能公开或限时公开。
[0022]进一步的,所述步骤2具体为:
[0023]步骤2.1:将用户输入的数据属性描述映射为离散型数据并构成向量,对条件属性“数据的直接提供者是谁”设置了三个选择,分别是“个人”、“企业”、“政府”,将“个人”映射为1,“企业”映射为2,“政府”映射为3;
[0024]步骤2.2:对条件属性“数据的产生方式”设置了三个选择,分别是“自然人行为”、“生产经营”、“依法收集”,将“自然人行为”映射为1,“生产经营”映射为2,“依法收集”映射为3;
[0025]步骤2.3:对其他条件属性设置三个选择,分别是“是”、“否”、“不清楚”,“是”映射为1,“否”映射为2,“不清楚”映射为3;
[0026]步骤2.4:根据不同的确权分类标准将向量进行切分和整合,分别作为确权分类模型的多个分类器的输入向量。
[0027]进一步的,步骤3具体为:
[0028]步骤3.1:构建包含3个初级SVM分类器和1个次级SVM分类器的确权分类模型,进而通过3个初级SVM分类器对数据的权力主体、竞争性、排他性进行分类;
[0029]步骤3.2:训练多个SVM分类器,通过高斯核函数将低维空间中的数据映射到高维空间中,使得原本线性不可分的数据变得线性可分并在高维空间中寻找最优的超平面来进行分类,通过求解下式的凸优化问题,得到各个SVM分类器的参数;
[0030][0031]其中,x
i
为第i个训练数据的条件属性向量,y
i
为x
i
对应的类别标记,w和b为SVM分类器的参数;
[0032]步骤3.3:通过使用大量经过标注的数据集对SVM分类器进行训练,使得每个SVM分
类器的准确率达到分类任务所要求的标准;
[0033]步骤3.4:将根据不同的确权分类标准对向量进行切分和整合后获得的各个输入向量输入到对应的初级SVM分类器中,对数据的权力主体、竞争性、排他性进行分类。
[0034]进一步的,所述步骤4包括:
[0035]步骤4.1:将3个初级SVM分类器的分类信息进行整合作为次级SVM分类器的输入;
[0036]步骤4.2:确权分类模型输出数据确权的结果,即数据权力主体拥有3种产权类型中的哪些产权,数据确权的结果包括八个类别。
[0037]本专利技术的一种基于多分类器融合的多标准数据确权方法,至少具有以下有益效果:
[0038]本专利技术根据数据确权“三分原则”确定确权分类标准,根据确权分类标准确定确权数据的数据属性描述,并将数据属性描述映射为离散型数据以构成确权分类模型的输入向量,通过构建的确权分类模型对权力主体、数据的竞争性、排他性进行分类,最后通过多分类器融合技术输出最后的确权结果。采用本专利技术的多标准数据确权方法用户无需阅读大量的数据确权标准的相关文件,只需提供相关的数据属性描述即可进行数据自动确权。
附图说明
[0039]图1是本专利技术的一种基于多分类器融合的多标准数据确权方法的流程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多分类器融合的多标准数据确权方法,其特征在于,包括:步骤1:根据数据确权的“三分原则”确定确权分类标准,根据确权分类标准确定待确权数据的数据属性描述;步骤2:将数据属性描述以向量的形式表示,根据不同的确权分类标准将向量进行切分和整合,作为确权分类模型的多个分类器的输入向量;步骤3:构建包含3个初级SVM分类器和1个次级SVM分类器的确权分类模型,并利用训练好的初级SVM分类器对数据的权力主体、竞争性、排他性进行分类;步骤4:通过多分类器融合技术,对3个初级SVM分类器得到的分类信息进行整合,将整合后的分类信息输入到次级SVM分类器,得到数据权力主体拥有哪些产权类型,实现多标准分类。2.如权利要求1所述的基于多分类器融合的多标准数据确权方法,其特征在于,所述步骤1具体为:步骤1.1:根据数据确权的“三分原则”,即分割、分类、分级的原则,确定确权分类标准;步骤1.2:根据确权分类标准定确权数据的数据属性描述。3.如权利要求2所述的基于多分类器融合的多标准数据确权方法,其特征在于,所述步骤1.1中的确权分类标准为:(1)根据数据确权的分割原则,将数据的产权分为基础数据产权、衍生数据产权和数据公有产权3种产权类型;(2)根据数据确权的分类原则,根据数据主体的不同,将数据权力主体分为:个人数据、企业数据和社会数据;(3)根据数据确权的分级原则,按照竞争性和排他性对数据进行不同级别的划分,将数据分为私有品、准公共品和公共品。4.如权利要求3所述的基于多分类器融合的多标准数据确权方法,其特征在于:基础数据产权包括:管理权、安全权、转让权、修改更正权、被遗忘权、知情同意权、可携带权、收益权、控制权;衍生数据产权包括:使用权、剩余控制权、剩余索取权;数据公有产权包括:控制权、开放权、管理权。5.如权利要求2所述的基于多分类器融合的多标准数据确权方法,其特征在于,所述步骤1.2中的确权数据的数据属性描述包括如下条件属性:数据的直接提供者;是否涉及隐私数据,包括但不限于个人姓名、电话、住址、职业、学历、偏好、习惯、旅游记录、购物记录、浏览记录;数据的使用是否合法或得到授权;数据的产生方式;数据是否涉及到自然资源数据、经济社会数据、与国家安全相关的数据;数据的使用是否存在较大的外部收益的产生;数据的传播是否会减少该数据的效益或增加成本;数据是否涉及相关核心利益;数据的使用是...

【专利技术属性】
技术研发人员:易波张凯珉邱琳王兴伟
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1