【技术实现步骤摘要】
一种基于数据中台数据分级分类方法
本专利技术涉及数据中台领域,特别涉及一种基于数据中台数据分级分类方法。
技术介绍
数据中台是在政企数字化转型过程中,对各业务单元业务与数据的沉淀,构建包括数据技术、数据治理、数据运营等数据建设、管理、使用体系,实现数据赋能。现有的数据中台中由于数据层级和数据类别过多,较复杂时还会因用户访问权限的不同产生区别,因此需要根据多种不同的因素设置不同的分级标准,然而现有技术中仅是按照多种目标需求,直接将整体数据库打包按照需求分类,其中的运算复杂程度较大,更新难度强,特别是面对数据较为庞大的数据库,运算流程过长将会形成数据失真等严重后果。
技术实现思路
本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种基于数据中台数据分级分类方法。为了解决上述技术问题,本专利技术提供了如下的技术方案:本专利技术一种基于数据中台数据分级分类方法,具体包括如下步骤:A.建立数据分类标准:按照数据的提取方式形成模块式分类,模块的总称中设立多个词向量关联词,用于关联词联想,形成多个数据源之间相互独立的模块;B.建立数据分级标准:根据模块之间的提取频率和敏感度,按照数据源的参与度,将多个数据源模块之间相互关联,以多层级的方式在数据库中标注模块等级;C.根据数据中台结合:将步骤A和步骤B形成交叉递减表,以用户权限设立不同的敏感域块,按照不同的敏感域块进行编号设立新的层级编号,并储存为特征编码,列入清单表内设立时间戳,按照时间段更新。作为本专 ...
【技术保护点】
1.一种基于数据中台数据分级分类方法,其特征在于,具体包括如下步骤:/nA.建立数据分类标准:按照数据的提取方式形成模块式分类,模块的总称中设立多个词向量关联词,用于关联词联想,形成多个数据源之间相互独立的模块;/nB.建立数据分级标准:根据模块之间的提取频率和敏感度,按照数据源的参与度,将多个数据源模块之间相互关联,以多层级的方式在数据库中标注模块等级;/nC.根据数据中台结合:将步骤A和步骤B形成交叉递减表,以用户权限设立不同的敏感域块,按照不同的敏感域块进行编号设立新的层级编号,并储存为特征编码,列入清单表内设立时间戳,按照时间段更新。/n
【技术特征摘要】
1.一种基于数据中台数据分级分类方法,其特征在于,具体包括如下步骤:
A.建立数据分类标准:按照数据的提取方式形成模块式分类,模块的总称中设立多个词向量关联词,用于关联词联想,形成多个数据源之间相互独立的模块;
B.建立数据分级标准:根据模块之间的提取频率和敏感度,按照数据源的参与度,将多个数据源模块之间相互关联,以多层级的方式在数据库中标注模块等级;
C.根据数据中台结合:将步骤A和步骤B形成交叉递减表,以用户权限设立不同的敏感域块,按照不同的敏感域块进行编号设立新的层级编号,并储存为特征编码,列入清单表内设立时间戳,按照时间段更新。
2.根据权利要求1所述的一种基于数据中台数据分级分类方法,其特征在于,所述步骤A主要基于LDA分类算法,将采集的数据集中后按照目标内容分类为词源模块名称,多个词源模块名称中具有相同重叠的单词,而词源模块名称和词源模块名称之间主要通过重叠单词的数量和词源模块名称所形成的词向量敏感度形成关联。
3....
【专利技术属性】
技术研发人员:蒋鑫,蔡宇翔,吴飞,李棋,纪文,林德威,徐毅明,郑飘飘,王栋,肖琦敏,
申请(专利权)人:国网福建省电力有限公司信息通信分公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。