一种基于数据脱敏处理的信息传输方法及设备技术

技术编号:39247323 阅读:10 留言:0更新日期:2023-10-30 11:59
本申请提供一种基于数据脱敏处理的信息传输方法及设备,通过初始相关性评分张量中各个矩阵对应的平衡参数,对初始相关性评分张量进行修正,进而得到对照相关性评分张量,通过平衡参数的修正,可以聚拢相同待脱敏文本类型的文本段落的敏感信息表征向量的相关性评分,拉长不同待脱敏文本类型的文本段落的敏感信息表征向量的相关性评分,以使通过对照相关性评分张量确定的待脱敏文本类型的数量更精准,之后通过准确度提升的待脱敏文本类型的数量对多个文本段落进行群集分析,得到各个待脱敏文本类型对应的文本段落,以使确定的各个待脱敏文本类型对应的文本段落的精确程度更高,待脱敏文本类型群集分析的准确度提升,从而增加文本段落的脱敏精确性。文本段落的脱敏精确性。文本段落的脱敏精确性。

【技术实现步骤摘要】
一种基于数据脱敏处理的信息传输方法及设备


[0001]本申请涉及数据脱敏、文本处理领域,具体涉及一种基于数据脱敏处理的信息传输方法及设备。

技术介绍

[0002]数据脱敏是在信息传输过程中保护敏感数据隐私的技术,通过对敏感数据进行适应性操作,如变换或替换,使得在传输和处理过程中难以还原出原始的敏感信息,从而保护敏感数据。例如,在社交平台的应用中,可以对文本数据进行脱敏,文本脱敏通常涉及个人隐私信息脱敏,如真实姓名、生日等,或者帖子或评论内容中的个人观点、心情等;以及个人资料,如手机号码、邮箱地址等;另外还涉及诸如私信或聊天记录等对话内容,也可能涉及敏感信息。为了保护用户的隐私,可以对以上内容进行脱敏处理。但是,对于大规模的文本数据,其中通常涉及的敏感信信息程度不一,现有技术中,针对不同类型的敏感信息采用的通用的脱敏方式,导致社交交流环境生硬,影响用户体验。

技术实现思路

[0003]本申请提供了一种基于数据脱敏处理的信息传输方法及设备。
[0004]根据本申请的一方面,提供了一种基于数据脱敏处理的信息传输方法,应用于计算机设备,所述方法包括:获取待处理的多个文本段落分别对应的敏感信息表征向量,所述敏感信息表征向量用以表征所述文本段落对应的敏感信息特征;通过各个文本段落对应的敏感信息表征向量,确定初始相关性评分张量,所述初始相关性评分张量中包括任意两个文本段落对应的敏感信息表征向量之间的相关性评分;通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量;通过所述对照相关性评分张量确定所述多个文本段落中具有的待脱敏文本类型的数量;通过所述待脱敏文本类型的数量,对所述多个文本段落进行群集分析,得到各个待脱敏文本类型对应的文本段落;基于各个所述待脱敏文本类型分别对应的匿名化策略,对各个待脱敏文本类型对应的文本段落进行匿名化处理,将匿名化处理后的文本进行传输。
[0005]作为一种实施方式,所述通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量之前,所述方法还包括:针对所述初始相关性评分张量中的任意一个矩阵,采取第一整理机制对所述任意一个矩阵包括的多个相关性评分中处在预设范围的相关性评分进行顺次编排,得到第一编排序列;
通过所述第一编排序列,确定处在所述预设范围的相关性评分中毗连的两个相关性评分之间的相关性评分差,得到多个相关性评分差;在所述多个相关性评分差中确定最大的相关性评分差;通过所述最大的相关性评分差确定所述任意一个矩阵对应的平衡参数。
[0006]作为一种实施方式,所述通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量,包括:将所述初始相关性评分张量各个矩阵包括的相关性评分中小于所述各个矩阵对应的平衡参数的相关性评分修改成第一元素值,得到所述对照相关性评分张量;或者;将所述初始相关性评分张量各个矩阵包括的相关性评分中小于所述各个矩阵对应的平衡参数的相关性评分与第二元素值进行乘积运算,得到所述对照相关性评分张量。
[0007]作为一种实施方式,所述通过所述对照相关性评分张量确定所述多个文本段落中具有的待脱敏文本类型的数量,包括:通过多个调节变量对所述对照相关性评分张量进行处理,得到各个调节变量对应的目标相关性评分张量;通过所述多个调节变量和所述各个调节变量对应的目标相关性评分张量,确定所述多个文本段落中具有的待脱敏文本类型的数量。
[0008]作为一种实施方式,所述通过多个调节变量对所述对照相关性评分张量进行处理,得到各个调节变量对应的目标相关性评分张量,包括:针对所述多个调节变量中的任一调节变量,通过所述任一调节变量对所述对照相关性评分张量进行元素值调节,得到第一相关性评分张量,所述元素值调节用于提炼所述对照相关性评分张量;对所述第一相关性评分张量中的每一层进行转置,得到第二相关性评分张量,所述第二相关性评分张量中相关性评分G[x, y, z]与相关性评分G[y, x, z]相同,其中,相关性评分G[x, y, z]代表矩阵层数序号为z的矩阵的第x行,第y列的相关性评分,相关性评分G[y,x, z]代表矩阵层数序号为z的矩阵的第y行,第x列的相关性评分;对所述第二相关性评分张量中的每一层进行尺寸扩展,得到第三相关性评分张量,所述第三相关性评分张量用于生成多个待脱敏文本类型之间的界线;对所述第三相关性评分张量中的每一层进行元素值归一,得到第四相关性评分张量,所述元素值归一用于将所述第三相关性评分张量中各个矩阵包括的相关性评分进行归一化;对所述第四相关性评分张量中的每一层进行转置,得到所述任一调节变量对应的目标相关性评分张量。
[0009]作为一种实施方式,所述通过所述任一调节变量对所述对照相关性评分张量进行元素值调节,得到第一相关性评分张量,包括:针对所述对照相关性评分张量各个矩阵包括的多个相关性评分,将最大的任一调节变量个相关性评分以外的相关性评分修改成第三元素值,得到所述第一相关性评分张量;或者;将所述对照相关性评分张量包括的多个相关性评分中,除最大的任一调节变量个相关性评分以外的相关性评分与第四元素值进行乘积运算,得到所述第一相关性评分张
量;所述对所述第一相关性评分张量中的每一层进行转置,得到第二相关性评分张量,包括:确定所述第一相关性评分张量中每一层的转置;将所述第一相关性评分张量和所述第一相关性评分张量中每一层的转置中处在相同位置的相关性评分相加,得到中间相关性评分张量;对所述中间相关性评分张量包括的多个相关性评分除以二,得到所述第二相关性评分张量;所述对所述第一相关性评分张量中的每一层进行转置,得到第二相关性评分张量,包括:确定所述第一相关性评分张量中的所述相关性评分G[x, y, z]与所述第一相关性评分张量中的相关性评分G[y, x, z]中最大的相关性评分,将所述最大的相关性评分作为所述第二相关性评分张量中所述相关性评分G[x, y, z]和所述相关性评分G[y, x, z]的元素值,得到所述第二相关性评分张量;所述对所述第二相关性评分张量中的每一层进行尺寸扩展,得到第三相关性评分张量,包括:确定所述第二相关性评分张量中的每一层对应的转置;通过所述第二相关性评分张量和所述第二相关性评分张量中的每一层对应的转置,确定所述第三相关性评分张量,所述第三相关性评分张量中相关性评分G[r, s, t]基于所述第二相关性评分张量中处在第t层的第r行的相关性评分和所述第二相关性评分张量中的第t层对应的转置中处在所述第s列的相关性评分确定得到,其中,所述t为矩阵层数序号,所述r为对应的行数,所述s为对应的列数;所述对所述第三相关性评分张量中的每一层进行元素值归一,得到第四相关性评分张量,包括:通过所述第三相关性评分张量中各个矩阵包括的多个相关性评分,确定各个矩阵对应的最大相关性评分;将所述第三相关性评分张量中各个矩阵包括的多个相关性评分分别与所述各个矩阵对应的最大相关性评分进行除法运算,得到所述第四相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据脱敏处理的信息传输方法,其特征在于,应用于计算机设备,所述方法包括:获取待处理的多个文本段落分别对应的敏感信息表征向量,所述敏感信息表征向量用以表征所述文本段落对应的敏感信息特征;通过各个文本段落对应的敏感信息表征向量,确定初始相关性评分张量,所述初始相关性评分张量中包括任意两个文本段落对应的敏感信息表征向量之间的相关性评分;通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量;通过所述对照相关性评分张量确定所述多个文本段落中具有的待脱敏文本类型的数量;通过所述待脱敏文本类型的数量,对所述多个文本段落进行群集分析,得到各个待脱敏文本类型对应的文本段落;基于各个所述待脱敏文本类型分别对应的匿名化策略,对各个待脱敏文本类型对应的文本段落进行匿名化处理,将匿名化处理后的文本进行传输。2.如权利要求1所述的方法,其特征在于,所述通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量之前,所述方法还包括:针对所述初始相关性评分张量中的任意一个矩阵,采取第一整理机制对所述任意一个矩阵包括的多个相关性评分中处在预设范围的相关性评分进行顺次编排,得到第一编排序列;通过所述第一编排序列,确定处在所述预设范围的相关性评分中毗连的两个相关性评分之间的相关性评分差,得到多个相关性评分差;在所述多个相关性评分差中确定最大的相关性评分差;通过所述最大的相关性评分差确定所述任意一个矩阵对应的平衡参数。3.如权利要求1所述的方法,其特征在于,所述通过所述初始相关性评分张量中各个矩阵对应的平衡参数,对所述初始相关性评分张量进行修正,得到对照相关性评分张量,包括:将所述初始相关性评分张量各个矩阵包括的相关性评分中小于所述各个矩阵对应的平衡参数的相关性评分修改成第一元素值,得到所述对照相关性评分张量;或者;将所述初始相关性评分张量各个矩阵包括的相关性评分中小于所述各个矩阵对应的平衡参数的相关性评分与第二元素值进行乘积运算,得到所述对照相关性评分张量。4.如权利要求1~3任一项所述的方法,其特征在于,所述通过所述对照相关性评分张量确定所述多个文本段落中具有的待脱敏文本类型的数量,包括:通过多个调节变量对所述对照相关性评分张量进行处理,得到各个调节变量对应的目标相关性评分张量;通过所述多个调节变量和所述各个调节变量对应的目标相关性评分张量,确定所述多个文本段落中具有的待脱敏文本类型的数量。5.如权利要求4所述的方法,其特征在于,所述通过多个调节变量对所述对照相关性评
分张量进行处理,得到各个调节变量对应的目标相关性评分张量,包括:针对所述多个调节变量中的任一调节变量,通过所述任一调节变量对所述对照相关性评分张量进行元素值调节,得到第一相关性评分张量,所述元素值调节用于提炼所述对照相关性评分张量;对所述第一相关性评分张量中的每一层进行转置,得到第二相关性评分张量,所述第二相关性评分张量中相关性评分G[x, y, z]与相关性评分G[y, x, z]相同,其中,相关性评分G[x, y, z]代表矩阵层数序号为z的矩阵的第x行,第y列的相关性评分,相关性评分G[y,x, z]代表矩阵层数序号为z的矩阵的第y行,第x列的相关性评分;对所述第二相关性评分张量中的每一层进行尺寸扩展,得到第三相关性评分张量,所述第三相关性评分张量用于生成多个待脱敏文本类型之间的界线;对所述第三相关性评分张量中的每一层进行元素值归一,得到第四相关性评分张量,所述元素值归一用于将所述第三相关性评分张量中各个矩阵包括的相关性评分进行归一化;对所述第四相关性评分张量中的每一层进行转置,得到所述任一调节变量对应的目标相关性评分张量。6.如权利要求5所述的方法,其特征在于,所述通过所述任一调节变量对所述对照相关性评分张量进行元素值调节,得到第一相关性评分张量,包括:针对所述对照相关性评分张量各个矩阵包括的多个相关性评分,将最大的任一调节变量个相关性评分以外的相关性评分修改成第三元素值,得到所述第一相关性评分张量;或者;将所述对照相关性评分张量包括的多个相关性评分中,除最大的任一调节变量个相关性评分以外的相关性评分与第四元素值进行乘积运算,得到所述第一相关性评分张量;所述对所述第一相关性评分张量中的每一层进行转置,得到第二相关性评分张量,包括:确定所述第一相关性评分张量中每一层的转置;将所述第一相关性评分张量和所述第一相关性评分张量中每一层的转置中处在相同位置的相关性评分相加,得到中间相关性评分张量;对所述中间相关性评分张量包括的多个相关性评分除以二,得到所述第...

【专利技术属性】
技术研发人员:钮浩
申请(专利权)人:深圳北控信息发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1