System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及标准文件处理技术,尤其涉及一种标准文件的差异性确定方法及装置、存储介质。
技术介绍
1、目前,标准文件的处理,一般是通过转换为pdf格式文件或非编辑文本的方式,保证标准文件的统一性及完备性,即使转换为pdf格式文件或非编辑文本的文件,在文件传输或流转过程中,仍存在标准文件被篡改的可能性,因此,如何确定标准文件是否存在差异,是确定文件是否被篡改的最佳方式。
技术实现思路
1、本申请实施例提供一种标准文件的差异性确定方法及装置、存储介质,以至少解决前述的技术问题。
2、本申请实施例技术方案是这样实现的:
3、本申请实施例提供一种风险确定方法,所述方法包括:
4、获取两个以上的标准文件,对各标准文件进行解析,确定两个以上的标准文件之间的关系图,确定关系图中的目标节点的节点信息;所述关系图指示第一标准文件与第二标准文件之间的重合度;
5、获取各标准文件的编码向量,对所述编码向量进行特征提取,生成第一特征向量;所述第一特征向量,至少能够反映重合度的相关关系;
6、对所述第一特征向量进行多次维度压缩,生成第二特征向量;
7、基于所述第二特征向量,确定两个以上的标准文件的差异性。
8、上述方案中,所述对所述编码向量进行特征提取,生成第一特征向量,包括:
9、通过多头注意力机制对所述编码向量进行多次特征提取,生成第一特征向量。
10、上述方案中,所述通过多头注意力机制对所述编码向量
11、当进行第一次特征提取时,通过所述多头注意力机制对所述编码向量进行特征提取,生成所述第一特征向量。
12、上述方案中,对所述第一特征向量进行多次维度压缩,生成第二特征向量,包括:
13、进行第一次维度压缩时,通过知识蒸馏模型对所述第一特征向量进行维度压缩,生成所述第二特征向量。
14、上述方案中,所述通过多头注意力机制对所述编码向量进行一次或多次特征提取,生成第一特征向量,包括:
15、当进行第n次特征提取时,通过所述多头注意力机制对第n-1个所述第二特征向量进行特征提取,生成第n个所述第一特征向量;n为大于等于2的正整数;
16、当进行第n次维度压缩时,通过知识蒸馏模型对所述第n个所述第一特征向量进行维度压缩,生成第n个所述第二特征向量。
17、本申请实施例还提供一种标准文件的差异性确定装置,包括:
18、解析单元,用于获取两个以上的标准文件,对各标准文件进行解析,确定两个以上的标准文件之间的关系图,确定关系图中的目标节点的节点信息;所述关系图指示第一标准文件与第二标准文件之间的重合度;
19、特征提取单元,用于获取各标准文件的编码向量,对所述编码向量进行特征提取,生成第一特征向量;所述第一特征向量,至少能够反映重合度的相关关系;
20、压缩单元,用于对所述第一特征向量进行多次维度压缩,生成第二特征向量;
21、确定单元,用于基于所述第二特征向量,确定两个以上的标准文件的差异性。
22、上述方案中,所述特征提取单元,还用于:
23、通过多头注意力机制对所述编码向量进行多次特征提取,生成第一特征向量。
24、上述方案中,所述特征提取单元,还用于:
25、当进行第一次特征提取时,通过所述多头注意力机制对所述编码向量进行特征提取,生成所述第一特征向量。
26、上述方案中,所述特征提取单元,还用于:
27、进行第一次维度压缩时,通过知识蒸馏模型对所述第一特征向量进行维度压缩,生成所述第二特征向量。
28、本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现上述标准文件的差异性确定方法的步骤。
29、本实施例中,根据标准文件中关系图中目标节点的节点信息,生成编码向量,通过时间序列中不同时间点的关系图中不同类型的信息进行特征提取和融合,更好地从时间序列的维度捕捉时序特征,提高了时间感知能力,实现了标准文件差异性的准确识别,达到更好的文件比对精准度;通过对特征提取层所输出的特征向量的时序维度进行维度压缩,简化了标准文件差异性识别的网络结构,减少过拟合现象的出现,减少了模型参数,提高了计算效率。
本文档来自技高网...【技术保护点】
1.一种标准文件的差异性确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述编码向量进行特征提取,生成第一特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过多头注意力机制对所述编码向量进行一次或多次特征提取,生成第一特征向量,包括:
4.根据权利要求2所述的风险确定方法,其特征在于,对所述第一特征向量进行多次维度压缩,生成第二特征向量,包括:
5.根据权利要求3或4所述的方法,其特征在于,所述通过多头注意力机制对所述编码向量进行一次或多次特征提取,生成第一特征向量,包括:
6.一种标准文件的差异性确定装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述特征提取单元,还用于:
8.根据权利要求7所述的装置,其特征在于,所述特征提取单元,还用于:
9.根据权利要求7所述的装置,其特征在于,所述特征提取单元,还用于:
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计
...【技术特征摘要】
1.一种标准文件的差异性确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述编码向量进行特征提取,生成第一特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过多头注意力机制对所述编码向量进行一次或多次特征提取,生成第一特征向量,包括:
4.根据权利要求2所述的风险确定方法,其特征在于,对所述第一特征向量进行多次维度压缩,生成第二特征向量,包括:
5.根据权利要求3或4所述的方法,其特征在于,所述通过多头注意力机制对所述编码向量进行一次...
【专利技术属性】
技术研发人员:周育忠,林正平,王庆红,喇元,王昕,
申请(专利权)人:南方电网科学研究院有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。