神经网络的解释方法、装置、电子设备和存储介质制造方法及图纸

技术编号：41065622 阅读：6 留言：0更新日期：2024-04-24 11:19

本申请实施例涉及神经网络的解释方法、装置、电子设备和存储介质，上述方法包括：获取样本数据；根据所述样本数据构建知识图谱，得到第一解释数据；将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据；对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据。上述神经网络的解释方法、装置、电子设备和存储介质，能够得到目标神经网络多个方面的解释数据，增强目标神经网络的整体可解释性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，具体涉及一种神经网络的解释方法、装置、电子设备和存储介质。

技术介绍

1、近年来，随着深度学习和神经网络模型技术的发展，各类基于神经网络的大规模预训练语言模型(large language model，llm)逐渐成为自然语言处理任务的主流技术。然而，这类神经网络由于内部网络结构复杂，内在的机理难以为人所理解，导致神经网络模型的行为不可解释，即黑箱效应。这类不可解释性问题使得神经网络模型很难被广泛应用到对可解释性要求较高的安全关键领域，如医疗、金融、法律等；同时也给ai(artificialintelligence，人工智能)系统在社会中的可信度和伦理规范带来了隐患。

技术实现思路

1、本申请实施例公开了一种神经网络的解释方法、装置、电子设备和存储介质，能够得到目标神经网络多个方面的解释数据，增强目标神经网络的整体可解释性。

2、第一方面，本申请实施例公开了一种神经网络的解释方法，包括：

3、获取样本数据；

4、根据所述样本数据构建知识图谱，得到第一解释数据；

5、将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据；

6、对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据。

7、作为一种可选的实施方式，在本申请实施例的第一方面中，在对所述第一

8、通过对抗学习模块对所述样本数据进行对抗训练，得到对抗样本数据；

9、对所述对抗样本数据进行安全性分析，生成第三解释数据；

10、所述对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据，包括：

11、根据对第一解释数据、所述第二解释数据及所述第三解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据。

12、作为一种可选的实施方式，在本申请实施例的第一方面中，所述对所述对抗样本数据进行安全性分析，生成第三解释数据，包括：

13、通过所述目标神经网络对所述对抗样本数据进行语言分析处理，得到对抗预测结果；

14、对所述对抗预测结果与所述处理结果进行安全性分析，得到第三解释数据。

15、作为一种可选的实施方式，在本申请实施例的第一方面中，所述目标神经网络包括n个编码层及注意力模块，所述注意力模块包括与所述n个编码层一一对应的n个注意力层，每个所述编码层与对应的注意力层相连；所述n为正整数；所述将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据，包括：

16、通过目标神经网络的当前编码层对所述当前编码层的输入向量进行编码处理，得到所述当前编码层的输出向量；其中，第一编码层的输入向量为所述样本数据；

17、通过目标注意力层对所述当前编码层的输出向量进行注意力计算，得到所述当前编码层对应的注意力向量；所述目标注意力层为与所述当前编码层相连的注意力层；

18、将所述当前编码层的输出向量作为新的当前编码层的输入向量，将下一编码层作为新的当前编码层，重复执行通过目标神经网络的当前编码层对所述当前编码层的输入向量进行编码处理，得到所述当前编码层的输出向量；通过目标注意力层，对所述当前编码层的输出向量进行注意力计算，得到所述当前编码层对应的注意力向量的步骤，直至所述当前编码层为所述目标神经网络最后一编码层，并将所述目标神经网络最后一编码层的输出向量作为处理结果；

19、根据所述n个编码层对应的注意力向量，构建第二解释数据。

20、作为一种可选的实施方式，在本申请实施例的第一方面中，所述通过目标注意力层，对所述当前编码层的输出向量进行注意力计算，得到所述当前编码层对应的注意力向量，包括：

21、通过目标注意力层，将所述当前编码层的输出向量分别与预设的多个权值矩阵相乘，得到所述目标注意力层对应的多个目标中间矩阵；

22、对所述多个目标中间矩阵进行归一化，得到所述当前编码层对应的注意力向量。

23、作为一种可选的实施方式，在本申请实施例的第一方面中，所述多个目标中间矩阵包括查询向量矩阵、关键向量矩阵及值向量矩阵；所述对所述多个目标中间矩阵进行归一化，得到所述当前编码层对应的注意力向量，包括：

24、将所述关键向量矩阵的转置与所述查询向量矩阵相乘，得到第一乘积；

25、计算所述关键向量矩阵的维度，得到第一维度值；

26、将所述第一乘积与所述第一维度值的比值进行归一化，并将归一化的结果与所述值向量矩阵相乘，得到所述当前编码层对应的注意力向量。

27、作为一种可选的实施方式，在本申请实施例的第一方面中，所述对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据，包括：

28、将所述第一解释数据及所述第二解释数据作为源数据，构建语义问答模型；

29、获取问题数据；

30、通过所述语义问答模型对所述问题数据进行语义分析，得到所述问题数据对应的答复数据，并将所述答复数据作为所述目标神经网络对应的目标解释数据。

31、第二方面，本申请实施例公开了一种，神经网络的解释装置，包括：

32、数据获取模块，用于获取样本数据；

33、第一解释模块，用于根据所述样本数据构建知识图谱，得到第一解释数据；

34、第二解释模块，用于将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据；

35、多模式解释模块，用于对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据。

36、第三方面，本申请实施例公开了一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如上任一实施例所述的方法。

37、第四方面，本申请实施例公开了一种存储介质，所述存储介质存储计算机程序，所述计算机程序被处理器执行时实现如上任一实施例所述的方法。

38、本申请实施例公开的神经网络的解释方法、装置、电子设备和存储介质，获取样本数据；根据样本数据构建知识图谱，得到第一解释数据；将样本数据输入目标神经网络中，通过目标神经网络对样本数据进行语言分析处理，得到处理结果，并基于注意力机制对样本数据进行注意力计算，以生成第二解释数据；对第一解释数据及第二解释数据进行语义分析，本文档来自技高网...

【技术保护点】

1.一种神经网络的解释方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据之前，所述的方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述对抗样本数据进行安全性分析，生成第三解释数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述目标神经网络包括N个编码层及注意力模块，所述注意力模块包括与所述N个编码层一一对应的N个注意力层，每个所述编码层与对应的注意力层相连；所述N为正整数；所述将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述通过目标注意力层，对所述当前编码层的输出向量进行注意力计算，得到所述当前编码层对应的注意力向量，包括：

6.根据权利要求5所述的方法，其特征在于，所述多个目标中间矩阵包括查询向量矩阵、关键向量矩

7.根据权利要求1～6任一项所述的方法，其特征在于，所述对所述第一解释数据及所述第二解释数据进行语义分析，生成所述目标神经网络对应的目标解释数据，包括：

8.一种神经网络的解释装置，其特征在于，所述装置包括：

9.一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现如权利要求1至7任一项所述的方法。

10.一种存储介质，其特征在于，所述存储介质存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种神经网络的解释方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述对抗样本数据进行安全性分析，生成第三解释数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述目标神经网络包括n个编码层及注意力模块，所述注意力模块包括与所述n个编码层一一对应的n个注意力层，每个所述编码层与对应的注意力层相连；所述n为正整数；所述将所述样本数据输入目标神经网络中，通过所述目标神经网络对所述样本数据进行语言分析处理，得到处理结果，并基于注意力机制对所述样本数据进行注意力计算，以生成第二解释数据，包括：

5.根据权利要求4所述的方法，其特征在于，所述通过目标注意力层，对所述当前...

【专利技术属性】
技术研发人员：刘汉亮，邱述洪，林栋，
申请(专利权)人：联通广东产业互联网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人