一种模型通用的深度神经网络表征可视化方法和装置制造方法及图纸

技术编号：24855788 阅读：90 留言：0更新日期：2020-07-10 19:08

为了解决现有技术中卷积神经网络可释性差的问题，本公开提供了一种卷积神经网络表征可视化方法、装置及训练方法，以提高卷积神经网络的可释性。卷积神经网络表征可视化方法，包括：在待可视化图像输入卷积神经网络后，获取第一特征图；反池化所述第一特征图以获得第二特征图；通过ReLU函数矫正所述第二特征图以获取第三特征图；反卷积或导向反向传播第三特征图以获得第一可视化特征图；显示所述第一可视化特征图。本申请还公开了相应的可视化装置，以及基于表征可视化方法的卷积神经网络训练方法。通过反池化、反激活、反卷积和导向反向传播运算，将卷积神经网络模型中待可视化层的特征激活情况进行显示，以提高卷积神经网络的可释性。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型通用的深度神经网络表征可视化方法和装置
本公开涉及智能领域，尤其涉及一种卷积神经网络表征可视化方法、装置及训练方法。
技术介绍
现有卷积神经网络虽然能够通过构建，标注大数据进行误差反向传播优化参数而训练的“端到端”模型；能够在某些场景下有喜人的表现，但是这些卷积神经网络模型均有一个不可忽略的同样问题：较弱的可解释性。即模型虽然给出了较高的准确率，但是却无法给出更多可靠的信息来解释给出结果的考虑依据。这样的情况造成在特定领域在金融、医疗、自动驾驶等要求高可解释的行业内，尽管卷积神经网络模型的结果数据好看，但是也无法切实地落地到应用中。同时，较差的可解释性意味着使得人们无法信任模型在面对新数据时给出的答案，这就导致模型的预测功能大打折扣，也进一步限制了深度模型在各个行业中的实际应用。
技术实现思路
为了解决上述技术问题中的至少一个，本公开提供了一种卷积神经网络表征可视化方法、装置及训练方法，提高卷积神经网络的可释性。本公开的一方面，一种卷积神经网络表征可视化方法，所述方法包括：在待可视化图像输入卷积神经网络后，获取第一特征图，其中，所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据；反池化所述第一特征图以获得第二特征图；通过ReLU函数矫正所述第二特征图以获取第三特征图；反卷积或导向反向传播所述第三特征图以获得第一可视化特征图；显示所述第一可视化特征图。可选的，所述方法还包括：获取第四特征图，所述第四特征图为卷积神经网络

【技术保护点】
1.卷积神经网络表征可视化方法，其特征在于，所述方法包括：/n在待可视化图像输入卷积神经网络后，获取第一特征图，其中，所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据；/n反池化所述第一特征图以获得第二特征图；/n通过ReLU函数矫正所述第二特征图以获取第三特征图；/n反卷积或导向反向传播所述第三特征图以获得第一可视化特征图；/n显示所述第一可视化特征图。/n

【技术特征摘要】
1.卷积神经网络表征可视化方法，其特征在于，所述方法包括：
在待可视化图像输入卷积神经网络后，获取第一特征图，其中，所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据；
反池化所述第一特征图以获得第二特征图；
通过ReLU函数矫正所述第二特征图以获取第三特征图；
反卷积或导向反向传播所述第三特征图以获得第一可视化特征图；
显示所述第一可视化特征图。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：
获取第四特征图，所述第四特征图为卷积神经网络的最后一个卷积层输出的特征数据；
全局均值池化所述第四特征图以获得第五特征图；
上采样所述第五特征图以获得第六特征图，将所述第六特征图叠加到所述待可视化图像以获得第二可视化特征图；
显示所述第二可视化特征图。

3.如权利要求2所述的方法，其特征在于，所述方法还包括：
将所述第六特征图叠加到所述第一可视化特征图以获得第三可视化特征图；
显示所述第三可视化特征图。

4.如权利要求1所述的方法，其特征在于，所述方法还包括：
获取所述卷积神经网络的卷积核；
显示所述卷积核。

5.卷积神经网络表征可视化装置，其特征在于，所述装置包括：
第一获取模块，在待可视化图像输入卷积神经网络后，获取第一特征图，其中，所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据；
反池化模块，反池化所述第一特征图以获得第二特征图；
矫正模块，通过...

【专利技术属性】
技术研发人员：洪万福，王彬，钱智毅，
申请(专利权)人：厦门渊亭信息科技有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人