一种模型通用的深度神经网络表征可视化方法和装置制造方法及图纸

技术编号:24855788 阅读:90 留言:0更新日期:2020-07-10 19:08
为了解决现有技术中卷积神经网络可释性差的问题,本公开提供了一种卷积神经网络表征可视化方法、装置及训练方法,以提高卷积神经网络的可释性。卷积神经网络表征可视化方法,包括:在待可视化图像输入卷积神经网络后,获取第一特征图;反池化所述第一特征图以获得第二特征图;通过ReLU函数矫正所述第二特征图以获取第三特征图;反卷积或导向反向传播第三特征图以获得第一可视化特征图;显示所述第一可视化特征图。本申请还公开了相应的可视化装置,以及基于表征可视化方法的卷积神经网络训练方法。通过反池化、反激活、反卷积和导向反向传播运算,将卷积神经网络模型中待可视化层的特征激活情况进行显示,以提高卷积神经网络的可释性。

【技术实现步骤摘要】
一种模型通用的深度神经网络表征可视化方法和装置
本公开涉及智能领域,尤其涉及一种卷积神经网络表征可视化方法、装置及训练方法。
技术介绍
现有卷积神经网络虽然能够通过构建,标注大数据进行误差反向传播优化参数而训练的“端到端”模型;能够在某些场景下有喜人的表现,但是这些卷积神经网络模型均有一个不可忽略的同样问题:较弱的可解释性。即模型虽然给出了较高的准确率,但是却无法给出更多可靠的信息来解释给出结果的考虑依据。这样的情况造成在特定领域在金融、医疗、自动驾驶等要求高可解释的行业内,尽管卷积神经网络模型的结果数据好看,但是也无法切实地落地到应用中。同时,较差的可解释性意味着使得人们无法信任模型在面对新数据时给出的答案,这就导致模型的预测功能大打折扣,也进一步限制了深度模型在各个行业中的实际应用。
技术实现思路
为了解决上述技术问题中的至少一个,本公开提供了一种卷积神经网络表征可视化方法、装置及训练方法,提高卷积神经网络的可释性。本公开的一方面,一种卷积神经网络表征可视化方法,所述方法包括:在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;反池化所述第一特征图以获得第二特征图;通过ReLU函数矫正所述第二特征图以获取第三特征图;反卷积或导向反向传播所述第三特征图以获得第一可视化特征图;显示所述第一可视化特征图。可选的,所述方法还包括:获取第四特征图,所述第四特征图为卷积神经网络的最后一个卷积层输出的特征数据;全局均值池化所述第四特征图以获得第五特征图;上采样所述第五特征图以获得第六特征图,将第六特征图叠加到待可视化图像以获得第二可视化特征图;显示所述第二可视化特征图。可选的,所述方法还包括:将所述第六特征图叠加到第一可视化特征图以获得第三可视化特征图;显示所述第三可视化特征图。可选的,所述方法还包括:获取所述卷积神经网络的卷积核;显示所述卷积核。本公开的第二方面,一种卷积神经网络表征可视化装置,所述装置包括:第一获取模块,在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;反池化模块,反池化所述第一特征图以获得第二特征图;矫正模块,通过ReLU函数矫正所述第二特征图以获取第三特征图;反卷积模块,反卷积或导向反向传播所述第三特征图以获得第一可视化特征图;第一显示模块,显示所述第一可视化特征图。可选的,所述装置还包括:第二获取模块,获取第四特征图,所述第四特征图为卷积神经网络的最后一个卷积层输出的特征数据;全局均值池化模块,全局均值池化所述第四特征图以获得第五特征图;上采样模块,上采样所述第五特征图以获得第六特征图,将第六特征图叠加到待可视化图像以获得第二可视化特征图;第二显示模块,显示所述第二可视化特征图。可选的,所述装置还包括:叠加模块,将所述第六特征图叠加到第一可视化特征图以获得第三可视化特征图;第三显示模块,显示所述第三可视化特征图。可选的,所述装置还包括:第三获取模块,获取所述卷积神经网络的卷积核;第四显示模块,显示所述卷积核。本公开的第三方面,一种卷积神经网络训练方法,包括:执行本公开的第一方面中任一所述卷积神经网络表征可视化方法的步骤;接收输入的卷积神经网络判断的验证结果;若验证结果为判断正确,则将所述待可视化图像作为训练样本训练所述卷积神经网络。可选的,所述卷积神经网络的输入为医疗图像,所述卷积神经网络的输出为疾病诊断结果。本公开的技术方案,通过反池化、反激活、反卷积或导向反向传播运算,将卷积神经网络模型中待可视化层的特征激活情况进行显示,以提高卷积神经网络的可释性。附图说明附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。图1是本公开的实施例中的一种卷积神经网络表征可视化方法的流程图;图2是本公开的实施例中的一种卷积神经网络表征可视化装置的示意图。具体实施方式下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。实施例1:参见图1,卷积神经网络表征可视化方法,所述方法包括:步骤S1:在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;步骤S2:反池化所述第一特征图以获得第二特征图;步骤S3:通过ReLU函数矫正所述第二特征图以获取第三特征图;步骤S4:反卷积或导向反向传播所述第三特征图以获得第一可视化特征图;步骤S5:显示所述第一可视化特征图。本公开的实施方式,通过反池化、反激活和反卷积/导向反向传播运算,将卷积神经网络模型中待可视化层的特征激活情况进行显示,以提高卷积神经网络的可释性。显示第一可视化特征图后,相关人员可以直观的根据第一可视化特征图,观察卷积神经网络模型的判断依据是否准确。可以知道的,待可视化层可以是卷积神经网络的其中一个网络层。以医疗领域为例,卷积神经网络的输入为医学图片,输出为疾病判断结果;当待可视化图像为医学图片中的心电图,待可视化图像输入卷积神经网络后,可视化图像输入卷积神经网络的输出为95%心肌梗塞时;可以根据本公开的方法,显示卷积神经网络的各第一可视化特征图,以获取卷积神经网络的判断依据,进而医生可以结合自身医学知识与卷积神经网络的判断结果进行比对,快速知晓卷积神经网络判断结果是否准确,辅助医生更为有效地判断病人疾病,提高疾病判断的准确率。上述方法中,步骤S2为反池化运算,因为池化的过程不可逆,因此反池化需要池化的过程中记录下最大值所在的位置参数,便于反池化所述第一特征图。上述方法中,步骤S3是矫正运算,其中,ReLU是一种非线性激活函数,全称为线性整流函数(RectifiedLinearUnit,ReLU),又称修正线性单元。上述方法中,步骤S4是反卷积运算,反卷积过程使用卷积过程中相同的已训练过参数的卷积核的转置作为核函数,与矫正后的特征进行卷积运算。在一个实施方式中,方法还包括:获取第四特征图,所述第四特征图为卷积神经网络的最后一个卷积层输出的特征数据;全局均值池化所述第四特征图以获得第五特征图;上采样所述第五特征图以获得第六特征图,将第六特征图叠加到待可视化图像以获得第二可视化特征图;显示所述第二可视化特征图。...

【技术保护点】
1.卷积神经网络表征可视化方法,其特征在于,所述方法包括:/n在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;/n反池化所述第一特征图以获得第二特征图;/n通过ReLU函数矫正所述第二特征图以获取第三特征图;/n反卷积或导向反向传播所述第三特征图以获得第一可视化特征图;/n显示所述第一可视化特征图。/n

【技术特征摘要】
1.卷积神经网络表征可视化方法,其特征在于,所述方法包括:
在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;
反池化所述第一特征图以获得第二特征图;
通过ReLU函数矫正所述第二特征图以获取第三特征图;
反卷积或导向反向传播所述第三特征图以获得第一可视化特征图;
显示所述第一可视化特征图。


2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取第四特征图,所述第四特征图为卷积神经网络的最后一个卷积层输出的特征数据;
全局均值池化所述第四特征图以获得第五特征图;
上采样所述第五特征图以获得第六特征图,将所述第六特征图叠加到所述待可视化图像以获得第二可视化特征图;
显示所述第二可视化特征图。


3.如权利要求2所述的方法,其特征在于,所述方法还包括:
将所述第六特征图叠加到所述第一可视化特征图以获得第三可视化特征图;
显示所述第三可视化特征图。


4.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述卷积神经网络的卷积核;
显示所述卷积核。


5.卷积神经网络表征可视化装置,其特征在于,所述装置包括:
第一获取模块,在待可视化图像输入卷积神经网络后,获取第一特征图,其中,所述第一特征图为所述卷积神经网络的待可视化层所产生的特征数据;
反池化模块,反池化所述第一特征图以获得第二特征图;
矫正模块,通过...

【专利技术属性】
技术研发人员:洪万福王彬钱智毅
申请(专利权)人:厦门渊亭信息科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1