【技术实现步骤摘要】
基于信息熵卷积神经网络的芯片表面缺陷识别方法
[0001]本专利技术涉及图像处理技术,具体涉及一种基于信息熵卷积神经网络的芯片表面缺陷识别方法。
技术介绍
[0002]芯片表面缺陷识别对于控制其产能和其产品质量至关重要。利用卷积神经网络对芯片表面光学图像进行处理替代传统生产工艺中的芯片性能测试可以提高芯片表面缺陷识别的效率。
[0003]然而卷积神经网络的性能严重依赖样本质量。受工业成本和工艺精度的影响,芯片表面光学图像分辨率低,缺陷特征不明显,可供模型学习的特征信息少;难以采集大量的缺陷样本,无缺陷样本数目远多于缺陷样本数目,误导模型学习方向。目前的卷积神经网络模型尚没有针对性解决芯片样本特征带来的影响。因此,研究设计一个新的卷积神经网络模型成为了本领域亟待解决的问题。
技术实现思路
[0004]为了解决现有技术的不足,本专利技术提供了一种基于信息熵卷积神经网络的芯片表面缺陷识别方法,具有识别精度高、速度快的优点,鲁棒性好,可用于芯片生产过程中识别表面具有缺陷的不合格芯片。
[0005]为了实现上述目的,本专利技术提出了一种基于信息熵卷积神经网络的芯片表面缺陷识别方法,其包括以下步骤:
[0006](1)构建数据集:利用芯片生产工艺获得芯片所属的预设类别,利用可见光成像设备拍照采集芯片样本晶圆表面的光学图像,以构建数据集,划分训练集和测试集:
[0007](2)构建卷积神经网络初始模型并训练:构建包括输入层、卷积层、下采样、激活层、全连接层和输出层的卷积神经网络初始模 ...
【技术保护点】
【技术特征摘要】
1.一种基于信息熵卷积神经网络的芯片表面缺陷识别方法,其特征在于,该方法包括以下:(1)构建数据集:利用芯片生产工艺获得芯片所属的预设类别,利用可见光成像设备拍照采集芯片样本晶圆表面的光学图像,以构建数据集,划分训练集和测试集:(2)构建卷积神经网络初始模型并训练:构建包括输入层、卷积层、下采样、激活层、全连接层和输出层的卷积神经网络初始模型,所述输入层、卷积层、下采样、激活层、全连接层和输出层依次设置,所述卷积层、下采样层和激活层均为多个,并且交替设置,将步骤(1)中构建的所属数据集的训练集的图像输入卷积神经网络初始模型中,以交叉熵损失函数作为优化目标进行训练,以获得卷积神经网络中间模型;(3)构建信息熵卷积神经网络初始模型:在步骤(2)获得的卷积神经网络中间模型的基础上,增加以信息熵为指导的特征融合模块,以信息熵为指导的特征融合模块包括确定引入的边缘信息和纹理信息,使用特征熵一致性选择待融合的特征和使用全局注意力机制进行特征融合,特征熵一致性是特征图信息熵的方差,构建信息熵卷积神经网络的初始模型;(4)训练信息熵卷积神经网络初始模型:将步骤(1)中构建的所属数据集中的训练集的图像输入步骤(3)构建的信息熵卷积神经网络初始模型中,以梯度加权的交叉熵损失函数为优化目标进行训练,以获得信息熵卷积神经网络最终模型;(5)芯片表面缺陷识别:将步骤(1)中构建的所属数据集中的测试集的图像输入步骤(4)获得的信息熵卷积神经网络最终模型中,经过卷积层、下采样层、激活层、特征融合模块和全连接层完成图像的特征提取,由输出层输出识别结果,以此方式完成芯片表面缺陷识别。2.如权利要求1所述的基于信息熵卷积神经网络的芯片表面缺陷识别方法,其特征在于:步骤(1)中所述预设类别包括如下两类:正常芯片和缺陷芯片。3.如权利要求1所述的基于信息熵卷积神经网络的芯片表面缺陷识别方法,其特征在于:步骤(2)中所述交叉损失函数具体为:对于总共有2个类别的数据集中的每个样本,i是2个类别中的其中一个,i=0表示正常芯片类别,i=1表示缺陷芯片类别,j为该样本真实类别,y为该样本的标签描述,当样本标签的第i个分量y
i
是该样本的真实标签时,其值取1,否则其值取0,即:样本输入模型得到特征描述符z,z
i
是特征描述符z的第i个分量,a是特征描述符z经过softmax函数后的结果,e是自然对数,a的第i个分量a
i
表示模型预测该样本属于i类别的类别置信度:单个样本的交叉熵损失loss
ce
计算为:4.如权利要求1所述的基于信息熵卷积神经网络的芯片表面缺陷识别方法,其特征在于:步骤(2)中所述将步骤(1)中构建的所属数据集中的训练集图像输入卷积神经网络初始
0≤l≤L计算特征集合和中共h
t
+2个的特征图的信息熵和平均信息熵并计算这些特征图之间的特征熵一致性Ec:记录特征组及其对应的特征熵一致性,以获得具有最优(最小)特征熵一致性的特征集合组G<...
【专利技术属性】
技术研发人员:褚洁,王宇翔,张呈恺,温凯林,李天红,孔亮,张靖晨,蔡觉平,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。