半导体晶圆缺陷检测模型的训练方法及装置制造方法及图纸

技术编号:34786742 阅读:21 留言:0更新日期:2022-09-03 19:48
本发明专利技术实施例公开了一种半导体晶圆缺陷检测模型的训练方法和装置,其中,所述方法包括:获取训练样本集,所述训练样本集包括一个或多个训练样本,所述训练样本包括半导体晶圆的缺陷图像以及对应的缺陷标注结果,所述半导体晶圆的缺陷图像为包含缺陷的矩形图像;以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练,其中,所述半导体晶圆缺陷检测模型包括网络特征提取模块、特征加强模块和输出预测模块。采用本发明专利技术,可以提高半导体晶圆缺陷检测模型训练的有效性,提高半导体晶圆的缺陷检测的准确度。检测的准确度。检测的准确度。

【技术实现步骤摘要】
半导体晶圆缺陷检测模型的训练方法及装置


[0001]本专利技术涉及工业机器视觉自动检测
,尤其涉及一种半导体晶圆缺陷检测模型的训练方法、装置、计算机设备及计算机可读介质。

技术介绍

[0002]为了提高芯片的良品率,在半导体晶圆的生产过程中可以使用相应设备对半导体晶圆全图进行扫描,并分析扫描图像上异常的图形来定位晶圆上可能造成无法正常工作的缺陷位置。击退的,在芯片制造过程中,会设置多个检测工序以便及时识别晶圆表面的缺陷。其中,对晶圆表面的缺陷的检测可以通过人工或者机器视觉的方式来实现。其中,类似的人工检测方式中检测时间过长,检测效率低下,并且得到的缺陷标注也会由于一些主观性而出现错检和漏检。而基于机器视觉的缺陷检测方法中,存在调试难度大,可能需要在检测的同时反复调参,且对于比较复杂的缺陷图片误检较多,兼容性差的问题;而基于机器学习算法的机器视觉的缺陷检测方案中,需要大量的训练样本对模型进行训练,且当缺陷种类较多时,不同种类样本数量的不均衡也会对训练结果产生极大影响,从而导致对缺陷的检测精度不高。

技术实现思路

[0003]基于此,有必要针对上述问题,提出了一种半导体晶圆缺陷检测模型的训练方法、装置、计算机设备及计算机可读介质。
[0004]在本专利技术的第一部分,提供了一种半导体晶圆缺陷检测模型的训练方法,所述方法包括:获取训练样本集,所述训练样本集包括一个或多个训练样本,所述训练样本包括半导体晶圆的缺陷图像以及对应的缺陷标注结果,所述半导体晶圆的缺陷图像为包含缺陷的矩形图像;以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练,其中,所述半导体晶圆缺陷检测模型包括网络特征提取模块、特征加强模块和输出预测模块。
[0005]可选的,所述方法还包括:获取包含缺陷的半导体晶圆的图像,对图像中包含的缺陷进行标注,获取标注的缺陷对应的图像区域的最小外接矩形作为所述半导体晶圆的缺陷图像。
[0006]可选的,所述半导体晶圆缺陷检测模型还包括数据输入处理模块,其中,所述数据输入处理模块用于对输入所述半导体晶圆缺陷检测模型的缺陷图像进行预处理,所述预处理包括随机缩放、随机剪裁、随机排布和拼接中的一个或多个。
[0007]可选的,所述以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练的步骤,还包括:将所述训练样本的缺陷图像输入所述半导体晶圆缺陷检测模型进行特征提取和缺陷预测,并基于与所述训练样本对应的
缺陷标注结果对所述半导体晶圆缺陷检测模型进行训练,其中,对所述半导体晶圆缺陷检测模型的训练包括对所述半导体晶圆缺陷检测模型的参数进行调整,在达到预设的模型训练终止条件时终止对所述半导体晶圆缺陷检测模型的训练。
[0008]可选的,所述网络特征提取模块包括Focus模块、至少1个深度可分离卷积模块(DWConv)、至少1个CSP1模块、至少1个注意力机制模块、至少1个SPP模块、至少1个CSP2模块;所述特征加强模块包括:CSP2模块与上采样组成的PAN与FPN模块、和自适应特征融合模块;所述输出预测模块包括分支解耦结构(Decoupled head),所述分支解耦结构包括激活函数层和卷积层。
[0009]可选的,所述将所述训练样本的缺陷图像输入所述半导体晶圆缺陷检测模型进行特征提取和缺陷预测的步骤,还包括:将训练样本的缺陷图像输入所述Focus模块进行切片操作;将切片操作之后的结果输入所述CSP1模块和所述深度可分离卷积模块堆叠进行特征提取,其中,所述将切片操作之后的结果输入所述CSP1模块和所述深度可分离卷积模块堆叠进行特征提取的步骤中,通过注意力机制模块对特征提取进行加强;将提取到的特征输入所述SPP模块进行融合处理,以获取所述网络特征提取模块输出的特征;将所述网络特征提取模块输出的特征输入所述PAN与FPN模块进行处理,然后将处理之后的特征输入所述自适应特征融合模块对特征进行自适应融合处理,以获取所述特征加强模块输出的特征;将所述特征加强模块输出的特征输入所述分支解耦结构,通过所述激活函数对所述特征加强模块输出的特征进行激活处理,并通过卷积层进行卷积操作,以得到所述输出预测模块输出的预测结果,其中,所述预测结果包括与所述缺陷图像对应的预测框。
[0010]可选的,所述以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练的步骤,还包括:根据预设的CIOU损失函数,计算预测框与标注框之间的损失值,其中,所述预测框为根据所述半导体晶圆缺陷检测模块获取的缺陷图像中的预测的图像区域,所述标注框为所述缺陷图像中包含的缺陷对应的图像区域的最小外接矩形;根据计算得到的损失值对所述半导体晶圆缺陷检测模型的模型参数进行调整。
[0011]可选的,所述方法还包括:获取验证样本集,所述验证样本集包括一个或多个验证样本,所述验证样本包括半导体晶圆的缺陷图像以及对应的缺陷标注结果,所述半导体晶圆的缺陷图像为包含缺陷的矩形图像;通过所述验证样本集对所述半导体晶圆缺陷检测模型进行测试,获取模型测试结果,在所述模型测试结果满足预设条件的情况下,判定完成对所述半导体晶圆缺陷检测模型的训练;其中,所述预设条件包括精确率满足预设的精确率阈值、召回率满足预设的召回率阈值、平均精度满足预设的第一精度阈值和所有缺陷分类的平均精度满足预设的第二精度阈值中的一个或多个组合。
[0012]可选的,所述方法还包括:获取待检测半导体晶圆的待检测图像;将所述待检测图像输入所述半导体晶圆缺陷检测模型以进行特征提取和缺陷检测,获取所述半导体晶圆缺陷检测模型的输出结果,根据所述输出结果确定待检测图像对应的缺陷检测结果。
[0013]在本专利技术的第二部分,提供了一种半导体晶圆缺陷检测模型的训练装置,所述装置包括:训练样本获取单元,用于获取训练样本集,所述训练样本集包括一个或多个训练样本,所述训练样本包括半导体晶圆的缺陷图像以及对应的缺陷标注结果,所述半导体晶
圆的缺陷图像为包含缺陷的矩形图像;模型训练单元,用于以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练,其中,所述半导体晶圆缺陷检测模型包括网络特征提取模块、特征加强模块和输出预测模块。
[0014]可选的,所述装置还包括:检测图像获取单元,用于获取待检测半导体晶圆的待检测图像;缺陷检测单元,用于将所述待检测图像输入所述半导体晶圆缺陷检测模型以进行特征提取和缺陷检测,获取所述半导体晶圆缺陷检测模型的输出结果,根据所述输出结果确定待检测图像对应的缺陷检测结果。
[0015]在本专利技术的第三部分,提供了一种计算机设备,所述计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序执行如上述第一方面所述的半导体晶圆缺陷检测模型的训练方法的步骤。
[0016]在本专利技术的第四部分,提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种半导体晶圆缺陷检测模型的训练方法,其特征在于,所述方法包括:获取训练样本集,所述训练样本集包括一个或多个训练样本,所述训练样本包括半导体晶圆的缺陷图像以及对应的缺陷标注结果,所述半导体晶圆的缺陷图像为包含缺陷的矩形图像;以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练,其中,所述半导体晶圆缺陷检测模型包括网络特征提取模块、特征加强模块和输出预测模块。2.根据权利要求1所述的半导体晶圆缺陷检测模型的训练方法,其特征在于,所述方法还包括:获取包含缺陷的半导体晶圆的图像,对图像中包含的缺陷进行标注,获取标注的缺陷对应的图像区域的最小外接矩形作为所述半导体晶圆的缺陷图像。3.根据权利要求1所述的半导体晶圆缺陷检测模型的训练方法,其特征在于,所述半导体晶圆缺陷检测模型还包括数据输入处理模块,其中,所述数据输入处理模块用于对输入所述半导体晶圆缺陷检测模型的缺陷图像进行预处理,所述预处理包括随机缩放、随机剪裁、随机排布和拼接中的一个或多个。4.根据权利要求1所述的半导体晶圆缺陷检测模型的训练方法,其特征在于,所述以所述训练样本的缺陷图像为输入,对应的缺陷标注结果为输出,对预设的半导体晶圆缺陷检测模型进行训练的步骤,还包括:将所述训练样本的缺陷图像输入所述半导体晶圆缺陷检测模型进行特征提取和缺陷预测,并基于与所述训练样本对应的缺陷标注结果对所述半导体晶圆缺陷检测模型进行训练,其中,对所述半导体晶圆缺陷检测模型的训练包括对所述半导体晶圆缺陷检测模型的参数进行调整,在达到预设的模型训练终止条件时终止对所述半导体晶圆缺陷检测模型的训练。5.根据权利要求4所述的半导体晶圆缺陷检测模型的训练方法,其特征在于,所述网络特征提取模块包括Focus模块、至少1个深度可分离卷积模块(DWConv)、至少1个CSP1模块、至少1个注意力机制模块、至少1个SPP模块、至少1个CSP2模块;所述特征加强模块包括:CSP2模块与上采样组成的PAN与FPN模块、和自适应特征融合模块;所述输出预测模块包括分支解耦结构(Decoupled head),所述分支解耦结构包括激活函数层和卷积层。6.根据权利要求5所述的半导体晶圆缺陷检测模型的训练方法,其特征在于,所述将所述训练样本的缺陷图像输入所述半导体晶圆缺陷检测模型进行特征提取和缺陷预测的步骤,还包括:将训练样本的缺陷图像输入所述Focus模块进行切片操作;将切片操作之后的结果输入所述CSP1模块和所述深度可分离卷积模块堆叠进行特征提取,其中,所述将切片操作之后的结果输入所述CSP1模块和所述深度可分离卷积模块堆叠进行特征提取的步骤中,通过注意力机制模块对特征提取进行加强;将提取到的特征输入所述SPP模块进行融合处理,以获取所述网络特征提取模块输出的特征;
将所述网络特征提取模块输出的特征...

【专利技术属性】
技术研发人员:乔乔
申请(专利权)人:深圳新视智科技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1