用于识别碳化硅位错的模型训练方法、识别方法及装置制造方法及图纸

技术编号:35841329 阅读:21 留言:0更新日期:2022-12-03 14:13
本发明专利技术涉及碳化硅技术领域,公开了一种用于识别碳化硅位错的模型训练方法、识别方法及装置,通过获取背景干净且不同位错无重叠的第一碳化硅位错图片样本进行标注,再通过神经网络模型进行训练得到第1代检测模型;获取背景干净且存在位错重叠交错的多张第二碳化硅位错图片样本,通过第1代检测模型进行检测后进行标注,再通过神经网络模型对标注后的多张第一碳化硅位错图片样本和第二碳化硅位错图片样本进行训练,得到第2代检测模型;获取背景不干净的多张第三碳化硅位错图片样本,根据上述步骤得到第3代检测模型。采用本发明专利技术在保证识别准确率的条件下,大大节省了时间和人工成本,并节约了30%以上的晶片加工成本,进而降低了检测成本。了检测成本。了检测成本。

【技术实现步骤摘要】
用于识别碳化硅位错的模型训练方法、识别方法及装置


[0001]本专利技术涉及碳化硅
,具体为一种用于识别碳化硅位错的模型训练方法、识别方法及装置。

技术介绍

[0002]碳化硅作为第三代化合物半导体材料,以其宽禁带、高击穿电场强度、高热导率、高电子迁移率等优异的物理性能,广泛应用于航空、军事、新能源汽车领域;碳化硅采用PVT法进行长晶工艺,在生长过程中极易引入缺陷;位错的类型及其位错的密度,决定了衬底片的质量;而高缺陷密度对后续器件性能会有致命的影响。
[0003]一般而言,为了监控长晶工艺,每台长晶炉,每隔一定炉次,会定期将碳化硅锭的头、中、尾三片切下,经过一系列工艺去除表面划痕损伤后,在熔融碱中腐蚀一定时间后清洗,再置于显微镜下,统计缺陷密度、单位面积的缺陷个数,而当前的检测方式有人工检测和基于机器学习的图形识别软件。其中,人工检测速度慢,仅仅适用于小批量图片以及图片中的少量、稀疏缺陷;但是一般晶片上的缺陷一张至少有200

1000个点的缺陷,采用基于机器学习的图形识别软件,需要训练得到准确的模型,一般需要的图片至少1000张以上,人工标注的话一张图片就需要花费一天时间,完成则需要耗费大量的时间、人力;而且,如果完全取决于人工标注,图片标注的质量会影响模型的训练结果;而且,对不同缺陷类型的分类,对重叠缺陷类型的标注,很大程度上基于个人的专业经验;若将图片标注外包,不仅会增加标注成本,而且会造成一定程度的泄密。且传统机器学习方法的模型训练时间长,需要大量的硬件资源,若部署后检测1024x1024像素的图片,就需要输入1024x1024像素对应尺寸的图片进行训练,训练图片的尺寸越大,需要更多的硬件资源、更长的训练时间。
[0004]而且,根据现有技术形成的模型抗背景、抗划痕能力差,极其容易造成误判,无法识别、错误识别;比如不容易识别小尺寸缺陷、抗划痕能力差,把划痕识别成BPD缺陷,造成BPD计数偏大,而且高纯半绝缘片与导电片腐蚀后的背景差异明暗度不同,不同的腐蚀工艺,造成缺陷的尺寸的大小不同、不同加工工艺如抛光片、精抛片引入的划痕深浅不同;精抛片的检测成本高,采用传统训练方法,为了尽可能提高识别准确率,需要使用精抛片腐蚀出背景干净、无划痕的位错图片,而精抛片需要采用CMP工艺,CMP工艺成本占整个晶片加工工艺成本的三分之一;晶片加工工序:切割
‑‑‑
减薄
‑‑‑
研磨
‑‑‑
精磨
‑‑‑
CMP(~33%的成本);单张图片检测时间偏长,对于大尺寸高像素图片,每张图片识别时间大于0.5秒,测试完一片晶片,至少也需要2小时;而且,如果引入新工艺,新工艺图片与之前的训练图片存在较大差异,则模型对新工艺图片的识别率变差,那么需要挑选出识别率低的图片,重新进行图片标注,将新标注的图片和之前标注的图片一起输入到神经模型,重新训练,一个训练的完整流程下来,至少需要24小时,甚至多个工作日。

技术实现思路

[0005]本专利技术的目的在于克服现有用于识别碳化硅位错的神经网络模型训练过程繁琐、
时间长且检测效果不好的问题,提供了一种用于识别碳化硅位错的模型训练方法、识别方法及装置。
[0006]为了实现上述目的,本专利技术提供一种用于识别碳化硅位错的神经网络模型训练方法,包括以下步骤:获取多张第一碳化硅位错图片样本,其中,所述第一碳化硅位错图片样本中的背景干净且不同位错无重叠;对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本进行训练,得到第1代检测模型;获取多张第二碳化硅位错图片样本,其中,所述第二碳化硅位错图片样本中的背景干净且存在位错重叠交错;通过所述第1代检测模型对每张第二碳化硅位错图片样本中的位错进行检测,根据检测结果对位错进行标注,得到标注后的多张第二碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本和标注后的多张第二碳化硅位错图片样本进行训练,得到第2代检测模型;获取多张第三碳化硅位错图片样本,其中,所述第三碳化硅位错图片样本中的背景不干净;通过所述第2代检测模型对每张第三碳化硅位错图片样本中的位错进行检测,根据检测结果对位错进行标注,得到标注后的多张第三碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本、标注后的多张第二碳化硅位错图片样本、标注后的多张第三碳化硅位错图片样本进行训练,得到第3代检测模型。
[0007]作为一种可实施方式,在得到第3代检测模型之后,还包括:获取多张第四碳化硅位错图片样本,其中,所述第四碳化硅位错图片样品具有进一步导致位错识别错误的影响因素;根据前述步骤,继续进一步训练得到第4代检测模型。
[0008]作为一种可实施方式,分别获取多张第一碳化硅位错图片样本、多张第二碳化硅位错图片样本、多张第三碳化硅位错图片样本的步骤具体包括:获取多张碳化硅位错图片,对每张碳化硅位错图片进行切割,得到多张碳化硅位错图片样本;从多张碳化硅位错图片样本中分别选取多张第一碳化硅位错图片样本、多张第二碳化硅位错图片样本、多张第三碳化硅位错图片样本。
[0009]作为一种可实施方式,每张第一碳化硅位错图片样本、每张第二碳化硅位错图片样本、每张第三碳化硅位错图片样本中的位错数量都不超过10个;第一碳化硅位错图片样本、第二碳化硅位错图片样本、第三碳化硅位错图片样本的具体数量都为200

500张。
[0010]作为一种可实施方式,对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本的步骤具体包括:基于标注软件对多张第一碳化硅位错图片样本中的不同位错进行人工标注,得到标注后的多张第一碳化硅位错图片样本。
[0011]作为一种可实施方式,对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本的步骤具体包括:基于标注软件对多张第一碳化硅位错图片样本中的不同位错进行人工标注,再通过神经网络模型对人工标注后的第一碳化硅位错图片样本进行训练,得到第0代模型;使用所述第0代模型对多张第一碳化硅位错图片样本逐张进行检测,得到每张第一碳化硅位错图片样本中的位错类型和坐标位置;根据检测出来的多张第一碳化硅位错图片样本中的位
错类型和坐标位置,通过标注软件对多张第一碳化硅位错图片样本中的不同位错进行自动标注并通过人工标注进行辅助调整,得到标注后的多张第一碳化硅位错图片样本。
[0012]作为一种可实施方式,通过所述第1代检测模型对每张第二碳化硅位错图片样本中的位错进行检测,根据检测结果对位错进行标注,得到标注后的多张第二碳化硅位错图片样本的步骤具体包括:使用所述第1代模型对多张第二碳化硅位错图片样本进行检测,得到每张第二碳化硅位错图片样本中的位错类型和坐标位置;根据检测出来的多张第二碳化硅位错图片样本中不同位错的位错类型和坐标位置,通过标注软件对多张第二碳化硅位错图片样本中的不同位错进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于识别碳化硅位错的神经网络模型训练方法,其特征在于,包括以下步骤:获取多张第一碳化硅位错图片样本,其中,所述第一碳化硅位错图片样本中的背景干净且不同位错无重叠;对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本进行训练,得到第1代检测模型;获取多张第二碳化硅位错图片样本,其中,所述第二碳化硅位错图片样本中的背景干净且存在位错重叠交错;通过所述第1代检测模型对每张第二碳化硅位错图片样本中的位错进行检测,根据检测结果对位错进行标注,得到标注后的多张第二碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本和标注后的多张第二碳化硅位错图片样本进行训练,得到第2代检测模型;获取多张第三碳化硅位错图片样本,其中,所述第三碳化硅位错图片样本中的背景不干净;通过所述第2代检测模型对每张第三碳化硅位错图片样本中的位错进行检测,根据检测结果对位错进行标注,得到标注后的多张第三碳化硅位错图片样本;通过神经网络模型对标注后的多张第一碳化硅位错图片样本、标注后的多张第二碳化硅位错图片样本、标注后的多张第三碳化硅位错图片样本进行训练,得到第3代检测模型。2.根据权利要求1所述的用于识别碳化硅位错的神经网络模型训练方法,其特征在于,在得到第3代检测模型之后,还包括:获取多张第四碳化硅位错图片样本,其中,所述第四碳化硅位错图片样品具有进一步导致位错识别错误的影响因素;根据前述步骤,继续进一步训练得到第4代检测模型。3.根据权利要求1所述的用于识别碳化硅位错的神经网络模型训练方法,其特征在于,分别获取多张第一碳化硅位错图片样本、多张第二碳化硅位错图片样本、多张第三碳化硅位错图片样本的步骤具体包括:获取多张碳化硅位错图片,对每张碳化硅位错图片进行切割,得到多张碳化硅位错图片样本;从多张碳化硅位错图片样本中分别选取多张第一碳化硅位错图片样本、多张第二碳化硅位错图片样本、多张第三碳化硅位错图片样本。4.根据权利要求1所述的用于识别碳化硅位错的神经网络模型训练方法,其特征在于,每张第一碳化硅位错图片样本、每张第二碳化硅位错图片样本、每张第三碳化硅位错图片样本中的位错数量都不超过10个;第一碳化硅位错图片样本、第二碳化硅位错图片样本、第三碳化硅位错图片样本的数量范围都为200

500张。5.根据权利要求1所述的用于识别碳化硅位错的神经网络模型训练方法,其特征在于,对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本的步骤具体包括:基于标注软件对多张第一碳化硅位错图片样本中的不同位错进行人工标注,得到标注后的多张第一碳化硅位错图片样本。6.根据权利要求1所述的用于识别碳化硅位错的神经网络模型训练方法,其特征在于,对每张第一碳化硅位错图片样本中的位错进行标注,得到标注后的多张第一碳化硅位错图片样本的步骤具体包括:基于标注软件对多张第一碳化硅位错图片样本中的不同位错进行...

【专利技术属性】
技术研发人员:钟红生皮孝东杨德仁王蓉李佳君
申请(专利权)人:浙江大学杭州国际科创中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1