System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 超算模型训练及部署方法技术_技高网

超算模型训练及部署方法技术

技术编号:42492676 阅读:11 留言:0更新日期:2024-08-21 13:10
本申请公开超算模型训练及部署方法,涉及模型训练领域;该方法基于AI上推指令获取目标产线机台上传的缺陷样本,缺陷样本包括产线机台从物料板上拍摄截取的缺陷图像和缺陷类型;根据模型训练指标对缺陷样本进行数据标注,加入到缺陷图像训练集中;基于新增的缺陷图像训练集执行模型训练,根据下推指令将训练后的AI模型部署到目标产线机台上;基于部署AI模型的AVS系统对待确认缺陷图像进行检测验证,获得真缺陷图像和假缺陷图像,并将复判筛选出目标缺陷图像加入缺陷图像训练集,用于模型迭代更新训练。该方案实现跨节点的数据缺陷共享和模型训练,提高模型训练和部署效率,通过引入真假缺陷图的复判校正机制,以提高模型精度和泛化能力。

【技术实现步骤摘要】

本申请实施例涉及模型训练领域,特别涉及一种超算模型训练及部署系统。


技术介绍

1、近年来,ai模型的学习能力为自动光学检测(aoi)和自动视觉检测(avi)设备提供了关键支持,显著提升了生产效率和产品质量。通过学习大量图像数据,ai模型在设备中实现了高度智能的缺陷检测和分类,能够迅速而准确地识别产品表面的各种问题。其中,ai模型的训练是实现高性能、智能系统的关键步骤之一。

2、相关技术中,对于半导体晶圆物料的检测通常利用ai模型等缺陷检测技术来识别缺陷晶圆,这就需要将ai模型部署在每条产线的每个检测机台上。对产线的机台设备的迭代更新通常需要在本地部署,根据需求设计模型结构、采集图像和模型训练等操作,然后再将训练好的ai模型部署到产线机台上。这种单独设置模型训练系统的方案对于大型厂区和异地分厂的企业会造成严重的资源浪费和成本投入,且不同产线机台或对不同型号晶圆物料进行检测手段存在差异,模型的通用性和可移植性较差,单个模型的缺陷检测精度和检测能力不够理想,驻场设计更新和部署还可能会导致数据泄露的风险。


技术实现思路

1、本申请实施例提供一种超算模型训练及部署方法,解决更新迭代及部署ai检测模型成本高昂和模型缺陷检测精度不理想的问题。所述方法用于超算模型训练及部署系统,系统内包含有模型训练中心节点和若干终端边缘节点,每个边缘终端节点包含若干产线机台,所述方法包括:

2、基于ai上推指令获取目标产线机台对晶圆物料板在缺陷检测过程上传的缺陷样本,所述缺陷样本包括产线机台从物料板上拍摄截取的缺陷图像和缺陷类型;

3、根据模型训练指标对上传的所述缺陷样本进行数据标注,加入到缺陷图像训练集中;

4、基于新增的缺陷图像训练集执行ai模型训练,根据下推指令将训练后的ai模型部署到目标产线机台上;

5、基于部署ai模型的智能视觉avs系统对待确认缺陷图像进行检测验证,获得真缺陷图像和假缺陷图像,并将复判筛选出目标缺陷图像加入缺陷图像训练集,用于模型迭代更新训练;所述待确认缺陷图像为其他检测模型从物料板上检测识别的图像。

6、具体的,每个终端边缘节点存储有各个产线机台识别的缺陷样本,所述缺陷样本根据机台部署ai模型的类型分类;当所述模型训练中心节点接收到上推指令时,从对应的终端边缘节点获取目标缺陷样本。

7、具体的,所述根据模型训练指标对上传的所述缺陷样本进行数据标注,加入到缺陷图像训练集中,包括:

8、确定ai模型的版本信息和模型训练参数;所述模型训练参数至少包括模型召回率、精度、学习率、梯度参数中的一种或多种;

9、根据模型训练参数筛选确定训练的缺陷类型和对应的缺陷图像数量,并对所述缺陷样本进行筛选过滤;

10、新增标定数据集,并导入过滤后的缺陷样本;

11、根据模型训练的缺陷类型对标定数据集中的缺陷图像设置标签组;

12、将所有缺陷图像进行缺陷标注,获得缺陷图像训练集。

13、具体的,数据标注类型包括人工标注和自动标注;

14、当数据标注为自动标注时,将缺陷图像通过ae数据增强操作增强图像画质;识别缺陷图像的缺陷类型,并根据识别的缺陷类型自动设置标签组,对所有的缺陷图像进行标注;

15、当数据标注人工标注时,在预设的标签库中确定与缺陷类型对应的标签组,和/或根据模型训练指标新建标签组,对所有的缺陷图像进行标注。

16、具体的,所述基于新增的缺陷图像训练集执行ai模型训练,包括:

17、在所述标定数据集中设置映射标签,基于所述映射标签筛选标签组及对应类型的缺陷图像,构成所述缺陷图像训练集;

18、通过缺陷图像训练集对初始模型进行迭代训练,根据模型版本信息输出目标ai模型。

19、具体的,在完成迭代训练后,基于图像验证集和模型训练参数对所述目标ai模型进行回归测试;当对所述目标ai模型的回归测试通过时,将所述目标ai模型进行下推部署;当对所述目标ai模型的回归测试不通过时,将错检的缺陷图像存储至标定数据集重新进行图像标注,在训练时重新设置映射标签。

20、具体的,当目标产线机台上传的所述缺陷样本中不含目标缺陷类型或目标缺陷类型的缺陷图像数量小于设定值时,获取若干正常图像;基于目标缺陷类型对正常图像进行加噪处理,生成目标数量的目标缺陷图,并将所述目标缺陷图导入新增标定数据集;和/或,从其他边缘终端节点的产线机台获取包含目标缺陷类型及目标数量的缺陷图像。

21、具体的,当avs系统执行真点复检模式时,对avs系统识别的所有真缺陷图像进行复判;

22、当复判结果指示待确认图确定为带有缺点的缺陷图像时,直接跳过;

23、当结果指示复判结果为正常图像时,指示部署目标ai模型的avs系统过杀识别,对错检的图像进行标记后,送入所述缺陷图像训练集。

24、具体的,当avs系统执行假点复检模式时,对avs系统识别的所有假缺陷图像进行复判;

25、当复判结果指示待确认图确定为无缺点的正常图像时,直接跳过;

26、当结果指示复判结果为带有缺点的缺陷图像时,指示部署目标ai模型的avs系统漏检缺陷,对错检的图像进行标记后,送入所述缺陷图像训练集。

27、具体的,在对训练后的所述目标ai模型进行下推部署时,获取所有终端边缘节点中部署相同检测功能的测试机台,将所述目标ai模型下推部署。

28、本申请实施例提供的技术方案带来的有益效果至少包括:本申请提供的超算模型训练及部署系统,实现训练中心节点对所有终端边缘节点的统一调度;每个边缘节点的产线机台根据更新需求上传缺陷样本;而模型训练中心节点则可以根据ai上推指令提取缺陷样本,特别是对于系统内不同产线缺陷图像的调用,可以对模型更新所需缺陷类型图片优势互补和迭代更新;在更新和测试完成后同一下推部署,实现跨产线,跨节点的数据缺陷共享和模型训练,提高模型训练和部署效率。为了降低模型过杀和漏检的概率,还特地引入友商缺陷检测模型识别的待确认缺陷图像进行交叉验证,对于过杀和漏检的图像进行标记后加入缺陷图像训练集中,为后续模型过杀和漏检进行纠正,以及对模型进行性能优化。

本文档来自技高网...

【技术保护点】

1.一种超算模型训练及部署方法,其特征在于,所述方法用于超算模型训练及部署系统,系统内包含有模型训练中心节点和若干终端边缘节点,每个边缘终端节点包含若干产线机台,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,每个终端边缘节点存储有各个产线机台识别的缺陷样本,所述缺陷样本根据机台部署AI模型的类型分类;当所述模型训练中心节点接收到上推指令时,从对应的终端边缘节点获取目标缺陷样本。

3.根据权利要求2所述的方法,其特征在于,所述根据模型训练指标对上传的所述缺陷样本进行数据标注,加入到缺陷图像训练集中,包括:

4.根据权利要求3所述的方法,其特征在于,数据标注类型包括人工标注和自动标注;

5.根据权利要求3所述的方法,其特征在于,所述基于新增的缺陷图像训练集执行AI模型训练,包括:

6.根据权利要求5所述的方法,其特征在于,在完成迭代训练后,基于图像验证集和模型训练参数对所述目标AI模型进行回归测试;当对所述目标AI模型的回归测试通过时,将所述目标AI模型进行下推部署;当对所述目标AI模型的回归测试不通过时,将错检的缺陷图像存储至标定数据集重新进行图像标注,在训练时重新设置映射标签。

7.根据权利要求1-6任一所述的方法,其特征在于,当目标产线机台上传的所述缺陷样本中不含目标缺陷类型或目标缺陷类型的缺陷图像数量小于设定值时,获取若干正常图像;基于目标缺陷类型对正常图像进行加噪处理,生成目标数量的目标缺陷图,并将所述目标缺陷图导入新增标定数据集;和/或,从其他边缘终端节点的产线机台获取包含目标缺陷类型及目标数量的缺陷图像。

8.根据权利要求1-6任一所述的方法,其特征在于,当AVS系统执行真点复检模式时,对AVS系统识别的所有真缺陷图像进行复判;

9.根据权利要求8所述的方法,其特征在于,当AVS系统执行假点复检模式时,对AVS系统识别的所有假缺陷图像进行复判;

10.根据权利要求6所述的方法,其特征在于,在对训练后的所述目标AI模型进行下推部署时,获取所有终端边缘节点中部署相同检测功能的测试机台,将所述目标AI模型下推部署。

...

【技术特征摘要】

1.一种超算模型训练及部署方法,其特征在于,所述方法用于超算模型训练及部署系统,系统内包含有模型训练中心节点和若干终端边缘节点,每个边缘终端节点包含若干产线机台,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,每个终端边缘节点存储有各个产线机台识别的缺陷样本,所述缺陷样本根据机台部署ai模型的类型分类;当所述模型训练中心节点接收到上推指令时,从对应的终端边缘节点获取目标缺陷样本。

3.根据权利要求2所述的方法,其特征在于,所述根据模型训练指标对上传的所述缺陷样本进行数据标注,加入到缺陷图像训练集中,包括:

4.根据权利要求3所述的方法,其特征在于,数据标注类型包括人工标注和自动标注;

5.根据权利要求3所述的方法,其特征在于,所述基于新增的缺陷图像训练集执行ai模型训练,包括:

6.根据权利要求5所述的方法,其特征在于,在完成迭代训练后,基于图像验证集和模型训练参数对所述目标ai模型进行回归测试;当对所述目标ai模型的回归测试通过时,将所述目标ai模型...

【专利技术属性】
技术研发人员:侯晓峰朱磊陈子健张弛
申请(专利权)人:上海感图网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1