System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 电力视觉大模型的参数微调方法、装置、设备及介质制造方法及图纸_技高网

电力视觉大模型的参数微调方法、装置、设备及介质制造方法及图纸

技术编号:44701772 阅读:7 留言:0更新日期:2025-03-21 17:36
本发明专利技术公开了一种电力视觉大模型的参数微调方法、装置、设备及介质。该方法包括:基于通用图像和电力设备巡检图像训练构建电力场景下的预训练视觉大模型;在所述预训练视觉大模型中添加可调融合重参数化和适配器的双分支结构得到业务模型;对所述业务模型进行多轮粗粒度训练和细粒度训练,得到电力场景下的缺陷识别业务模型。本发明专利技术实施例可以提高电力场景下预训练视觉大模型的微调效率和效果。

【技术实现步骤摘要】

本专利技术涉及图像处理和人工智能,尤其涉及一种电力视觉大模型的参数微调方法、装置、设备及介质


技术介绍

1、伴随大模型技术浪潮的到来,大模型在自然语言、计算机视觉等领域均表现出比传统中小模型更强的识别能力。在视觉领域,在预训练视觉大模型基座基础上进行具体业务模型的微调训练已成为广泛认可的形式。预训练视觉大模型通过在海量图像数据上进行训练,获取了强大的图像通用特征表达能力,因此可在预训练大模型基础上进行业务模型二次开发。通常将预训练阶段解决的任务称为“上游任务”,而针对某些特定领域训练业务模型的任务,称为“下游任务”。上、下游任务之间通常存在一定的“隔阂”,即目标不一致。

2、在针对具体的下游任务时,微调训练是利用标注的数据样本对预训练网络模型的参数进行调整。预训练视觉大模型参数通常在1亿参数量以上,若采用全部参数调整训练方式,则会耗费较长训练时间,且全参调整训练方式容易造成模型过拟合,存在灾难性遗忘等问题,因此可靠高效的视觉大模型高效微调方法是十分必要的。

3、在具体的电力设备缺陷识别场景,传统中小模型在识别性能上出行明显瓶颈,而现有的预训练视觉大模型微调方法对于该场景没有适用性,微调效率和效果均不尽人意。


技术实现思路

1、本专利技术提供了一种电力视觉大模型的参数微调方法、装置、设备及介质,以提高电力场景下预训练视觉大模型的微调效率和效果。

2、根据本专利技术的一方面,提供了一种电力视觉大模型的参数微调方法,包括:

3、基于通用图像和电力设备巡检图像训练构建电力场景下的预训练视觉大模型;

4、在所述预训练视觉大模型中添加可调融合重参数化和适配器的双分支结构得到业务模型;

5、对所述业务模型进行多轮粗粒度训练和细粒度训练,得到电力场景下的缺陷识别业务模型。

6、根据本专利技术的另一方面,提供了一种电力视觉大模型的参数微调装置,包括:

7、模型构建模块,用于基于通用图像和电力设备巡检图像训练构建电力场景下的预训练视觉大模型;

8、模型改动模块,用于在所述预训练视觉大模型中添加可调融合重参数化和适配器的双分支结构得到业务模型;

9、模型训练模块,用于对所述业务模型进行多轮粗粒度训练和细粒度训练,得到电力场景下的缺陷识别业务模型。

10、根据本专利技术的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本专利技术任一实施例所述的电力视觉大模型的参数微调方法。

11、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的电力视觉大模型的参数微调方法。

12、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的电力视觉大模型的参数微调方法。

13、本专利技术实施例基于海量通用图像和电力设备巡检图像训练构建预训练视觉大模型,然后在预训练视觉大模基础上,一方面在网络结构参数上提出一种融合重参数化和适配器的双分支结构视觉大模型参数微调方法,冻结固定视觉大模型骨干网络参数,以微调双分支参数模块方式,实现下游任务对接训练;另一方面在具体业务模型训练上,提出一种缺陷图像样本多尺度裁剪变换阶段性训练优化方法,从粗到细级联模式逐渐优化模型性能,实现电力设备缺陷识别模型的高效开发。

14、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种电力视觉大模型的参数微调方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述业务模型进行多轮粗粒度训练和细粒度训练,得到电力场景下的缺陷识别业务模型包括:

3.根据权利要求2所述的方法,其特征在于,所述通过样本图像对所述业务模型先后进行粗粒度训练和细粒度训练包括:

4.根据权利要求3所述的方法,其特征在于,所述裁剪方式包括均分裁剪和中心裁剪。

5.根据权利要求1所述的方法,其特征在于,所述双分支结构中的适配器结构包括:

6.根据权利要求5所述的方法,其特征在于,所述双分支结构中的可调融合重参数化结构包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述缺陷识别业务模型用于定位并识别电力设备巡检图像中的电力设备上的缺陷。

8.一种电力视觉大模型的参数微调装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的电力视觉大模型的参数微调方法。

...

【技术特征摘要】

1.一种电力视觉大模型的参数微调方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述业务模型进行多轮粗粒度训练和细粒度训练,得到电力场景下的缺陷识别业务模型包括:

3.根据权利要求2所述的方法,其特征在于,所述通过样本图像对所述业务模型先后进行粗粒度训练和细粒度训练包括:

4.根据权利要求3所述的方法,其特征在于,所述裁剪方式包括均分裁剪和中心裁剪。

5.根据权利要求1所述的方法,其特征在于,所述双分支结构中的适配器结构包括:

6.根据权利要...

【专利技术属性】
技术研发人员:李振宇王琦刘广秀王振利邱玲任佳颖李岩李建祥孙晓斌王海鹏郭修宵李可心贾昭鑫薛凯文李冲
申请(专利权)人:国网智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1