一种自适应图像分块方法、系统、设备及介质技术方案

技术编号：42999737 阅读：30 留言：0更新日期：2024-10-15 13:27

本发明专利技术涉及计算机视觉和机器学习技术领域，公开一种自适应图像分块方法、系统、设备及介质，包括：根据训练图像，通过改进型CLIPSelf模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块；通过改进型CLIPSelf模型的筛选模块，利用预设筛选规则，从多个原始图像分块中筛选得到多个符合预设置信度范围的图像分块并将它们替代多个原始图像分块，并训练得到改进型CLIPSelf模型。训练得到的改进型CLIPSelf模型拥有良好的图像全局理解能力和图像局部理解能力，在训练中获得更好的自蒸馏效果，可以更快地收敛，以在目标检测、实例分割、图像检索等子任务推理时获得更好的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉和机器学习，尤其涉及一种自适应图像分块方法、系统、设备及介质。

技术介绍

1、在现代轨道交通系统中，安全性和可靠性至关重要。随着计算机视觉技术在轨道交通领域的应用，可实现铁路防灾检测和预警。防灾报警系统通常需要将视频画面中铁路周界及其附近出现的入侵异物比如石头、人员、泥石流等进行有效检测并报警。虽然人工智能大模型的开放目标检测已经可以识别对绝大部分物体，比如对人的识别已经非常精确，但是对于诸如铁路周界及附近的石头，尤其是远处的小石头却很难识别到。

2、clip（contrastive language-image pre-training）模型是一种深度学习模型，旨在通过对比学习方法实现图像和文本之间的联合预训练，使得模型能够在没有额外训练的情况下，理解图像内容并将其与文本描述相匹配。clip模型的核心是视觉编码器和文本编码器，将图像和文本映射到同一向量空间中，使得来自相同概念的图像和文本在该空间中距离接近。clipself模型是clip模型的扩展版，其针对clip vit（基于transformer的视觉编码器）在开放词汇密集预测任务（如目标检测和图像分割）中从全局图像表示转向局部区域表示时遭遇的领域转移问题进行了优化，但其图像局部区域表现出的识别能力仍不尽如人意。

3、为了有效甄别出诸如铁路周界及其附近出现的各种物体，比如不同远近和尺寸的石头、人体等，本专利技术提出一种对clipself模型进一步改进的方法，即自适应图像分块方法，以在保持很好的图像全局理解能力下，进一步增强图像的局部理解能力。

技术实现思路

1、本专利技术提供一种自适应图像分块方法、系统、设备及介质，用以解决现有的clipself模型难以精准识别诸如铁路周界及其附近出现的各种物体的缺陷。

2、本专利技术提供一种自适应图像分块方法，包括：

3、获取训练图像，其中，训练图像的长宽分别为，且训练图像中含有待识别目标；

4、根据训练图像，通过改进型clipself模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块；

5、根据多个原始图像分块，通过改进型clipself模型的筛选模块，利用预设筛选规则，从多个原始图像分块中筛选得到多个符合预设置信度范围的图像分块；

6、将多个符合预设置信度范围的图像分块替代多个原始图像分块，并训练得到改进型clipself模型。

7、在一种实施方案中，所述根据训练图像，通过改进型clipself模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块，包括：

8、根据训练图像，通过改进型clipself模型的切分模块，将训练图像切分为行列，得到个原始图像分块，其中，；

9、根据个原始图像分块，通过改进型clipself模型的切分模块，利用预设分块规则，得到改进型clipself模型实现图像全局理解的个原始图像分块和改进型clipself模型实现图像局部理解的原始图像分块。

10、在一种实施方案中，所述预设分块规则包括：

11、当被设置成，即期望改进型clipself模型实现图像全局理解时，根据个原始图像分块，通过改进型clipself模型的切分模块，得到个原始图像分块，其中，；

12、当被设置成或，即期望改进型clipself模型实现图像局部理解时，得到个原始图像分块，其中，；

13、当被设置成，即期望改进型clipself模型实现图像局部理解时，以训练图像中的非边缘交点为中心，得到个长宽分别为的新的原始图像分块，将个原始图像分块和个新的原始图像分块整合，得到个原始图像分块，其中，。

14、在一种实施方案中，改进型clipself模型的筛选模块包括卷积神经网络和区域生成网络，所述根据多个原始图像分块，通过改进型clipself模型的筛选模块，利用预设筛选规则，从多个原始图像分块中筛选得到多个符合预设置信度范围的图像分块，包括：

15、当被设置成，即期望改进型clipself模型实现图像局部理解时，通过改进型clipself模型的筛选模块的卷积神经网络和区域生成网络，得到个原始图像分块中的每一个原始图像分块的置信度；

16、根据个原始图像分块中的每一个原始图像分块的置信度，将个原始图像分块按照从高到低排序，取前个原始图像分块，作为多个符合预设置信度范围的图像分块。

17、在一种实施方案中，所述当被设置成，即期望改进型clipself模型实现图像局部理解时，通过改进型clipself模型的筛选模块的卷积神经网络和区域生成网络，得到个原始图像分块中的每一个原始图像分块的置信度包括：

18、当被设置成，即期望改进型clipself模型实现图像局部理解时，根据个原始图像分块中的每一个原始图像分块，通过改进型clipself模型的筛选模块的卷积神经网络，得到个原始图像分块中的每一个原始图像分块的特征图，其中，个原始图像分块中的每一个原始图像分块的特征图上均设置有一组预定义锚框；

19、对于个原始图像分块中的每一个原始图像分块的特征图，对特征图上的一组预定义锚框中的每一个预定义锚框，通过改进型clipself模型的筛选模块的区域生成网络，得到锚框置信度和用于调整锚框位置和尺寸的回归参数；

20、对于个原始图像分块中的每一个原始图像分块，根据特征图上的一组预定义锚框中的每一个预定义锚框的锚框置信度，利用非极大值抑制法，滤除重叠度超出预设重叠度阈值的预定义锚框，得到最有可能包含目标的预定义锚框并将其置信度作为对应原始图像分块的置信度。

21、在一种实施方案中，所述根据个原始图像分块中的每一个原始图像分块的置信度，将个原始图像分块按照从高到低排序，取前个原始图像分块，作为多个符合预设置信度范围的图像分块，包括：

22、对于个原始图像分块，根据个原始图像分块中的每一个原始图像分块对应的最有可能包含目标的预定义锚框的置信度，将个原始图像分块按照从高到低排序，取前个原始图像分块，作为多个符合预设置信度范围的图像分块。

23、在一种实施方案中，所述将多个符合预设置信度范围的图像分块替代多个原始图像分块，用于改进型clipself模型实现对训练图像中的待识别目标进行目标识别，包括：

24、将个原始图像分块替代个原始图像分块，用于改进型clipself模型实现对训练图像中的待识别目标进行目标识别。

25、本专利技术还提供一种自适应图像分块系统，包括：

26、图像获取模块，用于：获取训练图像，其中，训练图像的长宽分别为，且训练图像中含有待识别目标；

27、切分模块，用于：根据训练图像，通过改进型clipself模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块；

28、筛选模块，用于：根据多个原始图像分块，通过改进型clipself模型的筛选模块，利用预设筛选规本文档来自技高网...

【技术保护点】

1.一种自适应图像分块方法，其特征在于，包括：

2.根据权利要求1所述的自适应图像分块方法，其特征在于，所述根据训练图像，通过改进型CLIPSelf模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块，包括：

3.根据权利要求2所述的自适应图像分块方法，其特征在于，所述预设分块规则包括：

4.根据权利要求3所述的自适应图像分块方法，其特征在于，改进型CLIPSelf模型的筛选模块包括卷积神经网络和区域生成网络，所述根据多个原始图像分块，通过改进型CLIPSelf模型的筛选模块，利用预设筛选规则，从多个原始图像分块中筛选得到多个符合预设置信度范围的图像分块，包括：

5.根据权利要求4所述的自适应图像分块方法，其特征在于，所述当被设置成，即期望改进型CLIPSelf模型实现图像局部理解时，通过改进型CLIPSelf模型的筛选模块的卷积神经网络和区域生成网络，得到个原始图像分块中的每一个原始图像分块的置信度包括：

6.根据权利要求5所述的自适应图像分块方法，其特征在于，所述根据个原始图像分块中的每一个原始图像分块

7.根据权利要求6所述的自适应图像分块方法，其特征在于，所述将多个符合预设置信度范围的图像分块替代多个原始图像分块，并训练得到改进型CLIPSelf模型，包括：

8.一种自适应图像分块系统，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述的自适应图像分块方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的自适应图像分块方法。

...

【技术特征摘要】

1.一种自适应图像分块方法，其特征在于，包括：

2.根据权利要求1所述的自适应图像分块方法，其特征在于，所述根据训练图像，通过改进型clipself模型的切分模块，利用预设分块规则，将训练图像切分为多个原始图像分块，包括：

3.根据权利要求2所述的自适应图像分块方法，其特征在于，所述预设分块规则包括：

4.根据权利要求3所述的自适应图像分块方法，其特征在于，改进型clipself模型的筛选模块包括卷积神经网络和区域生成网络，所述根据多个原始图像分块，通过改进型clipself模型的筛选模块，利用预设筛选规则，从多个原始图像分块中筛选得到多个符合预设置信度范围的图像分块，包括：

5.根据权利要求4所述的自适应图像分块方法，其特征在于，所述当被设置成，即期望改进型clipself模型实现图像局部理解时，通过改进型clipself模型的筛选模块的卷积神经网络和区域生成网络，得到个原始图像分块中的...

【专利技术属性】
技术研发人员：罗静，武鑫森，刘阳，孔祥斌，费冬，郑琛，周铭坤，方鑫，陈哲，刘泽强，
申请(专利权)人：通号通信信息集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人