一种视觉信息的跨尺度特征提取方法技术

技术编号:38610618 阅读:12 留言:0更新日期:2023-08-26 23:39
本发明专利技术提供一种视觉信息的跨尺度特征提取方法,将不同层次的特征图融合生成第一特征图、第二特征图和第三特征图;第一特征图、第二特征图和第三特征图分别由不同层次的特征融合,保留了不同层次的特征信息;进而进行识别时,能对更多的特征进行识别,提供识别准确率。提供识别准确率。提供识别准确率。

【技术实现步骤摘要】
一种视觉信息的跨尺度特征提取方法


[0001]本专利技术涉及钢材识别方法,具体涉及一种视觉信息的跨尺度特征提取方法。

技术介绍

[0002]图像识别技术也称为视觉识别技术,是指利用计算机对图像进行处理和分析,辨识物体的类别并做出判断。图像识别系统一般包括预处理、分析和识别三部分,预处理包括图像分割、图像增强、图像还原、图像重建和图像细化等诸多内容,图像分析主要指从预处理得到的图像中提取特征,最后分类器根据提取的特征对图像进行匹配分类,作出识别。
[0003]在中国申请号为202010274297.6,公布日为2020.6.30的专利文献公开了一种钢材编码识别方法、钢材编码识别系统及其训练方法;通过图像采集装置实时采集待识别图像,并对采集的各帧待识别图像分别进行识别处理;当在当前帧待识别图像的设定区域范围内识别到待识别物体时,通过物体识别模型识别物体以及物体的编号的位置;获取编号在待识别图像中的图中方向,并基于图中方向获得编号的朝向基准方向的编号图像;基于编号朝向基准方向的编号图像,获得编号朝向识别朝向的字符提取图像;在字符提取图像中提取编号对应的字符。但是该识别方法,不能对不同层次的特征进行融合;进而识别的特征少,识别不准确。

技术实现思路

[0004]本专利技术提供一种视觉信息的跨尺度特征提取方法,将不同层次的特征图进行叠加融合保留了不同层次的特征,进而进行识别时,能对更多的特征进行识别,提供识别准确率。
[0005]为达到上述目的,本专利技术的技术方案是:一种视觉信息的跨尺度特征提取方法,包括以下步骤:S1、将预处理的图片输入到YOLOv7

tiny模型中。
[0006]S2、YOLOv7

tiny模型包括输入端、Backbone部分、TS

FAN模块和输出端;输入端用于接收数据,输出端用于输出数据;Backbone部分提取图片的特征。
[0007]S3、Backbone部分对提取到的特征进行卷积操作,得到四张不同层次的特征图。
[0008]S4、TS

FAN模块将相邻的不同层次的特征图进行融合,得到第一特征图、第二特征图和第三特征图。
[0009]以上方法,通过Backbone部分对特征进行卷积操作,提取到不同层次的特征图;进而能得到不同层次的特征信息;然后通过TS

FAN模块将相邻的不同层次的特征图进行融合;进而在第一特征图、第二特征图和第三特征图中保留有更多的特征信息;使得在识别过程中能捕抓到更多的特征信息,提高图片识别的准确率。
[0010]进一步的,S4中,将相邻的不同层次的特征图进行融合,是将相邻的不同层次的特征图进行叠加。
[0011]以上方法,通过叠加进行融合,保留了不同层次的特征。
[0012]进一步的,Backbone部分包括第一提取模块、第二提取模块、第三提取模块和第四提取模块;第一提取模块包括第一CBS模块和第一C3模块;第二提取模块包括第二CBS模块和第二C3模块;第三提取模块包括第三CBS模块和第三C3模块;第四提取模块包括第四CBS模块和第四C3模块; 第一C3模块和第二C3模块为C3

1模块;第三C3模块和第四C3模块为C3

3模块。
[0013]以上方法,使用不同的提取模块提取出不同层次的特征图。
[0014]进一步的,S3中,具体包括以下步骤:S3.1、先通过第一提取模块对图片的特征进行提取并进行卷积操作,得到一层次的特征图。
[0015]S3.2、通过第二提取模块对一层次的特征图中的特征进行提取并进行卷积操作,得到另一层次的的特征图。
[0016]S3.3、通过第三提取模块对另一层次的特征图中的特征进行提取并进行卷积操作,得到又一层次的的特征图。
[0017]S3.4、通过第四提取模块对又一层次的特征图中的特征进行提取并进行卷积操作,得到再一层次的的特征图。
[0018]以上方法,第一提取模块对图片的进行卷积操作,从图片提取出一层次的特征图;然后第二提取模块对一层次的特征图进行卷积操作,提取出另一层次的特征图;然后第三提取模块对另一层次的特征图进行卷积操作,提取出又一层次的特征图;然后第四提取模块对又一层次的特征图进行卷积操作,提取出再一层次的特征图;第一提取模块、第二提取模块、第三提取模块和第四提取模块按序对不同层次的特征图中的特征进行提取;进而得到1更高层次的特征图。
[0019]进一步的,TS

FAN模块包括自顶向下路径和自低向上路径。
[0020]S4中,TS

FAN模块将相邻的不同层次的特征图进行融合,包括下步骤:S4.1、对一层次的特征图、另一层次的特征图进行叠加进行S4.2;对一层次的特征图、另一层次的特征图、又一层次的特征图进行叠加进行S4.3;对另一层次的特征图、又一层次的特征图、再一层次的特征图进行叠加进行S4.4。
[0021]S4.2、通过自顶向下路径,将高层次的特征图的空间分辨率扩大,将高层次的特征中的特征融合到低层次的特征图中;得到第一特征图。
[0022]S4.3、通过自顶向下路径,将高层次的特征图的空间分辨率扩大,同时通过自底向上路径,将低层次的特征图的空间分辨率缩小,使得高层次的特征图、中层次的特征图和低高层次的特征图的大小一致,将高层次的特征图、中层次的特征图和低高层次的特征图的进行叠加;得到第二特征图;。
[0023]S4.4、通过自顶向下路径,将高层次的特征图的空间分辨率扩大,同时通过自底向上路径,将低层次的特征图的空间分辨率缩小,使得高层次的特征图、中层次的特征图和低高层次的特征图的大小一致,将高层次的特征图、中层次的特征图和低高层次的特征图的进行叠加;得到第三特征图。
[0024]以上方法,通过同时进行自顶向下路径、自底向上路径融合;将不同层次、不同尺度、不同通道的特征信息进行合并,从而得到更加丰富、更加准确的特征表达;提高特征表达能力;利用图像中的多层次、多尺度、多通道信息,减少特征信息的丢失;提高模型的特征
提取能力和泛化能力,从而使模对于不同的任务和数据具有更好的适应性。
[0025]进一步的,所述C3

3模块包括三个残差模块、两个卷积核大小为3*3,步长为1的CONV模块、两个卷积核大小为3*3,步长为2的CBS模块和一个concat模块。
[0026]进一步的,所述C3

1模块包括一个残差模块、两个卷积核大小为3*3,步长为1的CONV模块、两个卷积核大小为3*3,步长为2的CBS模块和一个concat模块。
[0027]进一步的,在步骤S1之前还包括:步骤S0、预设标准图像的大小;对图片进行缩放处理,使图片中的预处理图片与标准图像的大小相同。
[0028]以上设置,在识别前对图像进行缩放处理,使得不同图片中的待识别图像的大小保持本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视觉信息的跨尺度特征提取方法,其特征在于:包括以下步骤:S1、将预处理的图片输入到YOLOv7

tiny模型中;S2、YOLOv7

tiny模型包括输入端、Backbone部分、TS

FAN模块和输出端;输入端用于接收数据,输出端用于输出数据;Backbone部分提取图片的特征;S3、Backbone部分对提取到的特征进行卷积操作,得到四张不同层次的特征图;S4、TS

FAN模块将相邻的不同层次的特征图进行融合,生成第一特征图、第二特征图和第三特征图。2.根据权利要求1所述的一种视觉信息的跨尺度特征提取方法,其特征在于:S4中,将相邻的不同层次的特征图进行融合,是将相邻的不同层次的特征图进行叠加。3.根据权利要求2所述的一种视觉信息的跨尺度特征提取方法,其特征在于:Backbone部分包括第一提取模块、第二提取模块、第三提取模块和第四提取模块;第一提取模块包括第一CBS模块和第一C3模块;第二提取模块包括第二CBS模块和第二C3模块;第三提取模块包括第三CBS模块和第三C3模块;第四提取模块包括第四CBS模块和第四C3模块; 第一C3模块和第二C3模块为C3

1模块;第三C3模块和第四C3模块为C3

3模块。4.根据权利要求3所述的一种视觉信息的跨尺度特征提取方法,其特征在于:S3中,具体包括以下步骤:S3.1、先通过第一提取模块对图片的特征进行提取并进行卷积操作,得到一层次的特征图;S3.2、通过第二提取模块对一层次的特征图中的特征进行提取并进行卷积操作,得到另一层次的的特征图;S3.3、通过第三提取模块对另一层次的特征图中的特征进行提取并进行卷积操作,得到又一层次的的特征图;S3.4、通过第四提取模块对又一层次的特征图中的特征进行提取并进行卷积操作,得到再一层次的的特征图。5.根据权利要求4所述的一种视觉信息的跨尺度特征提取方法,其特征在于...

【专利技术属性】
技术研发人员:邹莹陈祖国陈超洋卢明李沛王颖胡嘉豪王佳怡资成香
申请(专利权)人:湖南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1