一种用于羊脸检测的全局上下文增强方法技术

技术编号：37296362 阅读：35 留言：0更新日期：2023-04-21 22:42

本发明专利技术公开了一种用于羊脸检测的全局上下文增强方法，目的是使得模型网络中特征提取模块具有学习全局上下文信息的能力，从而使模型在检测羊脸的时候能够感知羊的身体以及背景信息，提高羊脸检测精度。本发明专利技术方法主要是先通过池化操作聚合全局信息，然后采用一维卷积操作进行信息交互得到全局上下文向量，最后将全局上下文向量与输入特征图相加实现全局上下文增强。本发明专利技术全局上下文增强方法可以学习到全局上下文特征，增强了模型网络的全局信息感知能力，而且具有轻量化和即插即用的特点，它可以被添加到任意目标检测模型的主干网络中，可以有效提高模型羊脸检测精度。可以有效提高模型羊脸检测精度。可以有效提高模型羊脸检测精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于羊脸检测的全局上下文增强方法

[0001]本专利技术属于计算机视觉领域，具体涉及一种用于羊脸检测的全局上下文增强方法。

技术介绍

[0002]卷积神经网络是计算机视觉领域重要的方法，广泛的用于图像分类、目标检测和目标分割任务上。卷积神经网络中最重要的就是卷积运算，它的特点是权值共享、局部连接和稀疏交互，其具有强大的局部特征提取能力。
[0003]羊脸检测属于目标检测领域，目标检测的代表性检测模型有两阶段的Faster R
‑
CNN和一阶段的RetinaNet、YOLO等。
[0004]但是，目前卷积神经网络仅对局部特征有很强的建模能力，缺乏对全局信息的感知能力，而在羊脸检测中，使模型能够建模全局上下文信息有助于提高模型的检测精度。

技术实现思路

[0005]本专利技术的目的在于使得模型网络中特征提取模块具有学习全局上下文信息的能力，从而使模型在检测羊脸的时候能够感知羊的身体以及背景信息，提高羊脸检测精度。
[0006]本专利技术为解决其问题，提出一种用于羊脸检测的全局上下文增强方法，其技术方案包括以下步骤：
[0007]1.一种用于羊脸检测的全局上下文增强方法，其特征在于包括以下步骤：
[0008]步骤一、对输入特征图进行通道池化，用公式表示为：
[0009]y(x)＝GAP(x)+GMP(x)
[0010]其中，x是输入特征图，形状是CxHxW，C代表特征图的通道数，H代表特征图的高，W代表特征的宽；y是对输入特征图池...

【技术保护点】

【技术特征摘要】
1.一种用于羊脸检测的全局上下文增强方法，其特征在于包括以下步骤：步骤一、对输入特征图进行通道池化，用公式表示为：y(t)＝GAP(x)+GMP(x)其中，x是输入特征图，形状是CxHxW，C代表特征图的通道数，H代表特征图的高，W代表特征的宽；y是对输入特征图池化后的结果，形状为Cx1x1；GAP是全局平均池化操作，GMP是全局最大池化操作；步骤二、在对特征图进行通道池化后，使用一维卷积进行信息交互，用公式表示为：w(t)＝Conv1D(y)其中，y是步骤一的计算结果，w是计算出的全局上下文向量，Conv1D表示...

【专利技术属性】
技术研发人员：韩高格，唐晶磊，苏庆国，
申请(专利权)人：西北农林科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人