基于通道注意力机制的行人检测方法及装置制造方法及图纸

技术编号：43329913 阅读：12 留言：0更新日期：2024-11-15 20:27

本发明专利技术提供了一种基于通道注意力机制的行人检测方法及装置，具有这样的特征，包括以下步骤：步骤S1，对视频序列进行预处理，得到预处理图像；步骤S2，将预处理图像输入行人检测模型，得到行人外观特征向量；步骤S3，对行人外观特征向量进行计算，得到行人检测结果，行人检测模型包括：特征提取模块，用于对预处理图像进行深度特征提取，得到特征图；通道注意力模块，用于通过通道注意力机制对特征图进行处理，得到预测注意力图；目标检测模块，用于对预测注意力图进行上采样和卷积处理，得到行人外观特征向量总之，本方法能够准确识别视频序列中的行人。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种行人检测方法，具体涉及一种基于通道注意力机制的行人检测方法及装置。

技术介绍

1、早期的行人检测方法主要使用haar特征和级联分类器，其中viola-jones算法是一个代表。这种方法通过训练一个级联的弱分类器来快速地识别图像中的行人。然而，这些方法在处理复杂场景、姿态变化和部分遮挡时表现不佳。

2、随着深度学习的兴起，卷积神经网络在行人检测任务中取得了显著的成功。通过使用深度卷积网络，系统能够自动学习图像中的特征，从而提高对不同尺度、姿态和遮挡的行人的检测能力。

3、行人检测也受益于目标检测领域的发展，如faster r-cnn、yolo和ssd等框架。这些框架通过引入区域提议网络rpn或采用单一网络结构，实现了更快速和准确的目标检测。通过数据增强技术，可以合成更多的训练数据，提高模型的泛化能力。迁移学习则利用在其他任务上预训练的模型，以加速和提升行人检测模型的性能。

4、但是现有的方法在鲁棒性、实时性和对复杂场景的适应能力等方面还面临着更高的需求。

技术实现思路

1、本专利技术是为了解决上述问题而进行的，目的在于提供一种基于通道注意力机制的行人检测方法及装置。

2、本专利技术提供了一种基于通道注意力机制的行人检测方法，用于得到视频序列的行人检测结果，具有这样的特征，包括以下步骤：步骤s1，对视频序列进行预处理，得到预处理图像；步骤s2，将预处理图像输入行人检测模型，得到行人外观特征向量；步骤s3，对行人外观特征向

3、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，在步骤s1中，预处理包括去除噪声、调整图像亮度和对比度、归一化处理、尺寸调整。

4、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，在特征提取模块中，采用resnet-50网络作为多尺度特征提取器。

5、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，通道注意力模块包括顺次连接的第一卷积单元、第一上采样层、第二卷积单元、第二上采样层、第三卷积单元、第三上采样层和第四卷积单元，第一上采样层、第二上采样层和第三上采样层均用于将输入进行上采样至两倍，第一卷积单元、第二卷积单元、第三卷积单元和第四卷积单元均包括顺次连接的第一卷积层、relu激活函数、第二卷积层和sigmoid激活函数，第一卷积单元、第二卷积单元、第三卷积单元和第四卷积单元分别输出对应尺寸的预测注意力图。

6、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，第一卷积单元的第一卷积层、第一卷积单元的第二卷积层、第二卷积单元的第一卷积层和第二卷积单元的第二卷积层的卷积核大小均为3×3，且通道数均为512，第三卷积单元的第一卷积层和第二卷积层的卷积核大小均为3×3，且通道数均为256，第四卷积单元的第一卷积层和第二卷积层的卷积核大小均为3×3，且通道数均为128。

7、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，目标检测模块包括顺次连接的第五卷积单元、第四上采样层、第六卷积单元、第五上采样层、第七卷积单元、第六上采样层和第八卷积单元，第四上采样层、第五上采样层和第六上采样层均用于将输入进行上采样至两倍，第五卷积单元、第六卷积单元、第七卷积单元和第八卷积单元均包括顺次连接的concat层、第三卷积层和relu激活函数，concat层用于将该卷积单元的输入与具有相同尺寸的预测注意力图进行连接，并将连接结果作为相连的第三卷积层的输入。

8、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，第五卷积单元的第三卷积层的卷积核大小为3×3，且通道数均为512，第六卷积单元的卷积核大小为3×3，且通道数均为512，第七卷积单元的卷积核大小为3×3，且通道数均为256，第八卷积单元的卷积核大小为3×3，且通道数均为128。

9、在本专利技术提供的基于通道注意力机制的行人检测方法中，还可以具有这样的特征：其中，行人检测模型的训练包括以下步骤：步骤t1，根据现有图像数据构建训练数据集；步骤t2，从训练数据集中选取训练图像输入行人检测模型，得到行人外观特征向量和预测注意力图；步骤t3，根据行人外观特征向量计算得到行人检测结果；步骤t4，根据行人检测结果和预测注意力图计算损失并加权相加，得到总损失；步骤t5，根据总损失，通过反向传播更新行人检测模型的参数；步骤t6，重复执行步骤t1至步骤t5，直至达到训练终止条件，则得到训练好的行人检测模型。

10、本专利技术还提供了一种基于通道注意力机制的行人检测装置，具有这样的特征，包括：预处理部，用于对视频序列进行预处理，得到预处理图像；检测部，包括行人检测模型，用于将预处理图像输入行人检测模型，得到行人外观特征向量；行人检测结果输出部，用于对行人外观特征向量进行计算，得到行人检测结果，其中，行人检测模型包括：特征提取模块，用于对预处理图像进行深度特征提取，得到特征图；通道注意力模块，用于通过通道注意力机制对特征图进行处理，得到预测注意力图；目标检测模块，用于对预测注意力图进行上采样和卷积处理，得到行人外观特征向量。

11、专利技术的作用与效果

12、根据本专利技术所涉及的基于通道注意力机制的行人检测方法及装置，采用通道注意力模块生成多个不同尺度的预测注意力图，再采用目标检测模块对多尺度预测注意力图进行融合处理，进而能够有效定位图片中包含行人的位置。所以，本专利技术的基于通道注意力机制的行人检测方法及装置能够准确识别视频序列中的行人。

本文档来自技高网...

【技术保护点】

1.一种基于通道注意力机制的行人检测方法，用于得到视频序列的行人检测结果，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

3.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

4.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

5.根据权利要求4所述的基于通道注意力机制的行人检测方法，其特征在于：

6.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

7.根据权利要求6所述的基于通道注意力机制的行人检测方法，其特征在于：

8.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

9.一种基于通道注意力机制的行人检测装置，用于得到视频序列的行人检测结果，其特征在于，包括：

【技术特征摘要】

1.一种基于通道注意力机制的行人检测方法，用于得到视频序列的行人检测结果，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

3.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

4.根据权利要求1所述的基于通道注意力机制的行人检测方法，其特征在于：

5.根据权利要求4所述的基于通道...

【专利技术属性】
技术研发人员：刘亦晴，冯瑞，赵瑞玮，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人