System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像处理的目标检测领域,更具体地说是涉及一种基于双通道注意力的轻量化打电话检测方法。
技术介绍
1、在人工智能和机器视觉领域,图像识别技术已成为一个重要的研究方向。图像识别技术能够使计算机系统理解和解释视觉信息,从而实现对图片内容的自动分析和理解。特别是在行为识别领域,通过分析图像中的人物动作,可以识别出各种行为模式,如行走、跑步等。然而,识别更为复杂和微妙的行为,例如打电话,仍然是一个挑战。现有的图像识别技术主要包括基于传统计算机视觉的方法和基于深度学习的方法。传统方法通常依赖于手工设计的特征,如sift(尺度不变特征变换)和hog(方向梯度直方图),这些特征需要专家知识和大量的手动调整。而基于深度学习的方法,尤其是卷积神经网络(cnn),通过自动学习图像特征,已经在图像分类、目标检测和行为识别等多个领域取得了显著的成果。
2、尽管深度学习方法在图像识别领域取得了巨大成功,但在识别打电话这一特定行为时,仍存在一些局限性。例如现有模型可能在特定的数据集上表现良好,但在面对新的或未见过的场景时,其泛化能力可能不足;在需要实时反馈的应用场景中,如视频监控或交互式系统,现有技术可能无法满足快速识别的需求。
技术实现思路
1、有鉴于此,为了解决上述技术问题,本专利技术的目的是提供一种基于双通道注意力的轻量化打电话检测方法,以改善目标检测任务的性能。依据本方法轻量且精度较高的特点,可以有效应用到实际场景中,有着较好的实用性。
2、本专利技术采用以下技术方
3、一种基于双通道注意力的轻量化打电话检测方法,主要包括以下步骤:
4、第一步,将打电话检测原模型的yolov5初始网络架构的c3层替换为轻量化可分离幽灵卷积模块,以减少模型的参数大小和运算量,从而提升模型的推理速度;
5、第二步,将双通道注意力特征融合模块添加于轻量化可分离幽灵卷积模块上,以提高模型对于信息的理解和预测能力;
6、第三步,将原模型激活函数改进为h-swish激活函数,以减少模型的计算量;
7、第四步,将原模型初始ciou损失函数更改为eiou损失函数,从而得到打电话检测的改进模型,以进一步提升模型的精度;
8、第五步,将改进模型进行数据训练,得到基于双通道注意力的轻量化打电话检测的成型模型;
9、最后,将检测数据输入到成型模型中,从而输出检测结果。
10、幽灵网络是一种高效的模块设计,通过生成更多的"幽灵特征图"来减少计算量。本方法提出了在传统的幽灵网络模块中引入深度可分离卷积的创新方法,旨在进一步优化模型的轻量化和性能。本方法的创新之处在于结合了深度可分离卷积的参数和计算量优势,通过在幽灵网络模块中引入这两种技术,不仅实现了对特征的有效提取和融合,还增强了模型对于不同输入特征的适应能力。这种结合方式在保持轻量化的同时,提升了模型的性能和泛化能力。
11、双通道注意力特征融合模块只增加了少量的参数,却能获得明显的性能增益。可以有效避免降维,捕获跨通道交互的信息,旨在保证信息效率和有效性。
12、h-swish激活函数使用常见的算子组合而成,因此几乎所有框架都可实现,且在对效果影响不大的条件下使得计算量大大降低。
13、作为上述方案的进一步改进,所述轻量化可分离幽灵卷积模块将标准的卷积操作分解为深度卷积和逐点卷积两个部分,以减少参数数量和计算量;深度卷积对输入的每个通道分别应用单独的卷积核,而逐点卷积则是一个1x1的卷积,用于融合深度卷积的输出。
14、作为上述方案的进一步改进,所述双通道注意力特征融合模块涉及图像中的横向序列特征和纵向序列特征两个维度。
15、作为上述方案的进一步改进,所述双通道注意力特征融合模块是一个即插即用块,以提升模型网络架构的性能。
16、为了最小化对yolov5原始架构的干扰,双通道注意力特征融合模块被设计为一个可插拔的组件,这样可以在不同的阶段进行实验,找到最佳的集成点。通过这种方式,yolov5模型不仅能够利用其原有的强大目标检测能力,还能通过双通道注意力特征融合机制更好地理解和利用数据中的信息,从而在特定的应用场景下实现更高的准确性和效率。
17、作为上述方案的进一步改进,所述eiou损失函数的惩罚项是在ciou损失函数的惩罚项基础上将纵横比的影响因子拆开,以分别计算目标框和锚框的长和宽。
18、作为上述方案的进一步改进,所述eiou损失函数包含重叠损失、中心距离损失和宽高损失三个部分。前两部分延续ciou损失函数中的方法,但是宽高损失直接使目标盒与锚盒的宽度和高度之差最小,使得收敛速度更快。
19、原模型初始ciou损失函数就是在diou损失函数的基础上增加了检测框尺度的损失,增加了长和宽的损失,这样预测框就会更加的符合真实框。但是缺点是:纵横比描述的是相对值,存在一定的模糊;未考虑难易样本的平衡问题。针对以上问题,采用eiou损失函数的方法可以有效得到解决。通过对ciou损失函数的更改替换为eiou损失函数,使得模型的精度可以进一步得到提升。
20、本专利技术的有益效果是:通过将yolov5初始网络架构的c3层替换为轻量化模块可分离幽灵卷积模块,在保证初始网络架构的精度下,大幅提升模型的推理速度,减少模型的参数大小和运算量;添加双通道注意力特征融合,以增加少量参数为代价,获得明显的性能增益;对ciou损失函数的更改替换为eiou损失函数,使得模型的精度可以进一步得到提升;将原模型激活函数改进为h-swish激活函数,在对效果影响不大的条件下使得计算量大大降低,扩大应用场景以及实用性。
本文档来自技高网...【技术保护点】
1.一种基于双通道注意力的轻量化打电话检测方法,其特征在于,主要包括以下步骤:
2.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述轻量化可分离幽灵卷积模块将标准的卷积操作分解为深度卷积和逐点卷积两个部分,以减少参数数量和计算量;深度卷积对输入的每个通道分别应用单独的卷积核,而逐点卷积则是一个1x1的卷积,用于融合深度卷积的输出。
3.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述双通道注意力特征融合模块涉及图像中的横向序列特征和纵向序列特征两个维度。
4.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述双通道注意力特征融合模块是一个即插即用块,以提升模型网络架构的性能。
5.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述EIOU损失函数的惩罚项是在CIOU损失函数的惩罚项基础上将纵横比的影响因子拆开,以分别计算目标框和锚框的长和宽。
6.根据权利要求1所述的一种基于双通道注意力的轻量化打电
...【技术特征摘要】
1.一种基于双通道注意力的轻量化打电话检测方法,其特征在于,主要包括以下步骤:
2.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述轻量化可分离幽灵卷积模块将标准的卷积操作分解为深度卷积和逐点卷积两个部分,以减少参数数量和计算量;深度卷积对输入的每个通道分别应用单独的卷积核,而逐点卷积则是一个1x1的卷积,用于融合深度卷积的输出。
3.根据权利要求1所述的一种基于双通道注意力的轻量化打电话检测方法,其特征在于,所述双通道注意力特征融合模块涉及图像中的横向序列特征和纵向序列特征两个维...
【专利技术属性】
技术研发人员:黄业文,黄小燕,单纯,刘炽辉,陈俊铧,欧阳明飞,
申请(专利权)人:广东技术师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。