System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的图书馆座位管理系统技术方案_技高网

一种基于深度学习的图书馆座位管理系统技术方案

技术编号:43333205 阅读:6 留言:0更新日期:2024-11-15 20:30
本发明专利技术涉及一种基于深度学习图书馆座位管理系统的构建方法,该方法采用随机水平旋转、随机垂直翻转进行数据增强;在颈部添加能将浅层特征下采样为深层特征,并进行融合的特征融合模块;利用综合考虑F1分数和alpha‑IOU的损失函数训练检测网络模型;将增强通道注意力机制模块添加到主干网络的最后一个C3与SPPF模块之间,负责利用特征图不同通道之间的相关性来建立通道注意力机制,求解获得的通道注意力权重,并对特征图重新赋值,增强YOLOv5对通道的敏感性;采用附带1×1卷积进行残差连接,增强YOLOv5对特征的提取;本发明专利技术能自动、准确定位图书馆中的每个座位区域,并标记出该区域的座位使用情况,供读者了解图书馆座位使用情况。

【技术实现步骤摘要】

本专利技术属于图书馆管理,具体涉及一种基于深度学习的图书馆座位管理系统


技术介绍

1、随着数字化信息的迅速发展,图书馆作为一个传统的知识资源和文化传承的载体,依然扮演着重要的角色。然而,随着人们的生活方式和学习方式的变化,图书馆也面临着新的管理挑战。座位管理作为图书馆管理的一个重要方面,直接关系到图书馆的服务质量和读者的学习体验。因此,建立一个高效的座位管理系统对于图书馆来说至关重要。座位管理是指对图书馆座位的使用进行规范和监督,包括座位的预约、使用、归还等方面。一个好的座位管理系统可以帮助学生更方便地找到自己需要的座位,提高座位的利用率和学生的满意度,同时也可以帮助图书馆更好地管理座位资源,提高图书馆的服务质量。

2、传统的座位状态检测方法通常采用人工巡检和手动记录的方式,工作量繁重,并且需要耗费大量的时间和人力资源。深度学习模型在处理大规模图像数据时,能够学习到更复杂、更准确的模式和特征,这使得它们在物体检测、人体姿态识别等任务上表现出更高的精度。据调查,国内研究者严梓峻提出了一种基于图像识别的移动终端图书馆座位管理系统,其中包括座位识别与检测模块、无线wifi传输模块、数据处理与客户端通信模块、手机app应用模块。座位识别与检测模块采用了树莓派4b和树莓派ov5647摄像头,使用了基于haar-l i ke特征分类器的adaboost算法进行人脸检测。然而,这种方法在应用于图书馆场景时存在一定局限性,因为它对姿态变化的人脸和复杂背景下的人脸检测率较低。为了解决这一问题,调研发现了基于卷积神经网络的目标检测方法,包括两阶段目标检测和单阶段目标检测。两阶段目标检测算法如r-cnn、fast r-cnn等在检测精度方面表现较好,但速度较慢。而单阶段目标检测算法如ssd、yolo等速度更快,但检测精度可能会受到影响。其中,yolo(you on ly look once)系列是一种实时目标检测的深度学习网络结构。yolov3通过引入多尺度预测、多尺度特征融合、残差块等技术进行改进,在提高检测精度和速度上取得了显著进展。尽管yolo框架在目标检测领域取得了显著进展,并在速度和效率方面有所改进,但仍然存在一些不足之处。

3、除此之外,对于基于深度学习的图书馆座位管理系统,面临着以下三点挑战。第一点是精准性问题。在图书馆环境中,可能存在光线不足、座位被其他物体遮挡、人物动态变化等复杂的问题,因此系统需要确保能够准确地识别出座位的位置,并且能够有效地区分哪些座位是空闲的,那先是已被占用的。特别是在使用人物检测技术上,需要克服人物姿态变化和背景复杂性对检测准确性的影响。第二点是实时性问题,座位管理系统通常需要在较短的时间内提供实时的结果。在图书馆中,用户需要即时知道哪些位置可用,以便快速找到合适位置。因此,系统的响应速度至关重要。第三点是通用性问题。图书馆的布局和环境可能会因地点和建筑结构的不同二有所变化。因此,系统需要具备一定的通用性,能够适应不同的图书馆场景和座位布局,意味着座位管理系统需要具备良好的泛化能力,能够处理各种布局、光照条件下的图像数据。


技术实现思路

1、本专利技术的目的在于克服现有技术中的不足之处,提供一种基于深度学习的图书馆座位管理系统。

2、为了实现本专利技术的目的,我们将采用如下所述的技术方案加以实施:

3、一种基于深度学习图书馆座位管理系统的构建方法,包括以下步骤:

4、s1、采用labe l img工具对图书馆提供的馆内图像中的座位的状态和人进行标注,经标注后的馆内图像按照一定比例随机生成训练集和测试集,并对训练集和测试集进行预处理;

5、s2、利用预训练好的yolov5模型,构建图书馆座位状态的检测网络模型;

6、所述检测网络模型以yolov5模型为主模型架构,其包括输入端、主干网络、颈部、检测头;输入端具有mosaic数据增强、自适应锚框计算、自适应图片缩放功能;主干网络采用csp结构,通过前向和跨层连接,将输入特征图划分并融合,同时采用残差结构保证特征信息的传递;

7、s3、将训练集中的馆内图像输入到检测网络模型中进行训练,检测网络模型逐渐拟合,训练中每次迭代,保存训练效果最好的模型参数,其中,所述模型参数包括网络权重;

8、s4、将测试集中的馆内图像输入到具有最优网络权重的检测网络模型中进行测试,检测网络模型输出预测后的检测结果;

9、其中,所述预处理是采用随机水平旋转、随机垂直翻转的方式对训练集和测试集进行数据增强;

10、所述颈部利用pan特征融合方法,在原先fpn的基础上添加一个特征融合模块,该模块将浅层特征下采样为深层特征,并且与对应的深层特征进行融合,以此弥补深层特征图定位信息不足的缺点,使不同尺寸的特征图都包含图像语义信息和图像特征信息,保证了对不同尺寸的图片的准确预测;

11、所述检测头利用综合损失函数来训练检测网络模型,所述综合损失函数是综合考虑f1分数和a l pha-iou的损失函数;

12、将增强通道注意力机制模块添加到所述主干网络中的最后一个c3与sppf模块之间;

13、所述增强通道注意力机制模块负责利用特征图的不同通道之间的相关性来建立通道注意力机制,用通道注意力机制求解获得的通道注意力权重对特征图进行重新赋值,增强yolov5模型对通道的敏感性;采用附带1×1卷积进行残差连接,增强yolov5模型对特征的提取;

14、所述yolov5模型的预训练权重加载到所述检测网络模型中,利用先前学习到的特征表示。

15、作为本专利技术的优选方案,所述标注的类别分为人、已使用的桌子、空闲的桌子、杂物、瓶子、书、笔记本和背包八个类别;

16、作为本专利技术的优选方案,所述增强通道注意力机制模块的结构分为压缩、恢复、增强三个部分,其中:

17、所述压缩部分是通过同时使用全局平均池化和全局最大池化对backbone模块中最后一个c3输出的大小为c×h×w的特征向量分别进行压缩,获取每个通道的全局特征,也就是两个大小为c×1×1的通道特征图;

18、所述恢复部分是通过卷积、relu激活函数、卷积分别对上述的两个大小为c×1×1通道特征图的进行降维,增强模型的非线性能力,恢复通道特征图的原始维度,将两个恢复原始维度的通道特征图进行融合,通过s igmoid函数求解出的融合特征图的通道注意力权重,将通道注意力权重与原始特征相乘,得到与原始输入图尺寸相同的注意力特征图;

19、所述增强部分是将大小为c×h×w的注意力特征图与原始特征通过1×1卷积的残差网络输出的大小为c×h×w的特征图进行融合,增强所述增强通道注意力机制模块对特征图和全局特征的学习。

20、作为本专利技术的优选方案,所述综合损失函数的表达式为:

21、loss=β×α_iou+(1-β)×(1-f1_score);

22、式中,α_iou是基于iou的损失,f1_s本文档来自技高网...

【技术保护点】

1.一种基于深度学习图书馆座位管理系统的构建方法,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在于,所述标注的类别分为人、已使用的桌子、空闲的桌子、杂物、瓶子、书、笔记本和背包八个类别。

3.根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在于,所述增强通道注意力机制模块的结构分为压缩、恢复、增强三个部分,其中:

4.根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在于,所述综合损失函数的表达式为:

5.根据根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在于,所述特征包括边缘、纹理、形状和语义信息。

【技术特征摘要】

1.一种基于深度学习图书馆座位管理系统的构建方法,包括以下步骤:

2.根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在于,所述标注的类别分为人、已使用的桌子、空闲的桌子、杂物、瓶子、书、笔记本和背包八个类别。

3.根据权利要求1所述的一种基于深度学习图书馆座位管理系统的构建方法,其特征在...

【专利技术属性】
技术研发人员:张天宝万程徐超洋程健鸿许叙斌汪荣
申请(专利权)人:远望谷宁波文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1