目标对象检测方法、装置及计算机设备制造方法及图纸

技术编号：43935907 阅读：5 留言：0更新日期：2025-01-07 21:28

本申请公开了一种目标对象检测方法、装置及计算机设备。其中，该方法包括：获取待检测视频流；从待检测视频流中提取待检测的图像帧；采用预设模型对待检测的图像帧中的目标对象进行检测，得到待检测的图像帧中目标对象的检测结果，其中，检测结果至少用于表示目标对象所属的类型和目标对象所对应的检测框的位置，预设模型中至少包括：分类头和定位头，分类头用于计算分类结果，定位头用于确定检测框的位置坐标。本申请解决了相关技术中的目标检测模型对目标对象的检测准确率较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉，具体而言，涉及一种目标对象检测方法、装置及计算机设备。

技术介绍

1、现有的电动车进电梯视频流技术方案较多，但是基本的技术方案大致如下：首先是在电梯内架设监控摄像头，并利用目标跟踪技术跟踪进入电梯内的目标，如果被跟踪的目标在某一帧中被识别为电动车，同时其被识别为电动车的概率大于指定阈值，则告警系统立马发出告警提示音，并触发电梯制动装置，使电梯无法正常关门，以提醒乘梯人离开电梯。现有的技术方案中对电动车的检测算法一般均采用yolo(you only look once，仅需看一次)算法，而yolo算法的头部是一个耦合头，采用耦合头同时完成目标的分类和定位(在同一组卷积里产生)，分类和定位的过程中，由于互相干扰导致模型性能降低，进而导致对电动车的检测准确率较低。

技术实现思路

1、本申请实施例提供了一种目标对象检测方法、装置及计算机设备，以至少解决相关技术中的目标检测模型对目标对象的检测准确率较低的技术问题。

2、根据本申请实施例的一个方面，提供了一种目标对象检测方法，包括：获取待检测视频流；从所述待检测视频流中提取待检测的图像帧；采用预设模型对所述待检测的图像帧中的目标对象进行检测，得到所述待检测的图像帧中所述目标对象的检测结果，其中，所述检测结果至少用于表示所述目标对象所属的类型和所述目标对象所对应的检测框的位置，所述预设模型中至少包括：分类头和定位头，所述分类头用于计算分类结果，所述定位头用于确定检测框的位置坐标。

3、可选地，采用预

4、可选地，所述方法还包括：将所述输出结果与标签数据进行对比，确定分类损失值、定位损失值和前背景损失值；将所述分类损失值、所述定位损失值和所述前背景损失值按照各自的预设权重进行加权求和，得到最终损失值，其中，所述分类损失值通过有效类别间隔损失函数确定，所述前背景损失值的预设权重最高。

5、可选地，在输出所述待检测的图像帧中所述目标对象的检测结果之后，所述方法还包括：在所述目标对象在预设时间窗口内首次出现的情况下，为所述目标对象标记标识符；创建与所述标识符相关联的状态字典，其中，所述目标对象的状态字典中至少包括：所述目标对象为目标类型的对象的置信度，所述状态字典中内容是根据所述目标对象的检测结果确定的；至少根据所述目标对象为目标类型的对象的置信度确定所述目标对象是否为所述目标类型的对象。

6、可选地，创建与所述标识符相关联的状态字典，包括：构建多个键值对和多个字段，其中，所述多个键值对至少包括：目标对象所属多个类型的统计数据，所述多个字段至少包括：第一字段、第二字段、第三字段和第四字段，所述第一字段用于表示当前图像帧，所述第二字段用于表示到所述待检测的图像帧为止所述目标对象出现的帧数，所述第三字段用于表示所述目标对象首次进入告警区域的时刻，所述第四字段用于表示所述目标对象最后一次进入所述告警区域的时刻，在触发预设告警条件的情况下，更新所述第三字段和所述第四字段，所述当前图像帧每隔预设时长更新一次。

7、可选地，所述方法还包括：从所述统计数据中提取所述目标对象被识别为所述目标类型的对象的次数和所述目标对象被识别为所述目标类型的对象的平均置信度；在所述目标对象被识别为所述目标类型的对象的次数最多且所述目标对象被识别为所述目标类型的对象的平均置信度大于预设置信度阈值的情况下，确定所述目标对象为所述目标类型的对象；在检测到所述目标对象为所述目标类型的对象且所述目标对象进入所述告警区域的情况下，确定触发所述预设告警条件。

8、可选地，所述告警区域通过以下方式确定，包括：获取初始告警区域，并将所述初始告警区域分割为多个矩形子区域；根据所述多个矩形子区域的位置关系生成初始矩阵，所述初始矩阵中各元素的值设置为零；采用所述预设模型对所述待检测视频流中的每个图像帧进行目标检测，确定检测到的所述目标对象所处的位置落入所述多个矩形子区域中的目标子区域的情况下，将所述目标子区域对应的元素值加一，直到检测时长超过预设检测时长，得到目标矩阵；将所述目标矩阵中元素值超过预设元素值阈值的矩形子区域所覆盖的区域确定为所述告警区域。

9、根据本申请实施例的另一方面，还提供了一种目标对象检测装置，包括：获取模块，用于获取待检测视频流；提取模块，用于从所述待检测视频流中提取待检测的图像帧；检测模块，用于采用预设模型对所述待检测的图像帧中的目标对象进行检测，得到所述待检测的图像帧中所述目标对象的检测结果，其中，所述检测结果至少用于表示所述目标对象所属的类型和所述目标对象所对应的检测框的位置，所述预设模型中至少包括：分类头和定位头，所述分类头用于计算分类结果，所述定位头用于确定检测框的位置坐标。

10、根据本申请实施例的又一方面，还提供了一种计算机设备，包括：存储器和处理器，其中，存储器用于存储程序指令；处理器，与存储器连接，用于执行上述目标对象检测方法。

11、根据本申请实施例的再一方面，还提供了一种非易失性存储介质，该非易失性存储介质包括存储的计算机程序，其中，该非易失性存储介质所在设备通过运行计算机程序执行上述目标对象检测方法。

12、根据本申请实施例的再一方面，还提供了一种计算机程序产品，包括计算机指令，该计算机指令被处理器执行时实现上述目标对象检测方法。

13、在本申请实施例中，通过获取待检测视频流；从所述待检测视频流中提取待检测的图像帧；采用预设模型对所述待检测的图像帧中的目标对象进行检测，得到所述待检测的图像帧中所述目标对象的检测结果，其中，所述检测结果至少用于表示所述目标对象所属的类型和所述目标对象所对应的检测框的位置，所述预设模型中至少包括：分类头和定位头，所述分类头用于计算分类结果，所述定位头用于确定检测框的位置坐标，达到了在预设模型中的头部至少拆分成分类头和定位头，进而避免定位和分类互相干扰的目的，从而实现了提升目标检测准确率的技术效果，进而解决了相关技术中的目标检测模型对目标对象的检测准确率较低的技术问题。

本文档来自技高网...

【技术保护点】

1.一种目标对象检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，采用预设模型对所述待检测的图像帧中的目标对象进行检测，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，在输出所述待检测的图像帧中所述目标对象的检测结果之后，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，创建与所述标识符相关联的状态字典，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述告警区域通过以下方式确定，包括：

8.一种目标对象检测装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括：存储器和处理器，其中，所述存储器用于存储程序指令；所述处理器，与所述存储器连接，用于执行权利要求1至7中任意一项所述的目标对象检测方法。

10.一种计算机程序产品，包括计算机指令，其特征在于，所述计算机指令被处理器执行时实现权利要求1至7中任意一项所述的目标对象检测方法。

...

【技术特征摘要】

1.一种目标对象检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，采用预设模型对所述待检测的图像帧中的目标对象进行检测，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，在输出所述待检测的图像帧中所述目标对象的检测结果之后，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，创建与所述标识符相关联的状态字典，包括：

6.根据权利要求5所述的方法，其特征在...

【专利技术属性】
技术研发人员：高学义，杨娟，刘江，谢征，
申请(专利权)人：中电信人工智能科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人