目标检测方法及设备技术

技术编号:30271586 阅读:18 留言:0更新日期:2021-10-09 21:27
本公开提供一种目标检测方法及设备。该方法包括:确定待检测图像;通过多路自编码神经网络对待检测图像进行目标检测,得到目标检测结果,多路编码器包括分路编码器和分路解码器,其中,分路编码器和分路解码器中的至少一种的数量为多个。从而,通过包含多路编码器和/或多路解码器的多路自编码神经网络这一网络结构,提高了对图像进行目标检测的准确性。提高了对图像进行目标检测的准确性。提高了对图像进行目标检测的准确性。

【技术实现步骤摘要】
目标检测方法及设备


[0001]本公开涉及计算机
,尤其涉及一种目标检测方法及设备。

技术介绍

[0002]随着人工智能领域中计算机视觉(Computer Vision,CV)、机器学习等多种技术的逐渐兴起和进步,摄像机和图像处理设备能够代替人眼,更高效率地对目标进行检测、识别、跟踪、计数等。其中,目标检测是目标识别、跟踪、计数的基本任务。
[0003]目标检测需要在图像中找到目标所在的位置。目前,可以通过卷积神经网络(Convolutional Neural Networks, CNN)进行目标检测,还可以利用处于运动状态的目标与图像背景的差值,在图像中区分出目标。然而,目标检测的场景较为复杂,例如,不同目标之间的相互遮挡、场景光线变化、目标运动或静止,影响了检测准确性。
[0004]因此,目标检测的准确性有待提高。

技术实现思路

[0005]本公开提供一种目标检测方法及设备,用以解决目标检测的准确性不高的问题。
[0006]第一方面,本公开提供一种目标检测方法,包括:确定待检测图像;通过多路自编码神经网络对所述待检测图像进行目标检测,得到目标检测结果,所述多路自编码神经网络包括分路编码器和分路解码器,其中,所述分路编码器和所述分路解码器中至少一种的数量为多个。
[0007]第二方面,本公开提供一种目标检测设备,包括:确定模块,用于确定待检测图像;检测模块,用于通过多路自编码神经网络对所述待检测图像进行目标检测,得到目标检测结果,所述多路自编码神经网络包括分路编码器和分路解码器,其中,所述分路解码器和所述分路解码器中至少一种的数量为多个。
[0008]第三方面,本公开提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述第一方面及第一方面各种可能的设计所述的目标检测方法。
[0009]第四方面,本公开提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述第一方面及第一方面各种可能的设计所述的目标检测方法。
[0010]第五方面,本公开提供一种计算机程序产品,所述计算机程序产品包含计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述第一方面及第一方面各种可能的设计所述的目标检测方法。
[0011]本公开提供的目标检测方法及设备,通过多路自编码神经网络对待检测图像进行
目标检测,得到目标检测结果,其中,多路自编码神经网络包括分路编码器和分路解码器,分路编码器和分路解码器中至少一种的数量为多个。从而,基于多路自编码神经网络中多个分路编码器和/或多个分路解码器这一网络结构,提高了目标检测过程中神经网络学习图像特征的丰富性、准确性,进而提高了图像中时目标检测的准确性。
附图说明
[0012]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0013]图1为本公开实施例适用的图像处理系统的架构示意图;图2是本公开的一实施例提供的目标检测方法的流程示意图;图3是本公开的另一实施例提供的目标检测方法的流程示意图;图4为本公开实施例提供的多路自编码神经网络的结构示意图;图5为本公开实施例提供的双路自编码神经网络的结构示意图;图6为图5中分路编码器A中的编码模块Ai的结构示例图;图7为图5中分路编码器B中的编码模块Bi的结构示例图;图8为图6中编码模块Ai的子编码模块subA1、subA2的结构示例图;图9为图7中编码模块Bi的子编码模块subB1、subB2的结构示例图;图10为图5中分路解码器A中的解码模块Ai的结构示例图;图11为图5中分路解码器B中的解码模块Bi的结构示例图;图12为图10中解码模块Ai的子解码模块desubA1、desubA2的结构示例图;图13为图11中解码模块Bi的子解码模块desubB1、desubB2的结构示例图;图14为本公开实施例提供的深度相机的爆炸图;图15为本公开的一实施例提供的目标检测设备的结构示意图;图16为本公开的一实施例提供的一种电子设备的结构示意图;图17为本公开的一实施例提供的目标检测装置1700的框图。
[0014]通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
[0015]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0016]首先对本公开实施例所涉及的名词进行解释:自编码神经网络:一种无监督学习的神经网络,其网络结构中包括编码器和解码器;多路自编码神经网络:本公开实施例设计的一种自编码神经网络,多路是指自编码神经网络中的多路编码器(多个并列的编码器)和/或多路解码器(多个并列的解码器);
分路编码器:即编码器,考虑到多路自编码神经网络中可能包含多个并列的编码器,在本公开实施例中,将多路自编码神经网络中的编码器称为分路编码器;分路解码器:即解码器,考虑到多路自编码神经网络中可能包含多个并列的解码器,在本公开实施例中,将多路自编码神经网络中的解码器称为分路解码器;目标检测:检测出现在图像中的目标,目标可以为如下至少一种:人、物体,物体例如车辆、动物、植物;其中,目标检测是目标识别、目标跟踪、目标技术的基本任务。
[0017]参考图1,图1为本公开实施例适用的图像处理系统的架构示意图。如图1所示,该图像处理系统包括:图像采集设备101以及图像处理设备102,两者例如通过网络进行通信。图像采集设备101将拍摄的图像发送至图像处理设备102,图像处理设备102对来自图像采集设备101的图像进行目标检测。
[0018]其中,图像采集设备101例如可以为摄像头或者带有摄像头的终端(例如,手机、平板电脑、计算机、智能可穿戴设备),图像处理设备102可以为具有图像处理能力的终端(例如,手机、平板电脑、计算机、智能可穿戴设备)或者服务器(单个服务器或者服务器群)。图1以图像采集设备101为摄像头、以图像处理设备102为服务器为例。
[0019]本公开具体的应用场景为目标检测场景,例如,车辆检测场景、人体检测场景,人体检测场景又如人员计数场景。
[0020]以人员计数为例,通常的,人员计数的一种方式是,通过人工+手持终端的方式进行人工的拉网式排查,乘务人员通过手持终端检测每个坐席上乘客的身份、车次信息,该方式费时费力,且乘客位置移动后容易出现漏检;人员计数的另一种方式是,利用可见光的当前帧图像和参考帧图像之间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:确定待检测图像;通过多路自编码神经网络对所述待检测图像进行目标检测,得到目标检测结果,所述多路自编码神经网络包括分路编码器和分路解码器,其中,所述分路解码器和所述分路解码器中至少一种的数量为多个。2.根据权利要求1所述的目标检测方法,其特征在于,所述通过多路自编码神经网络对所述待检测图像进行目标检测,得到目标检测结果,包括:通过所述多路自编码神经网络中各所述分路编码器对所述待检测图像进行特征编码,得到各所述分路编码器输出的图像特征;通过所述多路自编码神经网络中各所述分路解码器对来自所述分路编码器的图像特征进行特征解码,得到各所述分路解码器输出的图像特征;根据各所述分路解码器输出的图像特征,确定所述目标检测结果。3.根据权利要求2所述的目标检测方法,其特征在于,所述分路编码器的数量与所述分路解码器的数量相同,所述分路编码器与所述分路解码器一一对应;所述通过所述多路自编码神经网络中各所述分路解码器对来自所述分路编码器的图像特征进行特征解码,得到各所述分路解码器输出的图像特征,包括:针对所述多路自编码神经网络中各所述分路解码器,通过所述分路解码器对来自对应的分路编码器的图像特征进行特征解码,得到所述分路解码器输出的图像特征。4.根据权利要求2所述的目标检测方法,其特征在于,所述分路编码器的数量与所述分路解码器的数量不同,单个所述分路解码器对应至少一个所述分路编码器;所述通过所述多路自编码神经网络中各所述分路解码器对来自所述分路编码器的图像特征进行特征解码,得到各所述分路解码器输出的图像特征,包括:针对所述多路自编码神经网络中各所述分路解码器,通过所述分路解码器对来自对应的至少一个分路编码器的图像特征进行特征解码,得到所述分路解码器输出的图像特征。5.根据权利要求2所述的目标检测方法,其特征在于,所述分路编码器包括多个串联的编码模块,所述分路解码器包括多个串联的解码模块;所述通过所述多路自编码神经网络中各所述分路编码器对所述待检测图像进行特征编码,得到各所述分路编码器输出的图像特征,包括:针对所述多路自编码神经网络中各所述分路编码器,依次通过所述分路编码器中的多个编码模块对所述待检测图像进行特征编码,得到所述分路编码器中最后一个编码模块输出的图像特征;所述通过所述多路自编码神经网络中各所述分路解码器对来自所述分路编码器的图像特征进行特征解码,得到各所述分路解码器输出的图像特征,包括:针对所述多路自编码神经网络中各所述分路解码器,依次通过所述分路解码器中的多个解码模块对来自所述分路编码器的图像特征进行特征解码,得到所述分路解码器中最后一个解码模块输出的图像特征。6.根据权利要求5所述的目标检测方法,其特征在于,所述编码模块包括卷积层和子...

【专利技术属性】
技术研发人员:周波段炼苗瑞
申请(专利权)人:深圳市海清视讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1