当前位置: 首页 > 专利查询>罗官专利>正文

一种对低亮环境下视频识别的方法和装置制造方法及图纸

技术编号:28467170 阅读:16 留言:0更新日期:2021-05-15 21:33
本申请提供一种对低亮环境下视频识别的方法和装置。该方法通过定位目标形状图,运用搜索算法计算相似图片区块集合;提取各相似图片区块中心点得到特征向量,输入去噪模型得到最终结果。由于将交并比技术引入了低亮图像检测中,并结合后续局部搜索方法以及去噪网络,极大的提高了在低亮图像中的目标识别准确率。极大的提高了在低亮图像中的目标识别准确率。极大的提高了在低亮图像中的目标识别准确率。

【技术实现步骤摘要】
一种对低亮环境下视频识别的方法和装置


[0001]本专利技术涉及图像识别领域,特别涉及一种对低亮环境下视频识别的方法和装置。

技术介绍

[0002]虽然目前对于图片、视频等的图像识别技术发展很快,但针对曝光时间不够,低亮条件下图像数据,其噪声会显著提升,从而会对视频造成严重影响,这极大的降低了图像识别的准确率,并阻碍了其在许多应用场景的应用。因此,低亮识别在视频处理中显得至关重要。
[0003]现有技术中更多是利用CNN或者patch的方法实现低亮识别,但前者识别准确率不够理想、后者虽然准确率有所提高,但计算成本过高,在高分辨率情况下尤为明显。

技术实现思路

[0004]本专利技术针对上述问题,提出了一种对低亮环境下视频识别的方法和装置,首先定位目标形状图;通过搜索算法计算相似图片区块集合;提取各相似图片区块中心点得到特征向量,输入去噪模型得到最终结果。
[0005]有鉴于此,本专利技术提出了一种对低亮环境下视频识别的方法,首先输入视频帧,使用Tiny

Yolo模型对每一帧进行目标检测,输出图像中的目标位置,可选用边框对目标进行标注: Lij=(xi,yi,wi,hi)i 其中,i表示第i个视频帧,j表示在该视频帧下的第j个目标,x、y、w、h分别表示相应边框的左上角横坐标、纵坐标、宽以及高。
[0006]对各目标进行编号,通过交并比技术对视频帧中的目标进行跟踪,获得视频帧的目标信息;从接收到第一个视频帧开始时,为每一视频帧中的每个目标进行编号,对第i个视频帧的编号如下:其中,表示第i个视频帧的第j个目标的编号;并从接收第二个视频帧的目标位置信息开始,计算当前视频帧所有目标位置与上一视频帧所有目标位置的iou值:;其中,表示第i个视频帧中第k个目标与第i

1个视频帧中所有目标的iou值,即对于第二个视频帧,计算其所有目标位置与第一个视频帧所有目标位置的iou值;对于第三个视频帧,计算其所有目标位置与第二个视频帧所有目标位置的iou值,依此类推;获取中的最大值,当该最大值大于预设阈值ciou时,则判定该目标与前一视频帧中对应的目标为同一目标,如果在前一视频帧中找不到符合条件的目标,则给
该目标新编一个编号:即判断该目标为当前视频帧中新出现的目标。
[0007]通过局部搜索算法,对于每帧图片中的每类目标检测框区域中的中心点所对应的图片区块,在相邻帧的同类目标检测框区域中计算各个像素点的多个与其相似的图片区块组成图片区块集合。
[0008]去噪模型由全局patch搜索算法和多个CNN组成的去噪网络构成,对相邻帧的同类检测框进行去噪。
[0009]具体地,所述通过局部搜索算法,对于每帧图片中的每类目标检测框区域中的中心点所对应的图片区块,在相邻帧的同类目标检测框区域中计算各个像素点的多个与其相似的图片区块组成图片区块集合包括:通过局部搜索算法,对每帧的每类目标检测框区域中的像素点所对应的,在相邻帧的同类目标检测框区域中计算n个最相似的,其中,表示以第t帧中类别为k的检测区域的x像素为中心的patch;表示区域内与最相似的n个patch构成的集合,。
[0010]将得到的图片块集合中的中心点聚集起来构成特征向量,将特征向量输入去噪模型后得到目标检测框对应的改进图像。
[0011]此外,本专利技术还请求保护一种对低亮环境下视频识别的装置。
[0012]该装置包括:目标定位模块,根据输入视频帧,使用Tiny

Yolo模型对每 一帧进行目标检测,输出图像中的目标位置,可选用边框对目标进行标注: Lij=(xi,yi,wi,hi)i 其中,i表示第i个视频帧,j表示在该视频帧下的第j个目标,x、y、w、h分别表示相应边框的左上角横坐标、纵坐标、宽以及高。
[0013]对各目标进行编号,通过交并比技术对视频帧中的目标进行跟踪,获得视频帧的目标信息; 从接收到第一个视频帧开始时,为每一视频帧中的每个目标进行编号,对第i个视频帧的编号如下:其中,表示第i个视频帧的第j个目标的编号;并从接收第二个视频帧的目标位置信息开始,计算当前视频帧所有目标位置与上
一视频帧所有目标位置的iou值:;其中,表示第i个视频帧中第k个目标与第i

1个视频帧中所有目标的iou值,即对于第二个视频帧,计算其所有目标位置与第一个视频帧所有目标位置的iou值;对于第三个视频帧,计算其所有目标位置与第二个视频帧所有目标位置的iou值,依此类推;获取中的最大值,当该最大值大于预设阈值ciou时,则判定该目标与前一视频帧中对应的目标为同一目标,如果在前一视频帧中找不到符合条件的目标,则给该目标新编一个编号:即判断该目标为当前视频帧中新出现的目标。
[0014]搜索算法模块:通过局部搜索算法,对于每帧图片中的每类目标检测框区域中的中心点所对应的图片区块,在相邻帧的同类目标检测框区域中计算各个像素点的多个与其相似的图片区块组成图片区块集合包括:通过局部搜索算法,对每帧的每类目标检测框区域中的像素点所对应的,在相邻帧的同类目标检测框区域中计算n个最相似的,其中,表示以第t帧中类别为k的检测区域的x像素为中心的patch;表示区域内与最相似的n个patch构成的集合,。
[0015]去噪模块:该模块包括去噪模型,该去噪模型由全局patch搜索算法和多个CNN组成的去噪网络构成,对相邻帧的同类检测框进行去噪。将得到的图片块集合中的中心点聚集起来构成特征向量,将特征向量输入去噪模型后得到目标检测框对应的改进图像。
[0016]专利技术的有益效果根据本专利技术实施例提出的一种对低亮环境下视频识别的方法和装置,通过定位目标形状图;通过搜索算法计算相似图片区块集合;提取各相似图片区块中心点得到特征向量,输入去噪模型得到最终结果。本专利技术创新性的将交并比技术引入了低亮图像检测中,并结合后续局部搜索方法以及去噪网络,极大的提高了在低亮图像中的目标识别准确率。
附图说明
[0017]为了更清楚地说明本公开实施例的技术方案,下面将对实施例的描述中所需要使用的附图作简单的介绍。下面描述中的附图仅仅是本公开的示例性实施例。
[0018]图1为本专利技术的对低亮环境下视频识别的方法流程图;图2为本专利技术的对低亮环境下视频识别的装置;
具体实施方式
[0019]为了使得本公开的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。基于本公开中描述的本公开实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本公开的保护范围之内。
[0020]需要注意的是,在本说明书和附图中,具有基本上相同步骤和元素用相同的附图标记来表示,且对这些步骤和元素的重复描述将被省略。
[0021]本专利技术针对上述问题,提出了一种对低亮环境下视频识别的方法及装置,首本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对低亮环境下视频识别的方法,该方法包括:输入视频帧,使用Tiny

Yolo模型对每一帧进行目标检测,输出图像中的目标位置;通过局部搜索算法,对于每帧图片中的每类目标检测框区域中的中心点所对应的图片区块,在相邻帧的同类目标检测框区域中计算各个像素点的多个与其相似的图片区块组成图片区块集合;将得到的图片块集合中的中心点聚集起来构成特征向量,将特征向量输入去噪模型后得到目标检测框对应的改进图像。2.如权利要求1所述的对低亮环境下视频识别的方法,所述使用Tiny

Yolo模型对每一帧进行目标检测,输出图像中的目标位置包括:选用边框对目标进行标注: Lij=(xi,yi,wi,hi)i其中,i表示第i个视频帧,j表示在该视频帧下的第j个目标,x、y、w、h分别表示相应边框的左上角横坐标、纵坐标、宽以及高;对各目标进行编号,通过交并比技术对视频帧中的目标进行跟踪,获得视频帧的目标信息;从接收到第一个视频帧开始时,为每一视频帧中的每个目标进行编号,对第i个视频帧的编号如下: 其中, 表示第i个视频帧的第j个目标的编号; 并从接收第二个视频帧的目标位置信息开始,计算当前视频帧所有目标位置与上一视频帧所有目标位置的iou值: ;其中, 表示第i个视频帧中第k个目标 与第i

1个视频帧中所有目标 的iou值,即对于第二个视频帧,计算其所有目标位置与第一个视频帧所有目标位置的iou值;对于第三个视频帧,计算其所有目标位置与第二个视频帧所有目标位置的iou值,依此类推;获取 中的最大值,当该最大值大于预设阈值ciou时,则判定该目标 与前一视频帧中对应的目标 为同一目标,如果在前一视频帧中找不到符合条件的目标,则给该目标新编一个编号:即判断该目标为当前视频帧中新出现的目标。3.如权利要求1所述的对低亮环境下视频识别的方法,所述通过局部搜索算法,对于每帧图片中的每类目标检测框区域中的中心点所对应的图片区块,在相邻帧的同类目标检测框区域中计算各个像素点的多个与其相似的图片区块组成图片区块集合包括:通过局部搜索算法,对每帧的每类目标检测框区域 中的像素点所对应的 ,在相邻帧的同类目标检测框区域 中计算n个最相似的 ,其中, 表示以第t帧中类别为k的检测区域的x像素为中心的patch; 表示区域 内与 最相似的n个patch构成的集合, 。4.一种对低亮环境下视频识别的装置,该装置包括:目标定位模块,向所述目标定位模块输入视频帧,使用Tiny

Yolo模型对每一帧进行目标检测,输出图像中的目标位置;搜索算法模块,所述搜索算法模块通过局部搜索算法...

【专利技术属性】
技术研发人员:罗官
申请(专利权)人:罗官
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1