一种优化视频目标检测、识别或分割的精度和效率的方法技术

技术编号:27491474 阅读:12 留言:0更新日期:2021-03-02 18:10
本发明专利技术提供了一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。其中本发明专利技术的有益效果是:本方法利用邻近帧的识别结果,先预测当前帧的待检测子区域,再在含有目标物的待检测子区域进行处理,不需要对无关背景进行处理,极大的减少了处理所需的运算量,提升了运算效率;同时,由于运算主要集中在含有目标物的子区域,与传统技术相比,采用本发明专利技术进行检测、识别或分割处理的准确率更高。别或分割处理的准确率更高。别或分割处理的准确率更高。

【技术实现步骤摘要】
一种优化视频目标检测、识别或分割的精度和效率的方法


[0001]本专利技术涉及视频处理领域,特别涉及一种优化视频目标检测、识别或分割的精度和效率的方法。

技术介绍

[0002]视频目标检测、识别或分割是计算机视觉核心问题之一,广泛应用于工业制造、自动驾驶、安防、新零售、影视文娱业等各种工业场景。高精度和高效率一直是视频目标检测、识别和分割问题的重点和难点。
[0003]然而现有技术中视频目标检测、识别或分割系统的处理精度通常比较低,运算耗时比较长,且无法有效的对于多目标小目标进行检测、识别或分割处理。

技术实现思路

[0004]为了解决上述技术问题,本专利技术中披露了一种优化视频目标检测、识别或分割的精度和效率的方法,本专利技术的技术方案是这样实施的:
[0005]给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。
[0006]优选地,所述方法包括步骤如下:
[0007]S1:通过识别模块计算与后处理得到当前帧目标物的初步识别结果;
[0008]S2:通过初步识别结果计算得到当前帧目标物的待检测子区域;
[0009]S3:通过识别模块仅对当前帧目标物的待检测子区域进行预测,得到优化后的识别结果和对应目标物的精确子区域;
[0010]S3.1:根据优化后的识别结果和目标物的精确子区域得到当前帧视频的最终处理结果;
[0011]S4:仅对当前帧得到的目标物的精确子区域进行位置预测后得到下一待处理帧目标物的待检测子区域;
[0012]S5:下一待处理帧目标物的待检测子区域作为当前帧目标物的待检测子区域并回到S3。
[0013]优选地,还包括S4.1:下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id保持一致。
[0014]优选地,所述S1中目标物的数量为2个或2个以上。
[0015]优选地,还包括S4.2:通过分析模块仅判断下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id是否一致;如果一致,进行S5,如果不一致,仅对下一待处理帧目标物的待检测子区域通过重识别模块获得修正后的下一待处理帧目标物的待检测子区域。
[0016]优选地,还包括S4.3:通过分析模块仅判断修正后的下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id是否一致;如果一致,进行S5,如果不一致,回到
S3。
[0017]优选地,所述识别结果和所述处理结果包括目标中心位置、识别框、二值图、alpha遮罩图或各个像素的分类概率图。
[0018]优选地,所述位置预测包括仿射变换、透视变换、模版匹配、数学形态学操作或根据简单规律增加删除。
[0019]优选地,所述识别模块包括图片或视频的目标检测技术、关键点追踪技术、目标分割技术、显著物体分割技术、抠图模块、深度神经网络技术、超像素技术、聚类技术或滤波技术。
[0020]优选地,所述方法用于嫁接至现有视频目标检测、识别或分割系统。
[0021]实施本专利技术的技术方案可解决现有技术中视频目标检测、识别或分割处理计算量过大,精度不够,速度过慢的技术问题;实施本专利技术的技术方案,可以利用邻近帧的识别结果,先预测当前帧的待检测子区域,再在含有目标物的待检测子区域进行处理,不需要对无关背景进行处理,极大的减少了处理所需的运算量,提升了运算效率,同时,由于运算主要集中在含有目标物的子区域,与传统技术相比,采用本专利技术进行检测、识别或分割处理的准确率更高,待处理帧可以是连续视频中的下一帧图像,也可以是隔了几帧之前或之后的图像,本专利在视频目标检测、识别或分割处理中,减少了运算量,提升运算速度,提升了视频目标检测、识别或分割处理精度。
附图说明
[0022]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一种实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本专利技术的流程示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]实施例1
[0026]在一种具体的实施例1中,一种优化视频目标检测、识别或分割的精度和效率的方法,给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。
[0027]本实施例具体步骤如下:
[0028]S1:通过识别模块计算与后处理得到当前帧目标物的初步识别结果;
[0029]S2:通过初步识别结果计算得到当前帧目标物的待检测子区域;
[0030]S3:通过识别模块仅对当前帧目标物的待检测子区域进行预测,得到优化后的识别结果和对应目标物的精确子区域;
[0031]S3.1:根据优化后的识别结果和目标物的精确子区域得到当前帧视频的最终处理结果;
[0032]S4:仅对当前帧得到的目标物的精确子区域进行位置预测后得到下一待处理帧目标物的待检测子区域;
[0033]S5:下一待处理帧目标物的待检测子区域作为当前帧目标物的待检测子区域并回到S3。
[0034]本实施例提出了一种有别于传统视频目标检测、识别或分割处理的方法,传统视频目标检测、识别或分割处理总是需要对整个视频做处理,运算量大,非常影响视频目标检测、识别或分割处理的效率和精度,那么本实施例给出了一种新的视频目标检测、识别或分割处理方法,通过前序帧的识别结果先预测后续待处理帧的待检测子区域,之后仅在该待检测子区域中进行识别计算。后续的视频目标检测、识别或分割处理也仅需在预测得到的待检测子区域进行计算即可,而无关的背景则不需要处理,这样大大减少了运算量,提升了运算效率,且视频目标检测、识别或分割处理的精度也大大提升了。预测得到的后续待处理帧的待检测子区域为包含需要进行视频目标检测、识别或分割处理的目标的区域。目标物的精确子区域是指通过识别模块计算得到的最终精确的目标物所在的子区域。待处理帧可以是连续视频中的下一帧图像,也可以是隔了几帧之后或之前的视频图像。另外本方法的处理由于仅在待检测子区域内进行,对无关背景就不需要处理,减少了运算量,运算速度大大提升,处理时定位目标物更精确,处理结果更精细,分辨率也更高,由于视频都是连续的,第一帧位置已知,可以预测下一待处理帧的目标物位置,采用本方法进行视频目标检测、识别或分割处理,结果更精确,处理效果更好,本方法通过临近帧可得到当前帧目标物的精确位置,在对视频中多目标、小目标进行处理时精度分割损失更小。本方法适配本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:给定一段视频序列帧,获得当前帧的识别结果,预测后续待处理帧的待检测子区域,然后仅在该待检测子区域中进行识别计算。2.根据权利要求1所述的一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:所述方法包括步骤如下:S1:通过识别模块计算与后处理得到当前帧目标物的初步识别结果;S2:通过初步识别结果计算得到当前帧目标物的待检测子区域;S3:通过识别模块仅对当前帧目标物的待检测子区域进行预测,得到优化后的识别结果和对应目标物的精确子区域;S3.1:根据优化后的识别结果和目标物的精确子区域得到当前帧视频的最终处理结果;S4:仅对当前帧得到的目标物的精确子区域进行位置预测后得到下一待处理帧目标物的待检测子区域;S5:下一待处理帧目标物的待检测子区域作为当前帧目标物的待检测子区域并回到S3。3.根据权利要求2所述的一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:还包括S4.1:下一待处理帧目标物的待检测子区域与S3中的目标物的精确子区域id保持一致。4.根据权利要求3所述的一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:所述S1中目标物的数量为2个或2个以上。5.根据权利要求4所述的一种优化视频目标检测、识别或分割的精度和效率的方法,其特征在于:还包括S4.2:通过分析模块仅判断下一待处理帧目标物的待...

【专利技术属性】
技术研发人员:赵维杰富宸徐孝成
申请(专利权)人:上海卫莎网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1