基于视频获取目标人物的方法和装置制造方法及图纸

技术编号:20820657 阅读:23 留言:0更新日期:2019-04-10 06:08
本公开提供了一种基于视频获取目标人物的方法,对获取的包含目标人物的图片进行人脸检测操作;对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;对匹配成功的目标人物的图片进行展示。该方法涉及一种半自动的基于机器学习在视频中准备训练数据的方式,帮助数据人员为人脸识别模型准备训练数据时,数据准备不齐全,种类单一,清洗难度大的问题,实现对视频中目标人物的实时比对性,且具有易用性与适用性。本公开还提供了一种基于视频获取目标人物的装置。

【技术实现步骤摘要】
基于视频获取目标人物的方法和装置
本公开涉及视频图像处理
,具体而言,涉及一种基于视频获取目标人物的方法和装置。
技术介绍
现有技术中,为了基于连续的视频,训练目标人物的识别操作,需要准备大量的训练数据。一般的,每个目标人物训练所需的图片在500~1000张左右,才能达到较好的准确度。加之,根据工作场景需要,目标人物的权重需要会有变动,需要不断扩充或者更新已有的目标人物的识别模型。这对数据准备工作是一个严重的挑战。需要说明的是,不论是在网络图库中采集目标人物的图片,还是在特定场景中截图,无论哪一种方式,都需要人工去参与,都存在各自的缺陷:在网络图库中获取的目标人物的图片的质量参差不齐,很多照片不符合模型训练的需求。其次,截图纯依赖人工,效率低下,能够保证目标人物照片的质量但是产出量不足。人脸识别模型中用作训练的最终数据是人脸,清洗后的图片是单人还好,如果是多人会对训练的模型有影响。
技术实现思路
为了解决现有技术中由于不论是在网络图库中采集目标人物的图片,还是在特定场景中截图,都需要人工去参与,且抓取的目标人物的图片的质量参差不齐的问题,本公开实施例提供了一种基于视频获取目标人物的方法和装置,具体涉及一种半自动的基于机器学习在视频中准备训练数据的方式,帮助数据人员为人脸识别模型准备训练数据时,数据准备不齐全,种类单一,清洗难度大的问题。数据人员提供包含预训练目标人物的网络照片以及标准照;对目标人物的标准照进行人脸检测、关键点提取、局部特征描述子生成后,把目标人物的局部特征描述子保存起来。再次,对视频中每隔预设时间抽一帧,将帧中的人脸抠出来,保存为图片,最终,对人脸图片进行关键点提取,局部特征描述子生成,和目标人物的标准照的局部特征描述子逐一对比,计算其欧式距离,距离最小的判定为同一人,并将详细信息保存在数据库中。实现对视频中目标人物的实时比对性,且具有易用性与适用性。第一方面,本公开实施例提供了一种基于视频获取目标人物的方法,包括以下步骤:对获取的包含目标人物的图片进行人脸检测操作;对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;对匹配成功的所述目标人物的图片进行展示。在其中一个实施例中,还包括:预先获取包含目标人物的图片,其中,针对每个所述目标人物获取面部正面图片、面部左侧图片以及面部右侧图片三张图片。在其中一个实施例中,所述对获取的包含目标人物的图片进行人脸检测操作包括:针对所述目标人物的人脸上的关键点进行提取,并对提取到的关键点完成特征标记;通过预先设置的关键点的权重计算与预设算法完成人脸检测操作;其中,所述预设算法为基于对称差分法与混合高斯模型的背景差分法融合的算法,假设采用三个连续帧取代两帧,视频序列连续三帧源图像为I(X,t-1),I(X,t)以及I(X,t+1),计算相邻两帧源图像的绝对差灰度图像D(t-1,t)(x,y)和D(t,t+1)(x,y),公式:D(t-1,t)(x,y)=|W@I(X,t)-W@I(X,t-1)|;D(t,t+1)(x,y)=|W@I(X,t+1)-W@I(X,t)|;其中,W是一个抑制噪声的窗口函数;对D(t-1,t)(x,y)和D(t,t+1)(x,y)分别取阈值T1进行二值化,获取两个二值化图像B(t-1,t)(x,y)和B(t,t+1)(x,y);将B(t-1,t)(x,y)和B(t,t+1)(x,y)在每个像素位置进行逻辑与操作,获取对称差分结果二值图像,公式为:D(s,t)(x,y)=1(ifB(t-1,t)(x,t)(x,y)HB(t,t+1)(x,y));D(s,t)(x,y)=0(else)。在其中一个实施例中,还包括:通过针对人脸检测中的预设局部特征描述子对已完成特征标记的关键点进行描述,生成局部特征描述子集合。在其中一个实施例中,所述将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配包括:将通过针对人脸检测中的预设局部特征描述子对已完成特征标记的关键点进行描述,生成的局部特征描述子集合定义为第一集合;获取基于所述视频帧中选取的所述人脸图像的局部特征描述子集合,并定义为第二集合。在其中一个实施例中,还包括:将所述第一集合与多个所述第二集合进行逐一比对与计算;取所述第一集合与所述第二集合的计算结果的最小值进行存储。在其中一个实施例中,所述将所述第一集合与多个所述第二集合进行逐一比对与计算包括:通过欧式距离算法对所述第一集合与多个所述第二集合进行逐一比对与计算。第二方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的方法的步骤。第三方面,本公开实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法的步骤。第四方面,本公开实施例提供了一种基于视频获取目标人物的装置,所述装置包括:检测模块,用于对获取的包含目标人物的图片进行人脸检测操作;选取与保存模块,用于对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;匹配模块,用于将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;展示模块,用于对匹配成功的所述目标人物的图片进行展示。本专利技术提供的一种基于视频获取目标人物的方法和装置,对获取的包含目标人物的图片进行人脸检测操作;对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;对匹配成功的所述目标人物的图片进行展示。该方涉及一种半自动的基于机器学习在视频中准备训练数据的方式,帮助数据人员为人脸识别模型准备训练数据时,数据准备不齐全,种类单一,清洗难度大的问题。具体的,数据人员提供包含预训练目标人物的网络照片以及标准照;对目标人物的标准照进行人脸检测、关键点提取、局部特征描述子生成后,把目标人物的局部特征描述子保存起来。再次,对视频中每隔预设时间抽一帧,将帧中的人脸抠出来,保存为图片,最终,对人脸图片进行关键点提取,局部特征描述子生成,和目标人物的标准照的局部特征描述子逐一对比,计算其欧式距离,距离最小的判定为同一人,并将详细信息保存在数据库中,实现对视频中目标人物的实时比对性,且具有易用性与适用性。附图说明为了更清楚地说明本公开实施例的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍:图1为本专利技术一个实施例中的一种基于视频获取目标人物的方法的步骤流程示意图;图2为本专利技术另一实施例中的一种基于视频获取目标人物的方法的步骤流程示意图;以及图3为本专利技术一个实施例中的一种基于视频获取目标人物的装置的结构示意图。具体实施方式下面结合附图和实施例对本申请进行进一步的详细介绍。在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本公开的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例本文档来自技高网...

【技术保护点】
1.一种基于视频获取目标人物的方法,其特征在于,包括以下步骤:对获取的包含目标人物的图片进行人脸检测操作;对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;对匹配成功的所述目标人物的图片进行展示。

【技术特征摘要】
1.一种基于视频获取目标人物的方法,其特征在于,包括以下步骤:对获取的包含目标人物的图片进行人脸检测操作;对视频中每隔预设时间抽出的帧的人脸图像全部进行选取,并进行保存;将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配;对匹配成功的所述目标人物的图片进行展示。2.根据权利要求1所述的基于视频获取目标人物的方法,其特征在于,还包括:预先获取包含目标人物的图片,其中,针对每个所述目标人物获取面部正面图片、面部左侧图片以及面部右侧图片三张图片。3.根据权利要求1所述的基于视频获取目标人物的方法,其特征在于,所述对获取的包含目标人物的图片进行人脸检测操作包括:针对所述目标人物的人脸上的关键点进行提取,并对提取到的关键点完成特征标记;通过预先设置的关键点的权重计算与预设算法完成人脸检测操作;其中,所述预设算法为基于对称差分法与混合高斯模型的背景差分法融合的算法,假设采用三个连续帧取代两帧,视频序列连续三帧源图像为I(X,t-1),I(X,t)以及I(X,t+1),计算相邻两帧源图像的绝对差灰度图像D(t-1,t)(x,y)和D(t,t+1)(x,y),公式:D(t-1,t)(x,y)=|W@I(X,t)-W@I(X,t-1)|;D(t,t+1)(x,y)=|W@I(X,t+1)-W@I(X,t)|;其中,W是一个抑制噪声的窗口函数;对D(t-1,t)(x,y)和D(t,t+1)(x,y)分别取阈值T1进行二值化,获取两个二值化图像B(t-1,t)(x,y)和B(t,t+1)(x,y);将B(t-1,t)(x,y)和B(t,t+1)(x,y)在每个像素位置进行逻辑与操作,获取对称差分结果二值图像,公式为:D(s,t)(x,y)=1(ifB(t-1,t)(x,t)(x,y)HB(t,t+1)(x,y));D...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:北京洛必达科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1