基于视频获取目标人物的方法和装置制造方法及图纸

技术编号：20820657 阅读：23 留言：0更新日期：2019-04-10 06:08

本公开提供了一种基于视频获取目标人物的方法，对获取的包含目标人物的图片进行人脸检测操作；对视频中每隔预设时间抽出的帧的人脸图像全部进行选取，并进行保存；将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配；对匹配成功的目标人物的图片进行展示。该方法涉及一种半自动的基于机器学习在视频中准备训练数据的方式，帮助数据人员为人脸识别模型准备训练数据时，数据准备不齐全，种类单一，清洗难度大的问题，实现对视频中目标人物的实时比对性，且具有易用性与适用性。本公开还提供了一种基于视频获取目标人物的装置。

全部详细技术资料下载

【技术实现步骤摘要】
基于视频获取目标人物的方法和装置
本公开涉及视频图像处理
，具体而言，涉及一种基于视频获取目标人物的方法和装置。
技术介绍
现有技术中，为了基于连续的视频，训练目标人物的识别操作，需要准备大量的训练数据。一般的，每个目标人物训练所需的图片在500～1000张左右，才能达到较好的准确度。加之，根据工作场景需要，目标人物的权重需要会有变动，需要不断扩充或者更新已有的目标人物的识别模型。这对数据准备工作是一个严重的挑战。需要说明的是，不论是在网络图库中采集目标人物的图片，还是在特定场景中截图，无论哪一种方式，都需要人工去参与，都存在各自的缺陷：在网络图库中获取的目标人物的图片的质量参差不齐，很多照片不符合模型训练的需求。其次，截图纯依赖人工，效率低下，能够保证目标人物照片的质量但是产出量不足。人脸识别模型中用作训练的最终数据是人脸，清洗后的图片是单人还好，如果是多人会对训练的模型有影响。
技术实现思路
为了解决现有技术中由于不论是在网络图库中采集目标人物的图片，还是在特定场景中截图，都需要人工去参与，且抓取的目标人物的图片的质量参差不齐的问题，本公开实施例提供了一种基于视频获取目标人物的方法和装置，具体涉及一种半自动的基于机器学习在视频中准备训练数据的方式，帮助数据人员为人脸识别模型准备训练数据时，数据准备不齐全，种类单一，清洗难度大的问题。数据人员提供包含预训练目标人物的网络照片以及标准照；对目标人物的标准照进行人脸检测、关键点提取、局部特征描述子生成后，把目标人物的局部特征描述子保存起来。再次，对视频中每隔预设时间抽一帧，将帧中的人脸抠出来，保存为图片，最...

【技术保护点】
1.一种基于视频获取目标人物的方法，其特征在于，包括以下步骤：对获取的包含目标人物的图片进行人脸检测操作；对视频中每隔预设时间抽出的帧的人脸图像全部进行选取，并进行保存；将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配；对匹配成功的所述目标人物的图片进行展示。

【技术特征摘要】
1.一种基于视频获取目标人物的方法，其特征在于，包括以下步骤：对获取的包含目标人物的图片进行人脸检测操作；对视频中每隔预设时间抽出的帧的人脸图像全部进行选取，并进行保存；将经过人脸检测操作的图片与视频帧中选取的人脸图像进行匹配；对匹配成功的所述目标人物的图片进行展示。2.根据权利要求1所述的基于视频获取目标人物的方法，其特征在于，还包括：预先获取包含目标人物的图片，其中，针对每个所述目标人物获取面部正面图片、面部左侧图片以及面部右侧图片三张图片。3.根据权利要求1所述的基于视频获取目标人物的方法，其特征在于，所述对获取的包含目标人物的图片进行人脸检测操作包括：针对所述目标人物的人脸上的关键点进行提取，并对提取到的关键点完成特征标记；通过预先设置的关键点的权重计算与预设算法完成人脸检测操作；其中，所述预设算法为基于对称差分法与混合高斯模型的背景差分法融合的算法，假设采用三个连续帧取代两帧，视频序列连续三帧源图像为I(X，t-1)，I(X，t)以及I(X，t+1)，计算相邻两帧源图像的绝对差灰度图像D(t-1，t)(x，y)和D(t，t+1)(x，y)，公式：D(t-1，t)(x，y)＝|W@I(X，t)-W@I(X，t-1)|；D(t，t+1)(x，y)＝|W@I(X，t+1)-W@I(X，t)|；其中，W是一个抑制噪声的窗口函数；对D(t-1，t)(x，y)和D(t，t+1)(x，y)分别取阈值T1进行二值化，获取两个二值化图像B(t-1，t)(x，y)和B(t，t+1)(x，y)；将B(t-1，t)(x，y)和B(t，t+1)(x，y)在每个像素位置进行逻辑与操作，获取对称差分结果二值图像，公式为：D(s，t)(x，y)＝1(ifB(t-1，t)(x，t)(x，y)HB(t，t+1)(x，y))；D...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：北京洛必达科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人