一种人脸的智能跟踪方法及装置制造方法及图纸

技术编号：41236499 阅读：24 留言：0更新日期：2024-05-09 23:50

本发明专利技术公开了一种人脸的智能跟踪方法及装置，该方法包括：通过预先确定出的人脸检测模型，对目标训练视频执行数据预处理操作，得到视频预处理结果；其中，视频预处理结果包括目标训练视频中的若干帧图像数据；基于视频预处理结果以及预先确定出的训练用人脸跟踪模型，生成人脸跟踪训练结果；基于人脸跟踪训练结果以及视频预处理结果，计算训练用人脸跟踪模型的模型损失参数；判断模型损失参数是否满足预设的模型损失条件；若满足则将训练用人脸跟踪模型确定为目标人脸跟踪模型，并将目标检测视频输入至目标人脸跟踪模型，得到模型输出结果并确定目标检测视频的人脸跟踪结果。可见，实施本发明专利技术能够有利于提高实现视频中人脸跟踪的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频人脸跟踪，尤其涉及一种人脸的智能跟踪方法及装置。

技术介绍

1、随着科学技术的发展，人工智能技术迅猛崛起，各种视频智能处理技术应运而生，例如视频中的人脸检测、视频中的人脸识别等，已经广泛应用于人们的日常生活中。为了能够更好地对视频进行理解，需要持续识别视频中的内容变化，例如对视频中出现的人脸进行跟踪，能够更好地判断视频素材的标签类别以对视频进行处理。

2、目前，对于视频中的人脸检测通常是通过持续检测视频中每一帧中的人脸，从而实现人脸跟踪的。但是，这种方式存在计算成本高昂、效率低下的问题，进而对视频中的人脸跟踪带来了不便。可见，提供一种新的人脸跟踪技术以节省计算成本以及提高人脸跟踪的效率显得尤为重要。

技术实现思路

1、本专利技术所要解决的技术问题在于，提供一种人脸的智能跟踪方法及装置，能够节省在实现人脸跟踪过程中的计算成本，有利于提高实现视频中人脸跟踪的效率。

2、为了解决上述技术问题，本专利技术第一方面公开了一种人脸的智能跟踪方法，所述方法包括：

3、通过预先确定出的人脸检测模型，对目标训练视频执行数据预处理操作，得到视频预处理结果；其中，所述视频预处理结果包括所述目标训练视频中的若干帧图像数据；

4、基于所述视频预处理结果以及预先确定出的训练用人脸跟踪模型，生成人脸跟踪训练结果；

5、基于所述人脸跟踪训练结果以及所述视频预处理结果，计算所述训练用人脸跟踪模型的模型损失参数；

6、判断所述模

7、当判断出所述模型损失参数满足预设的所述模型损失条件时，将所述训练用人脸跟踪模型确定为目标人脸跟踪模型，并将目标检测视频输入至所述目标人脸跟踪模型，得到模型输出结果，并基于所述模型输出结果，确定所述目标检测视频的人脸跟踪结果。

8、作为一种可选的实施方式，在本专利技术第一方面中，所述通过预先确定出的人脸检测模型，对目标训练视频执行数据预处理操作，得到视频预处理结果，包括：

9、确定检测帧率及检测间隔，基于所述检测帧率及所述检测间隔并通过预先确定出的人脸检测模型，对所述目标训练视频执行图像帧抽取操作，得到若干帧备用视频图像；

10、从所有所述备用视频图像中确定出至少一个图像数据对，其中，每个所述图像数据对中包括至少两个所述备用视频图像，且每个所述图像数据对中所包括的所有所述备用视频图像均为连续抽取得到的图像；

11、对于每个所述图像数据对，确定该图像数据对中所包括的每个所述备用视频图像中的人脸坐标信息，基于该图像数据对中所包括的所有所述备用视频图像中的人脸坐标信息，确定该图像数据对的人脸偏移信息，并基于该图像数据对的人脸偏移信息，确定该图像数据对的数据对图像信息；其中，所述数据对图像信息包括图像标签信息、图像人脸坐标信息、图像人脸相似度信息；

12、根据所有所述图像数据对的数据对图像信息以及每个所述图像数据对中所包括的所有所述备用视频图像，生成视频预处理结果；

13、其中，所述视频预处理结果包括所有所述图像数据对的数据对图像信息以及每个所述图像数据对中所包括的所有所述备用视频图像。

14、作为一种可选的实施方式，在本专利技术第一方面中，所述对于每个所述图像数据对，基于该图像数据对中所包括的所有所述备用视频图像中的人脸坐标信息，确定该图像数据对的人脸偏移信息，包括：

15、对于每个所述图像数据对，按照每个所述备用视频图像的抽取时刻对所有所述备用视频图像执行排序操作，得到该图像数据对的抽取序列，基于所述抽取序列以及每个所述备用视频图像中的人脸坐标信息，计算每两张连续的所述备用视频图像中的人脸坐标信息之间的坐标距离差值；

16、对于每个所述图像数据对，根据该图像数据对中所包括的所有所述坐标距离差值，确定该图像数据对的人脸偏移信息。

17、作为一种可选的实施方式，在本专利技术第一方面中，所述对于每个所述图像数据对，基于该图像数据对的人脸偏移信息，确定该图像数据对的数据对图像信息，包括：

18、对于每个所述图像数据对，按照所述抽取序列，确定该图像数据对的起始图像数据，基于该图像数据对的起始图像数据的人脸坐标信息对该图像数据对的起始图像数据执行区域裁剪操作，得到该图像数据对的起始图像数据对应的人脸区域；

19、对于每个所述图像数据对，根据该图像数据对的起始图像数据对应的人脸区域，对该图像数据对中所包括的除所述起始图像数据外的每个剩余备用视频图像以该图像数据对该起始图像数据对应的人脸区域为基础执行区域延伸操作，得到每个所述剩余备用视频图像的人脸区域；其中，所述起始图像数据的对应的人脸区域的尺寸与每个所述剩余备用视频图像对应的人脸区域的尺寸均不相同；

20、对于每个所述图像数据对，根据该图像数据对的起始图像数据对应的人脸区域以及该图像数据对所包括的每个所述剩余备用视频图像的人脸区域，计算每两张图像数据对应的人脸区域之间的区域差异参数，得到该图像数据对的区域差异信息；

21、对于每个所述图像数据对，根据该图像数据对的区域差异信息，确定该图像数据对的数据对图像信息。

22、作为一种可选的实施方式，在本专利技术第一方面中，预先确定出的训练用人脸跟踪模型包括图像嵌入层、提取单元、特征融合层及若干个全连接层；

23、其中，所述图像嵌入层用于对所述视频预处理结果中所包括的每个所述帧图像数据执行提取操作，得到每个所述帧图像数据对应的一维向量，并对每两个所述帧图像数据对应的一维向量执行向量拼接操作，得到输入特征向量；

24、所述提取单元用于提取所述输入特征向量中的特征编码；

25、所述特征融合层用于将所有所述特征编码执行特征融合操作，得到特征融合结果，并将所有所述特征融合结果输入至每个所述全连接层中，以得到每个所述全连接层的连接层输出结果；

26、其中，所述连接层输出结果包括图像标签信息、图像坐标信息、图像相似度信息中的一种或多种。

27、作为一种可选的实施方式，在本专利技术第一方面中，所述基于所述视频预处理结果以及预先确定出的训练用人脸跟踪模型，生成人脸跟踪训练结果，包括：

28、从所述视频预处理结果中所包括的所有所述图像数据对中确定出训练用图像数据对，对于每个所述训练用图像数据对，将该训练用图像数据对中所包括的所有训练用视频图像输入至预先确定出的训练用人脸跟踪模型，得到该训练用图像数据对的模型输出结果；

29、对于每个所述训练用图像数据对，根据该训练用图像数据对的模型输出结果，生成该训练用图像数据对的人脸跟踪训练结果；

30、其中，所述人脸跟踪训练结果包括该训练用图像数据对的输出标签信息、输出坐标信息、输出相似度信息。

31、作为一种可选的实施方式，在本专利技术第一方面中，所述基于所述人脸跟踪训练结果，计算所述训练用人脸跟踪模型的模型损失参数，包括：

...

【技术保护点】

1.一种人脸的智能跟踪方法，其特征在于，所述方法包括：

2.根据权利要求1所述的人脸的智能跟踪方法，其特征在于，所述通过预先确定出的人脸检测模型，对目标训练视频执行数据预处理操作，得到视频预处理结果，包括：

3.根据权利要求2所述的人脸的智能跟踪方法，其特征在于，所述对于每个所述图像数据对，基于该图像数据对中所包括的所有所述备用视频图像中的人脸坐标信息，确定该图像数据对的人脸偏移信息，包括：

4.根据权利要求3所述的人脸的智能跟踪方法，其特征在于，所述对于每个所述图像数据对，基于该图像数据对的人脸偏移信息，确定该图像数据对的数据对图像信息，包括：

5.根据权利要求2所述的人脸的智能跟踪方法，其特征在于，预先确定出的训练用人脸跟踪模型包括图像嵌入层、提取单元、特征融合层及若干个全连接层；

6.根据权利要求5所述的人脸的智能跟踪方法，其特征在于，所述基于所述视频预处理结果以及预先确定出的训练用人脸跟踪模型，生成人脸跟踪训练结果，包括：

7.根据权利要求6所述的人脸的智能跟踪方法，其特征在于，所述基于所述人脸跟踪训

8.一种人脸的智能跟踪装置，其特征在于，所述装置包括：

9.一种人脸的智能跟踪装置，其特征在于，所述装置包括：

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-7任一项所述的人脸的智能跟踪方法。

...

【技术特征摘要】

1.一种人脸的智能跟踪方法，其特征在于，所述方法包括：

5.根据权利要求2所述的人脸的智能跟踪方法，其特征在于，预先确定出的训练用人...

【专利技术属性】
技术研发人员：陈畅新，
申请(专利权)人：有米科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人