目标区域的检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：22642864 阅读：34 留言：0更新日期：2019-11-26 16:26

本公开的实施例提供了一种目标区域的检测方法、装置、电子设备及可读存储介质，所述方法包括：将目标图片输入至卷积层中，得到第一预测向量，卷积层由一个或多个低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成；将低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层，得到第二预测向量，上下文敏感预测层包括两个或以上预设卷积核的级联结构，预设卷积核在每个维度上的变量数目大于1；将高语义层的卷积核输出的第一预向量分别输入至代表特征提取层，得到第三预测向量，代表特征提取层仅包括一个预设卷积核；根据第二预测向量和第三预测向量确定目标区域。可以在高语义层采用有效降低网络结构的复杂度，以及避免过拟合现象。

Detection method, device, electronic equipment and readable storage medium of target area

The embodiment of the present disclosure provides a detection method, device, electronic device and readable storage medium for the target area. The method includes: inputting the target image into the convolution layer to obtain the first prediction vector, and the convolution layer is composed of one or more convolution cores of the low semantic layer and one or more convolution cores in the high semantic layer; outputting the convolution cores of the low semantic layer The first prediction vector is input to the context sensitive prediction layer, and the second prediction vector is obtained. The context sensitive prediction layer consists of two or more preset convolution kernels in a cascade structure. The number of variables of the preset convolution kernels in each dimension is greater than 1. The first prediction vector output from the convolution kernels in the high semantic layer is input to the representative feature extraction layer, and the third prediction vector is obtained, which represents the feature extraction layer The extraction layer only includes a preset convolution kernel, and the target region is determined according to the second prediction vector and the third prediction vector. It can effectively reduce the complexity of network structure and avoid over fitting phenomenon in high semantic layer.

全部详细技术资料下载

【技术实现步骤摘要】
目标区域的检测方法、装置、电子设备及可读存储介质
本公开的实施例涉及人脸识别
，尤其涉及一种目标区域的检测方法、装置、电子设备及可读存储介质。
技术介绍
基于人脸特征的智能分析应用越来越广，例如，年龄估计、表情分析、性别识别、智能视频监控、人脸虚拟化身、人脸美学评价、内容过滤、装备识别、人物智能相册、广告投放、人脸僵尸化游戏。上述过程均以目标区域的检测为基础。现有技术中，目标区域的检测方法通常采用深度学习网络从大量图片中学习人脸特征，并在训练好模型之后对目标图片进行目标区域的检测。Pyramidbox网络模型作为一种典型的目标区域的检测网络模型，包括多语义层的卷积层、上下文敏感预测层、金字塔方盒损失层。具体地，将图片输入至多语义层的卷积层，每个卷积层的输出接入上下文敏感预测层，上下文敏感预测层的输出输入至金字塔方盒损失层，得到预测结果。然而，专利技术人在对上述方案进行研究之后发现，高语义层的卷积层的输出也通过上下文敏感预测层，会导致过拟合和网络结构的复杂度较高。
技术实现思路
本公开的实施例提供一种目标区域的检测方法、装置、电子设备及可读存储介质，可以在高语义层采用有效降低网络结构的复杂度，以及避免过拟合现象。根据本公开的实施例的第一方面，提供了一种目标区域的检测方法，所述方法包括：将目标图片输入至卷积层中，得到第一预测向量，所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成；将所述处于低语义层的卷积核输出的第一...

【技术保护点】
1.一种目标区域的检测方法，其特征在于，所述方法包括：/n将目标图片输入至卷积层中，得到第一预测向量，所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成；/n将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层，得到第二预测向量，所述上下文敏感预测层包括两个或以上预设卷积核的级联结构，所述预设卷积核在每个维度上的变量数目大于1；/n将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层，得到第三预测向量，所述代表特征提取层仅包括一个所述预设卷积核，所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到；/n根据所述第二预测向量和所述第三预测向量确定目标区域。/n

【技术特征摘要】
1.一种目标区域的检测方法，其特征在于，所述方法包括：
将目标图片输入至卷积层中，得到第一预测向量，所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成；
将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层，得到第二预测向量，所述上下文敏感预测层包括两个或以上预设卷积核的级联结构，所述预设卷积核在每个维度上的变量数目大于1；
将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层，得到第三预测向量，所述代表特征提取层仅包括一个所述预设卷积核，所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到；
根据所述第二预测向量和所述第三预测向量确定目标区域。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第二预测向量和所述第三预测向量确定目标区域的步骤，包括：
分别将所述第二预测向量、第三预测向量输入至权重预测层，得到第一权重向量、第二权重向量；
通过所述第一权重向量对所述第二预测向量进行加权，得到第一加权预测向量；
通过所述第二权重向量对所述第三预测向量进行加权，得到第二加权预测向量；
根据所述第一加权预测向量、第二加权预测向量确定目标区域。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一加权预测向量、第二加权预测向量确定目标区域的步骤，包括：
对处于低语义层的卷积核，将对应的第一加权预测向量输入至Maxout层中得到最大化预测向量；
将所述最大化预测向量、第二加权预测向量输入至激活层中预测得到目标区域。

4.根据权利要求1所述的方法，其特征在于，所述图片样本集通过如下步骤进行分类：
针对所述图片样本集中的每个图片样本，计算所述图片样本中标注的目标区域和预测的目标区域的交并比；
确定所述图片样本是否包含预设关键信息；
在所述交并比大于或等于预设交并比阈值，或，所述交并比小于预设交并比阈值，且所述图片样本包含预设关键信息的情况下，确定所述图片样本为正样本；
在所述交并比小于预设交并比阈值，且所述图片样本不包含预设关键信息的情况下，确定所述图片样本为负样本。

5.根据权利要求4所述的方法，其特征在于，所述计算所述图片样本中标...

【专利技术属性】
技术研发人员：柴振华，孟欢欢，赖申其，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人