目标区域的检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:22642864 阅读:34 留言:0更新日期:2019-11-26 16:26
本公开的实施例提供了一种目标区域的检测方法、装置、电子设备及可读存储介质,所述方法包括:将目标图片输入至卷积层中,得到第一预测向量,卷积层由一个或多个低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;将低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,上下文敏感预测层包括两个或以上预设卷积核的级联结构,预设卷积核在每个维度上的变量数目大于1;将高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,代表特征提取层仅包括一个预设卷积核;根据第二预测向量和第三预测向量确定目标区域。可以在高语义层采用有效降低网络结构的复杂度,以及避免过拟合现象。

Detection method, device, electronic equipment and readable storage medium of target area

The embodiment of the present disclosure provides a detection method, device, electronic device and readable storage medium for the target area. The method includes: inputting the target image into the convolution layer to obtain the first prediction vector, and the convolution layer is composed of one or more convolution cores of the low semantic layer and one or more convolution cores in the high semantic layer; outputting the convolution cores of the low semantic layer The first prediction vector is input to the context sensitive prediction layer, and the second prediction vector is obtained. The context sensitive prediction layer consists of two or more preset convolution kernels in a cascade structure. The number of variables of the preset convolution kernels in each dimension is greater than 1. The first prediction vector output from the convolution kernels in the high semantic layer is input to the representative feature extraction layer, and the third prediction vector is obtained, which represents the feature extraction layer The extraction layer only includes a preset convolution kernel, and the target region is determined according to the second prediction vector and the third prediction vector. It can effectively reduce the complexity of network structure and avoid over fitting phenomenon in high semantic layer.

【技术实现步骤摘要】
目标区域的检测方法、装置、电子设备及可读存储介质
本公开的实施例涉及人脸识别
,尤其涉及一种目标区域的检测方法、装置、电子设备及可读存储介质。
技术介绍
基于人脸特征的智能分析应用越来越广,例如,年龄估计、表情分析、性别识别、智能视频监控、人脸虚拟化身、人脸美学评价、内容过滤、装备识别、人物智能相册、广告投放、人脸僵尸化游戏。上述过程均以目标区域的检测为基础。现有技术中,目标区域的检测方法通常采用深度学习网络从大量图片中学习人脸特征,并在训练好模型之后对目标图片进行目标区域的检测。Pyramidbox网络模型作为一种典型的目标区域的检测网络模型,包括多语义层的卷积层、上下文敏感预测层、金字塔方盒损失层。具体地,将图片输入至多语义层的卷积层,每个卷积层的输出接入上下文敏感预测层,上下文敏感预测层的输出输入至金字塔方盒损失层,得到预测结果。然而,专利技术人在对上述方案进行研究之后发现,高语义层的卷积层的输出也通过上下文敏感预测层,会导致过拟合和网络结构的复杂度较高。
技术实现思路
本公开的实施例提供一种目标区域的检测方法、装置、电子设备及可读存储介质,可以在高语义层采用有效降低网络结构的复杂度,以及避免过拟合现象。根据本公开的实施例的第一方面,提供了一种目标区域的检测方法,所述方法包括:将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,所述上下文敏感预测层包括两个或以上预设卷积核的级联结构,所述预设卷积核在每个维度上的变量数目大于1;将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,所述代表特征提取层仅包括一个所述预设卷积核,所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到;根据所述第二预测向量和所述第三预测向量确定目标区域。。根据本公开的实施例的第二方面,提供了一种目标区域的检测装置,所述装置包括:卷积运算模块,用于将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;上下文预测模块,用于将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,所述上下文敏感预测层包括两个或以上预设卷积核的级联结构,所述预设卷积核在每个维度上的变量数目大于1;代表特征提取模块,用于将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,所述代表特征提取层仅包括一个所述预设卷积核,所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到;目标区域确定模块,用于根据所述第二预测向量和所述第三预测向量确定目标区域。根据本公开的实施例的第三方面,提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述目标区域的检测方法。根据本公开的实施例的第四方面,提供了一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述目标区域的检测方法。本公开的实施例提供了一种目标区域的检测方法、装置、电子设备及可读存储介质,所述方法包括:将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,所述上下文敏感预测层包括两个或以上预设卷积核的级联结构,所述预设卷积核在每个维度上的变量数目大于1;将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,所述代表特征提取层仅包括一个所述预设卷积核,所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到;根据所述第二预测向量和所述第三预测向量确定目标区域。本公开的实施例在高语义层采用有效降低网络结构的复杂度,以及避免过拟合现象。附图说明为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1示出了本公开的一种实施例中的目标区域的检测方法步骤流程图;图2示出了本公开的另一种实施例中的目标区域的检测方法步骤流程图;图3示出了本公开的网络模型的结构示意图;图4(A、B)分别为普通卷积和空洞卷积的示意图;图5示出了本公开的一种标注的目标区域和预测的目标区域的位置示意图;图6示出了Maxout层的结构示意图;图7示出了本公开的一种实施例中的目标区域的检测装置的结构图;图8示出了本公开的另一种实施例中的目标区域的检测装置的结构图;图9示出了本公开的一种实施例中的电子设备的结构图。具体实施方式下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。实施例一参照图1,其示出了本公开的一种实施例中的目标区域的检测方法的步骤流程图,具体如下。步骤101,将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成。其中,卷积层可以由多个卷积核级联组成,即前一个卷积核的输出为后一个卷积核的输入,从而使得卷积层中不同位置的卷积核输出的第一预测向量包含的信息不同。在本公开的实施例中,将根据卷积核的位置将卷积核划分为低语义层和高语义层。例如,如图3所示,从左向右,前三个卷积核CC1、CC2、CC3处于低语义层,后三个卷积核CC4、CC5、CC6处于高语义层。可以理解,高语义层和低语义层的划分可以根据实际应用场景设定,本公开的实施例对其不加以限制。需要说明的是,卷积核CC1、CC2、CC3、CC4、CC5、CC6可以根据实际应用场景选取不同大小的卷积核。例如,CC1、CC2、CC3、CC5、CC6分别为3X3、4X5、5X3、6X2、7X2的卷积核,而CC4为空洞卷积,可以进一步扩大感受野。而在空洞卷积中,在标准的卷积里注入空洞,以此来增加接收域。相比普通卷积,空洞卷积多了一个成为膨胀率的超参,即空洞的数目占比。如图4(A)所示为普通的本文档来自技高网...

【技术保护点】
1.一种目标区域的检测方法,其特征在于,所述方法包括:/n将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;/n将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,所述上下文敏感预测层包括两个或以上预设卷积核的级联结构,所述预设卷积核在每个维度上的变量数目大于1;/n将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,所述代表特征提取层仅包括一个所述预设卷积核,所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到;/n根据所述第二预测向量和所述第三预测向量确定目标区域。/n

【技术特征摘要】
1.一种目标区域的检测方法,其特征在于,所述方法包括:
将目标图片输入至卷积层中,得到第一预测向量,所述卷积层由一个或多个处于低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;
将所述处于低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,所述上下文敏感预测层包括两个或以上预设卷积核的级联结构,所述预设卷积核在每个维度上的变量数目大于1;
将处于高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,所述代表特征提取层仅包括一个所述预设卷积核,所述卷积层、上下文敏感预测层、代表特征提取层通过预先标注了目标区域的图片样本集训练得到;
根据所述第二预测向量和所述第三预测向量确定目标区域。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第二预测向量和所述第三预测向量确定目标区域的步骤,包括:
分别将所述第二预测向量、第三预测向量输入至权重预测层,得到第一权重向量、第二权重向量;
通过所述第一权重向量对所述第二预测向量进行加权,得到第一加权预测向量;
通过所述第二权重向量对所述第三预测向量进行加权,得到第二加权预测向量;
根据所述第一加权预测向量、第二加权预测向量确定目标区域。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一加权预测向量、第二加权预测向量确定目标区域的步骤,包括:
对处于低语义层的卷积核,将对应的第一加权预测向量输入至Maxout层中得到最大化预测向量;
将所述最大化预测向量、第二加权预测向量输入至激活层中预测得到目标区域。


4.根据权利要求1所述的方法,其特征在于,所述图片样本集通过如下步骤进行分类:
针对所述图片样本集中的每个图片样本,计算所述图片样本中标注的目标区域和预测的目标区域的交并比;
确定所述图片样本是否包含预设关键信息;
在所述交并比大于或等于预设交并比阈值,或,所述交并比小于预设交并比阈值,且所述图片样本包含预设关键信息的情况下,确定所述图片样本为正样本;
在所述交并比小于预设交并比阈值,且所述图片样本不包含预设关键信息的情况下,确定所述图片样本为负样本。


5.根据权利要求4所述的方法,其特征在于,所述计算所述图片样本中标...

【专利技术属性】
技术研发人员:柴振华孟欢欢赖申其
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1