本发明专利技术公开了一种像素级分类方法、装置、设备及存储介质。该方法包括:将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2
【技术实现步骤摘要】
一种像素级分类方法、装置、设备及存储介质
本专利技术实施例涉及计算机视觉技术,尤其涉及一种像素级分类方法、装置、设备及存储介质。
技术介绍
近年来,随着计算机硬件性能的提升和大规模图像数据的出现,深度学习在计算机视觉领域得到广泛应用。其中,卷积神经网络是在计算机视觉领域具有突出成就的一个深度学习的神经网络结构。像素级分类技术是计算机视觉领域中最具挑战性的研究方法,针对像素级分类技术来说,卷积神经网络也在像素级分类方面得到广泛应用。卷积神经网络通常包括卷积层、池化层、非线性激活层和全连接层,网络结构比较复杂且计算量较大。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:由于卷积神经网络的结构比较复杂且计算量较大,使得其只适合在服务器端运行,并且对于像素级分类任务来说,基本上都需要依赖GPU(GraphicsProcessingUnit,图形处理器)的加速才能实现实时运行。而对于需要在移动端并且只能依赖CPU(CentralProcessingUnit,中央处理器)运行的任务,尤其对于像素级分类任务,使用服务器端的网络结构是不实际的。
技术实现思路
本专利技术实施例提供一种像素级分类方法、装置、设备及存储介质,以在简化网络的结构复杂度以及降低计算量的基础上实现像素级分类任务。第一方面,本专利技术实施例提供了一种像素级分类方法,该方法包括:将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2N,1≤N≤3;将所述下采样特征图输入解码器,得到上采样特征图,上采样特征图尺寸与原始图片尺寸相同;将所述上采样特征图输入分类器得到所述原始图片中每个像素的分类。进一步的,所述编码器包括M个下采样模块和U个残差模块,第M-1下采样模块和第M下采样模块之间连接T个所述残差模块,第M下采样模块之后连接U-T个所述残差模块,M=N;所述将所述原始图片输入编码器,得到下采样特征图,包括:所述原始图片依次经过M-2个下采样模块,得到第一中间特征图,第一中间特征图尺寸为原始图片尺寸的1/2M-2;所述第一中间特征图依次经过第M-1下采样模块、T个残差模块、第M下采样模块和U-T个残差模块,得到所述下采样特征图。进一步的,所述解码器包括M个上采样模块和V个残差模块,第一上采样模块和第二上采样模块之间连接V个所述残差模块;所述将所述下采样特征图输入解码器,得到上采样特征图,包括:所述下采样特征图依次经过第一上采样模块和V个残差模块,得到第二中间特征图,第二中间特征图尺寸为原始图片尺寸的1/2M-1;所述第二中间特征图依次经过M-1个上采样模块,得到所述上采样特征图。进一步的,所述下采样模块包括第一卷积层和池化层,所述第一卷积层和所述池化层并联,每个下采样模块的输出为所述第一卷积层的输出和所述池化层的输出在输出通道上的拼接,每个第一卷积层的输出为通过分组卷积和通道交换得到的。进一步的,所述残差模块包括两个第二卷积层和两个第三卷积层,第一个第二卷积层、第一个第三卷积层、第二个第二卷积层和第二个第三卷积层依次连接,两个第二卷积层和两个第三卷积层形成非对称卷积层,每个第二卷积层和第三卷积层的输出为通过分组卷积和通道交换得到的。进一步的,第一上采样模块和第二上采样模块的输出为通过分组卷积和通道交换得到的。进一步的,第M下采样模块之后连接的U-T个残差模块转给你第二卷积层和第三卷积层为空洞卷积层。进一步的,第二卷积层和第三卷积层之间依次连接批规范化层和非线性激活层,第二个第三卷积层之后依次连接批规范层和非线性激活层。进一步的,所述上采样模块为转置卷积层。进一步的,M=N=3,U=13,T=5,V=1。第二方面,本专利技术实施例还提供了一种像素级分类装置,该装置包括:下采样特征图获取模块,用于将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2N,1≤N≤3;上采样特征图获取模块,用于将所述下采样特征图输入解码器,得到上采样特征图,上采样特征图尺寸与原始图片尺寸相同;像素所属分类确定模块,用于将所述上采样特征图输入分类器得到所述原始图片中每个像素的分类。进一步的,所述编码器包括M个下采样模块和U个残差模块,第M-1下采样模块和第M下采样模块之间连接T个所述残差模块,第M下采样模块之后连接U-T个所述残差模块,M=N;所述下采样特征图获取模块,包括:第一中间特征图获取单元,用于所述原始图片依次经过M-2个下采样模块,得到第一中间特征图,第一中间特征图尺寸为原始图片尺寸的1/2M-2;下采样特征图获取单元,用于所述第一中间特征图依次经过第M-1下采样模块、T个残差模块、第M下采样模块和U-T个残差模块,得到所述下采样特征图。进一步的,所述解码器包括M个上采样模块和V个残差模块,第一上采样模块和第二上采样模块之间连接V个所述残差模块;所述上采样特征图获取模块,包括:第二中间特征图获取单元,用于所述下采样特征图依次经过第一上采样模块和V个残差模块,得到第二中间特征图,第二中间特征图尺寸为原始图片尺寸的1/2M-1;上采样特征图获取单元,用于所述第二中间特征图依次经过M-1个上采样模块,得到所述上采样特征图。进一步的,所述下采样模块包括第一卷积层和池化层,所述第一卷积层和所述池化层并联,每个下采样模块的输出为所述第一卷积层的输出和所述池化层的输出在输出通道上的拼接,每个第一卷积层的输出为通过分组卷积和通道交换得到的。进一步的,所述残差模块包括两个第二卷积层和两个第三卷积层,第一个第二卷积层、第一个第三卷积层、第二个第二卷积层和第二个第三卷积层依次连接,两个第二卷积层和两个第三卷积层形成非对称卷积层,每个第二卷积层和每个第三卷积层的输出为通过分组卷积和通道交换得到的。进一步的,第一上采样模块和第二上采样模块的输出为通过分组卷积和通道交换得到的。进一步的,第M下采样模块之后连接的U-T个残差模块中第二卷积层和第三卷积层为空洞卷积层。进一步的,第二卷积层和第三卷积层之间依次连接批规范化层和非线性激活层,第二个第三卷积层之后依次连接批规范层和非线性激活层。进一步的,所述上采样模块为转置卷积层。进一步的,M=N=3,U=13,T=5,V=1。第三方面,本专利技术实施例还提供了一种设备,该设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例第一方面所述的方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例第一方面所述的方法。本实施例的技术方案,通过将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2N,1≤N≤本文档来自技高网...
【技术保护点】
1.一种像素级分类方法,其特征在于,包括:/n将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2
【技术特征摘要】
1.一种像素级分类方法,其特征在于,包括:
将原始图片输入编码器,得到下采样特征图,下采样特征图尺寸为原始图片尺寸的1/2N,1≤N≤3;
将所述下采样特征图输入解码器,得到上采样特征图,上采样特征图尺寸与原始图片尺寸相同;
将所述上采样特征图输入分类器得到所述原始图片中每个像素的分类。
2.根据权利要求1所述的方法,其特征在于,所述编码器包括M个下采样模块和U个残差模块,第M-1下采样模块和第M下采样模块之间连接T个所述残差模块,第M下采样模块之后连接U-T个所述残差模块,M=N;
所述将所述原始图片输入编码器,得到下采样特征图,包括:
所述原始图片依次经过M-2个下采样模块,得到第一中间特征图,第一中间特征图尺寸为原始图片尺寸的1/2M-2;
所述第一中间特征图依次经过第M-1下采样模块、T个残差模块、第M下采样模块和U-T个残差模块,得到所述下采样特征图。
3.根据权利要求2所述的方法,其特征在于,所述解码器包括M个上采样模块和V个残差模块,第一上采样模块和第二上采样模块之间连接V个所述残差模块;
所述将所述下采样特征图输入解码器,得到上采样特征图,包括:
所述下采样特征图依次经过第一上采样模块和V个残差模块,得到第二中间特征图,第二中间特征图尺寸为原始图片尺寸的1/2M-1;
所述第二中间特征图依次经过M-1个上采样模块,得到所述上采样特征图。
4.根据权利要求2所述的方法,所述下采样模块包括第一卷积层和池化层,所述第一卷积层和所述池化层并联,每个下采样模块的输出为所述第一卷积层的输出和所述池化层的输出在输出通道上的拼接,每个第一卷积层的输出为通过分组卷积和通道交换得到的。
5.根据权利要求3所述的方法,其特征在于,所述残差模块包括两个第二卷积层和两个第三卷积层,第一个第二...
【专利技术属性】
技术研发人员:梁德澎,梁柱锦,张壮辉,王俊东,张树业,
申请(专利权)人:广州市百果园信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。