图像处理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:26599157 阅读:9 留言:0更新日期:2020-12-04 21:21
本公开涉及一种图像处理方法及装置、电子设备和存储介质。所述方法包括:获取目标图像,所述目标图像包括目标对象;对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息;根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,其中,所述多个姿态包括站姿、坐姿以及躺姿中的至少一种。

【技术实现步骤摘要】
图像处理方法及装置、电子设备和存储介质
本公开涉及计算机视觉领域,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
技术介绍
随着计算机视觉技术的发展,对人体进行姿势或姿态的识别已成为计算机视觉领域中一种重要的应用方式。然而如何提高人体姿态识别的效率与精度,仍是目前一个亟待解决的问题。
技术实现思路
本公开提出了一种图像处理方案。根据本公开的一方面,提供了一种图像处理方法,包括:获取目标图像,所述目标图像包括目标对象;对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息;根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,其中,所述多个姿态包括站姿、坐姿以及躺姿中的至少一种。在一种可能的实现方式中,所述获取目标图像,包括:获取初始图像,所述初始图像包括目标对象;对所述初始图像进行预处理,得到所述目标图像;其中,所述预处理包括:对所述初始图像进行灰度处理,和/或,对所述初始图像进行尺寸变换。在一种可能的实现方式中,所述对所述初始图像进行尺寸变换,包括:将所述初始图像中具有最大尺寸的边作为目标边,获取所述目标边的尺寸与预设尺寸之间的尺寸变换比例,根据所述尺寸变换比例,对所述初始图像进行尺寸变换,得到中间图像;通过预设像素,对所述中间图像在所述目标边以外的边进行填充,其中,填充后的图像符合所述预设尺寸。在一种可能的实现方式中,所述方法通过目标神经网络实现,所述目标神经网络包括特征提取网络;所述对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息,包括:将所述目标图像通过所述特征提取网络进行特征提取,得到所述目标对象的特征信息;其中,所述特征提取网络的网络规模小于预设神经网络,所述网络规模包括神经网络的参数数量、神经网络的层数以及神经网络的网络层的通道数量中的至少一种。在一种可能的实现方式中,所述方法通过目标神经网络实现,所述目标神经网络包括分类网络;所述根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,包括:将所述特征信息通过所述分类网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。在一种可能的实现方式中,所述分类网络包括变换子网络和/或分类子网络;所述根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,包括:将所述特征信息通过所述变换子网络进行维度变换,得到维度变换后的特征信息;将所述维度变换后的特征信息通过所述分类子网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。在一种可能的实现方式中,所述目标图像包括一个或多个样本图像集合,其中,所述样本图像集合中的样本图像具有相同的姿态分类标签,所述样本图像集合中的样本图像的姿态分类标签为所述样本图像集合的姿态分类标签。在一种可能的实现方式中,在所述目标图像包括多个样本图像集合的情况下,各所述样本图像集合相互独立,各所述样本图像集合的姿态分类标签相同和/或不同;所述获取目标图像包括:分别获取所述多个样本图像集合。在一种可能的实现方式中,所述目标图像包括多个样本图像,所述方法还包括:分别获取所述多个样本图像对应的姿态分类结果;根据所述样本图像的标签比例和/或预设的图像分类难度参考值,结合所述样本图像对应的姿态分类结果,确定所述分类网络的误差损失;根据所述分类网络的误差损失,对所述分类网络进行训练。在一种可能的实现方式中,所述根据所述样本图像的标签比例,结合所述样本图像对应的姿态分类结果,确定所述分类网络的误差损失,包括:通过调节第一损失参数,结合所述样本图像对应的姿态分类结果,减小所述样本图像中负样本图像对应的误差损失在所述分类网络的误差损失中的权重,其中,所述负样本图像为所述多个样本图像中标签比例高于比例预设阈值的姿态分类标签所对应的样本图像。在一种可能的实现方式中,所述根据预设的图像分类难度参考值,结合所述样本图像对应的姿态分类结果,确定所述分类网络的误差损失,包括:通过第二损失参数,结合所述样本图像对应的姿态分类结果参考值,减小所述样本图像中简单样本图像对应的误差损失在所述分类网络的误差损失中的权重,其中,所述简单样本图像为分类难度低于分类难度阈值的姿态分类标签所对应的样本图像。在一种可能的实现方式中,所述姿态分类结果包括:所述目标对象分别属于多个姿态的概率和/或所述目标对象在多个姿态中具有最大概率的姿态。在一种可能的实现方式中,所述躺姿包括侧躺、前趴以及后趴中的一种或多种。根据本公开的一方面,提供了一种图像处理装置,包括:图像获取模块,用于获取目标图像,所述目标图像包括目标对象;特征提取模块,用于对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息;姿态分类模块,用于根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,其中,所述多个姿态包括站姿、坐姿以及躺姿中的至少一种。在一种可能的实现方式中,所述图像获取模块用于:获取初始图像,所述初始图像包括目标对象;对所述初始图像进行预处理,得到所述目标图像;其中,所述预处理包括:对所述初始图像进行灰度处理,和/或,对所述初始图像进行尺寸变换。在一种可能的实现方式中,所述图像获取模块进一步用于:将所述初始图像中具有最大尺寸的边作为目标边,获取所述目标边的尺寸与预设尺寸之间的尺寸变换比例,根据所述尺寸变换比例,对所述初始图像进行尺寸变换,得到中间图像;通过预设像素,对所述中间图像在所述目标边以外的边进行填充,其中,填充后的图像符合所述预设尺寸。在一种可能的实现方式中,所述装置通过目标神经网络实现,所述目标神经网络包括特征提取网络;所述特征提取模块用于:将所述目标图像通过所述特征提取网络进行特征提取,得到所述目标对象的特征信息;其中,所述特征提取网络的网络规模小于预设神经网络,所述网络规模包括神经网络的参数数量、神经网络的层数以及神经网络的网络层的通道数量中的至少一种。在一种可能的实现方式中,所述装置通过目标神经网络实现,所述目标神经网络包括分类网络;所述姿态分类模块用于,包括:将所述特征信息通过所述分类网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。在一种可能的实现方式中,所述分类网络包括变换子网络和/或分类子网络;所述姿态分类模块用于:将所述特征信息通过所述变换子网络进行维度变换,得到维度变换后的特征信息;将所述维度变换后的特征信息通过所述分类子网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。在一种可能的实现方式中,所述目标图像包括一个或多个样本图像集合,其中,所述样本图像集合中的样本图像具有相同的姿态分类标签,所述样本图像集合中的样本图像的姿态分类标签为所述样本图像集合的姿态分类标签。在一种可能的实现方式中,在所述目标图像包括多个样本图像集合的情况下,各所述样本图像集合相互独立,各所述样本图像集合的姿态分类标签相同和/或不同;所述图本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:/n获取目标图像,所述目标图像包括目标对象;/n对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息;/n根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,其中,所述多个姿态包括站姿、坐姿以及躺姿中的至少一种。/n

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:
获取目标图像,所述目标图像包括目标对象;
对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息;
根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,其中,所述多个姿态包括站姿、坐姿以及躺姿中的至少一种。


2.根据权利要求1所述的方法,其特征在于,所述获取目标图像,包括:
获取初始图像,所述初始图像包括目标对象;
对所述初始图像进行预处理,得到所述目标图像;
其中,所述预处理包括:对所述初始图像进行灰度处理,和/或,对所述初始图像进行尺寸变换。


3.根据权利要求2所述的方法,其特征在于,所述对所述初始图像进行尺寸变换,包括:
将所述初始图像中具有最大尺寸的边作为目标边,获取所述目标边的尺寸与预设尺寸之间的尺寸变换比例,根据所述尺寸变换比例,对所述初始图像进行尺寸变换,得到中间图像;
通过预设像素,对所述中间图像在所述目标边以外的边进行填充,其中,填充后的图像符合所述预设尺寸。


4.根据权利要求1至3任一所述的方法,其特征在于,所述方法通过目标神经网络实现,所述目标神经网络包括特征提取网络;
所述对所述目标图像中的目标对象进行特征提取,得到所述目标对象的特征信息,包括:
将所述目标图像通过所述特征提取网络进行特征提取,得到所述目标对象的特征信息;其中,
所述特征提取网络的网络规模小于预设神经网络,所述网络规模包括神经网络的参数数量、神经网络的层数以及神经网络的网络层的通道数量中的至少一种。


5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法通过目标神经网络实现,所述目标神经网络包括分类网络;
所述根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,包括:
将所述特征信息通过所述分类网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。


6.根据权利要求5所述的方法,其特征在于,所述分类网络包括变换子网络和/或分类子网络;
所述根据所述特征信息对所述目标图像进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果,包括:
将所述特征信息通过所述变换子网络进行维度变换,得到维度变换后的特征信息;
将所述维度变换后的特征信息通过所述分类子网络进行姿态分类,得到所述目标对象在多个姿态中的姿态分类结果。


7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述目标图像包括一个或多个样本图像集合,其中,所述样本图像集合中的样本图像具有相同的姿态分类标签,所述样本图像集合中的样本图像的姿态分类标签为所述样本图像集合的姿态分类标签。


8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员:张伟亮李通刘文韬钱晨
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1