本申请实施例公开了一种人体姿态估计方法、装置、存储介质及计算机设备,涉及图像处理领域。本申请对输入图像进行仿射变换,然后利用目标检测算法检测出变换后的图像中的人体目标及位置,基于人体目标的位置对变换后的图像进行裁剪,然后将裁剪后的图像进行卷积得到低分辨率图像,深度高分辨率表示学习网络对低分辨率图像进行处理得到姿态估计结果,达到降低网络整体的参数量和运算量的效果。低网络整体的参数量和运算量的效果。低网络整体的参数量和运算量的效果。
【技术实现步骤摘要】
人体姿态估计方法、装置、存储介质及计算机设备
[0001]本申请涉及图像处理领域,尤其涉及一种人体姿态估计方法、装置、存储介质及计算机设备。
技术介绍
[0002]随着深度学习技术的热度逐渐增高,人工智能得以飞速发展,所衍生的自动驾驶技术也越来越被人们重视,研究者希望利用自动驾驶技术安全辅助驾驶,守护司机及行人安全。自然场景下司机和行人的运动均具有连贯性和可预测性,由此可知驾驶员驾驶状态和行人的人体姿态可作为决策系统的输入因素之一,从而高效地辅助驾驶。自动驾驶场景中对人体姿态估计的实时性要求较高,人体姿态估计任务相关的图像处理、推理计算过程可以完全在车载终端完成,这样就能在一定程度上避免网络时延、信道阻塞等问题,因此需要设计一个能够在自动驾驶终端上高效运行的人体姿态估计系统算法。针对此背景下提出一种基于高分辨率表示学习网络(deep high
‑
resolution representation learning)的人体姿态估计优化算法,该方法主要是利用卷积神经网络从图像中提取特征,借助卷积神经网络得到更丰富的图像特征,目前使用的高分辨率表示学习网络由于整个通道维持高分辨率特性,因此运算量较大。
技术实现思路
[0003]本申请实施例提供了人体姿态估计方法、装置、存储介质及计算机设备,可以解决现有技术执行人体姿态估计运算量较大的问题。所述技术方案如下:
[0004]第一方面,本申请实施例提供了一种人体姿态估计方法,所述方法包括:
[0005]获取输入图像;
[0006]对所述输入图像进行仿射变换;
[0007]在变换后的图像中检测出人体目标和所述人体目标的位置;
[0008]根据所述人体目标的位置对所述变换后的图像进行裁剪;
[0009]将裁剪后的图像进行卷积;
[0010]将卷积后的图像输入到深度高分辨率表示学习网络得到姿态估计结果。
[0011]第二方面,本申请实施例提供了一种人体姿态估计装置,所述装置包括:
[0012]获取单元,用于获取输入图像;
[0013]变换单元,用于对所述输入图像进行仿射变换;
[0014]检测单元,用于在变换后的图像中检测出人体目标和所述人体目标的位置;
[0015]裁剪单元,用于根据所述人体目标的位置对所述变换后的图像进行裁剪;
[0016]卷积单元,用于将裁剪后的图像进行卷积;
[0017]估计单元,用于将卷积后的图像输入到深度高分辨率表示学习网络得到姿态估计结果。
[0018]第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有
多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
[0019]第四方面,本申请实施例提供一种计算机设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0020]本申请一些实施例提供的技术方案带来的有益效果至少包括:
[0021]对输入图像进行仿射变换,然后利用目标检测算法检测出变换后的图像中的人体目标及位置,基于人体目标的位置对变换后的图像进行裁剪,然后将裁剪后的图像进行卷积得到低分辨率图像,深度高分辨率表示学习网络对低分辨率图像进行处理得到姿态估计结果,本申请通过对输入图片仿射变换以增强人体目标和背景的区分度,然后通过裁剪和卷积操作减小深度高分辨率表示学习网络输入的数据量,从而达到降低网络整体的参数量和运算量的效果。
附图说明
[0022]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0023]图1是本申请实施例提供的人体姿态估计方法的流程示意图;
[0024]图2是本申请实施例提供的目前使用的多通道特征提取的原理示意图;
[0025]图3是本申请实施例提供的改进的多通道特征提取的原理示意图
[0026]图4是本申请提供的一种人体姿态估计装置的结构示意图;
[0027]图5是本申请提供的一种计算机设备的结构示意图。
具体实施方式
[0028]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
[0029]需要说明的是,本申请提供的人体姿态估计方法一般由计算机设备执行,相应的,人体姿态估计装置一般设置于计算机设备中。
[0030]本申请的计算机设备包括但不限于:智能手机、平板电脑、膝上型便携式计算机、台式计算机、车载计算机、舰载计算机或其他设备设置的计算机等等。当计算机设备为软件时,可以是安装上述所列举的计算机设备中。其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
[0031]计算机设备还可以安装有显示设备和摄像头,显示设备显示可以是各种能实现显示功能的设备,摄像头用于采集视频流;例如:显示设备可以是阴极射线管显示器(cathode ray tube display,简称CR)、发光二极管显示器(light
‑
emitting diode display,简称LED)、电子墨水屏、液晶显示屏(liquid crystal display,简称LCD)、等离子显示面板(plasma display panel,简称PDP)等。用户可以利用计算机设备上的显示设备,来查看显示的文字、图片、视频等信息。
[0032]下面将结合附图1,对本申请实施例提供的人体姿态估计方法进行详细介绍。其
中,本申请实施例中的人体姿态估计装置可以是图1所示的计算机设备。
[0033]请参见图1,为本申请实施例提供了一种人体姿态估计方法的流程示意图。如图1所示,本申请实施例的所述方法可以包括以下步骤:
[0034]S101、获取输入图像。
[0035]在本申请实施例中,输入图像是图像采集单元采集,图像采集单元可以是内置于计算机设备中或外置于计算机设备。输入图像的数量可以为一个或多个,计算机设备可以对静态图像或动态视频中的人体目标进行姿态估计。
[0036]S102、对输入图像进行仿射变换。
[0037]在本申请实施例中,对输入图像进行线性变换和平移组成的仿射变换可以有效保持变换过程中的平行性,增加输入图像的质量,便于后续进行处理。
[0038]S103、在变换后的图像中检测出人体目标和人体目标的位置。
[0039]在本申请实施例中,目标检测算法用于识别出图像中的目标类别和位置,计算机设备利用目标检测算法在S102变换后的图像中检测出人体目标和人体目标的位置,检测出的人体目标的数量可能为一个或多个,人体目标在图像中的位置可以通过检测框进行本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种人体姿态估计方法,其特征在于,包括:获取输入图像;对所述输入图像进行仿射变换;在变换后的图像中检测出人体目标和所述人体目标的位置;根据所述人体目标的位置对所述变换后的图像进行裁剪;将裁剪后的图像进行卷积;将卷积后的图像输入到深度高分辨率表示学习网络得到姿态估计结果。2.根据权利要求1所述的方法,其特征在于,所述在变换后的图像中检测出人体目标和所述人体目标的位置,包括:根据Faster
‑
RCNN快速区域卷积神经网络在变换后的图像中检测出人体目标和所述人体目标的位置。3.根据权利要求2所述的方法,其特征在于,所述根据所述人体目标的位置对所述变换后的图像进行裁剪,包括:根据Faster
‑
RCNN在变换后的图像中标记出检测框;基于所述检测框内的像素区域生成裁剪后的图像。4.根据权利要求1或2或3所述的方法,其特征在于,利用空洞卷积金字塔网络进行多尺度特征图的提取。5.根据权利要求4所述的方法,其特征在于,对裁剪后的图像进行两次卷积,卷积后的分辨率减少为裁剪前的图像的1...
【专利技术属性】
技术研发人员:王志刚,吴士泓,王瑞平,李孟全,
申请(专利权)人:远光软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。