本发明专利技术公开了一种复杂背景图像的预处理方法,通过进行符合人体构造的三维骨架建模,并将构建的三维骨架模型的关节部位设置为可动状态,为可动关节的三维骨架模型设置动作状态设置,并对三维骨架模型的运动状态进行视觉学习,构建基础的动作识别库,同时配置爬虫程序进行网络大数据学习来补充细节,随后再获取复杂图像后,首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切,最终完成识别和处理,本发明专利技术的优点在于以符合人体构造的三维骨架模型作为基础,并配置可动的关节部位来模拟人体动作,经过深度学习后来实现复杂背景图像中目标的精准识别处理。精准识别处理。
【技术实现步骤摘要】
一种复杂背景图像的预处理方法
[0001]本专利技术涉及复杂图像识别处理领域,具体地说,是一种复杂背景图像的预处理方法。
技术介绍
[0002]图像预处理是指在图像分析中,对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。现有图像预处理技术一般包括数字化、几何变换、归一化、颜色空间变换、图像平滑、图像增强。
[0003]但在人流量较大的复杂场景中,由于大量姿态不同的人形单位的出现,经现有的图像预处理方式处理后的图像在后续的人体姿态检测、情绪检测等技术的关键特征提取时,关键特征定位出现误差的几率较高,从而影响到整体效率和效果。结合现有的视频监控系统。
[0004]为解决这一问题,我们需要一种适用于多人复杂场景的图像预处理方法。
技术实现思路
[0005]专利技术目的:本专利技术目的在于针对现有技术的不足,提供一种复杂背景图像的预处理方法。
[0006]技术方案:本专利技术所述一种复杂背景图像的预处理方法,包括以下步骤:
[0007]S1、进行符合人体构造的三维骨架建模,并将构建的三维骨架模型的关节部位设置为可动状态;
[0008]S2、为可动关节的三维骨架模型设置动作状态设置,并对三维骨架模型的运动状态进行视觉学习,构建基础的动作识别库;
[0009]S3、为基础的动作识别库设置爬虫程序,通过爬虫程序在公开网络上抓取包含各种人体动作的图片,将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充;
[0010]S4、获取复杂图像后,首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切;
[0011]S5、对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态,随后删除尺寸特征,与动作识别库比较后标注人体检测框信息;
[0012]S6、对人体检测框信息进行后处理后,再对图像中未标注部分进行虚化处理获得最终预处理结果。
[0013]作为优选的,S6中的后处理流程包括以下步骤:
[0014]S61、人体检测框信息与动作识别库中的三维骨架模型进行二次匹配,筛选匹配人体检测框信息中骨架状态的动作状态,匹配后完成初步检出;
[0015]S62、完成初步检出后利用非极大值抑制的方法对得到的检测框信息进行交叉框的非极大值抑制处理,获取新的人体检测框信息;
[0016]S63、对新的人体检测框信息利用放大算法恢复骨架状态外沿的细节状态并输出,完成后处理流程。
[0017]作为优选的,S2中对三维骨架模型中的各个可动状态关节部位进行角度逐帧微调,已完成具备普适性的自主模拟学习。
[0018]作为优选的,S4中采用的图像分割技术采用以三维骨架模型匹配基准线为基础并进行均匀增量扩容的方式进行裁切。
[0019]本专利技术相比于现有技术具有以下有益效果:(1)以符合人体构造的三维骨架模型作为基础,并配置可动的关节部位来模拟人体动作,经过深度学习后来实现复杂背景图像中目标的精准识别处理;
[0020](2)采用在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切后采用编辑模糊算法以删除冗余特征并缩减至骨架状态,随后删除尺寸特征后再与动作识别库进行比较和处理输出,可以有效规避外界造型和尺寸对识别效果的影响,实现了结果精准的模糊识别,提高了识别效率和准确度。
具体实施方式
[0021]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0023]在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,也可以是成一体;可以是机械连接,也可以是电连接,也可以是通讯连接;可以是直接连接,也可以通过中间媒介的间接连接,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。
[0024]下面以具体地实施例对本专利技术的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0025]实施例1:一种复杂背景图像的预处理方法,包括以下步骤:
[0026]S1、进行符合人体构造的三维骨架建模,并将构建的三维骨架模型的关节部位设置为可动状态;
[0027]S2、为可动关节的三维骨架模型设置动作状态设置,并对三维骨架模型的运动状态进行视觉学习,构建基础的动作识别库;
[0028]S3、为基础的动作识别库设置爬虫程序,通过爬虫程序在公开网络上抓取包含各
种人体动作的图片,将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充;
[0029]S4、获取复杂图像后,首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切;
[0030]S5、对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态,随后删除尺寸特征,与动作识别库比较后标注人体检测框信息;
[0031]S6、对人体检测框信息进行后处理后,再对图像中未标注部分进行虚化处理获得最终预处理结果。
[0032]实施例2:一种复杂背景图像的预处理方法,包括以下步骤:
[0033]S1、进行符合人体构造的三维骨架建模,并将构建的三维骨架模型的关节部位设置为可动状态;
[0034]S2、为可动关节的三维骨架模型设置动作状态设置,并对三维骨架模型的运动状态进行视觉学习,构建基础的动作识别库,具体的,对三维骨架模型中的各个可动状态关节部位进行角度逐帧微调,已完成具备普适性的自主模拟学习;
[0035]S3、为基础的动作识别库设置爬虫程序,通过爬虫程序在公开网络上抓取包含各种人体动作的图片,将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充;
[0036]S4、获取复杂图像后,首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种复杂背景图像的预处理方法,其特征在于:包括以下步骤:S1、进行符合人体构造的三维骨架建模,并将构建的三维骨架模型的关节部位设置为可动状态;S2、为可动关节的三维骨架模型设置动作状态设置,并对三维骨架模型的运动状态进行视觉学习,构建基础的动作识别库;S3、为基础的动作识别库设置爬虫程序,通过爬虫程序在公开网络上抓取包含各种人体动作的图片,将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充;S4、获取复杂图像后,首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切;S5、对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态,随后删除尺寸特征,与动作识别库比较后标注人体检测框信息;S6、对人体检测框信息进行后处理后,再对图像中未标注部分进行虚化处理获得最终预处理...
【专利技术属性】
技术研发人员:赵兴旺,宋传水,
申请(专利权)人:厦门聚视智创科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。