本发明专利技术提供一种基于判别性语义部件学习的对象检测方法。本发明专利技术提出的基于稀疏表示的判别性语义部件聚类提纯得到最终语义部件集合,以及利用学习的语义部件检测器的对象置信度谱获取检测结果。相对于现有基于部件的对象检测方法在对象模型训练过程中需要强监督信息且仅能对训练的特定类别对象进行检测,本发明专利技术语义部件学习过程完全自动化,且在整个部件学习过程中,仅需要对象的窗口标注信息,不需要提供更多的强监督部件信息;利用了不同类对象部件信息具有几何相似性的特点,基于不同类对象部件共享的方式,能对跨类别的对具有几何相似性的对象进行检测,提高了基于部件的对象检测算法的泛化性能。
【技术实现步骤摘要】
本专利技术提出一种基于判别性语义部件学习方法解决图像中对象的检测任务,是一 种图像处理领域的新型技术。
技术介绍
当今,随着计算机网络、多媒体技术及数字媒体设备的不断发展和成熟,人们在工 作和日常生活中对数字图像的需求也大量增多。在海量的数字图像当中,为了对图像数据 进一步分析处理的需要,人们往往需要在每幅图像中定位到感兴趣的对象区域,进而对象 检测技术孕育而生。对象检测问题即是要设计有效的算法,对输入的图像数据中感兴趣的 对象区域进行识别及定位。面对当前海量的图像数据信息,对象检测方法提供了有效的途 径去分析理解图像中的信息内容,其为进一步对图像的分析处理提供了基础,极大提高了 人们理解大量媒体数据信息的能力。对象检测技术受到了越来越多研究者的关注,是当前 在计算机视觉领域内研究的关键课题之一。 目前,依据检测对象的类型,主要有两类对象检测方法。即特定对象类的检测方法 和针对一般类对象的检测方法。其中,在特定对象检测方法中,当前采用部件模型的方法能 取得较好的检测效果,也是目前在该领域内研究的重点。但目前此类型方法的不足之处是, 其一是在具体检测中仅能够对当前训练好的对象类别进行检测,而对于新有的对象类别, 即使对象间具有几何相似性也不能有效地对其进行检测识别。即使新有的对象类别有其对 应的训练模型,但对新有的对象类别在模型训练阶段缺少充分的训练数据时,问题依然突 出。其二是在采用此类模型的大多数方法中,为了更为有效地提高方法的检测性能,往往在 模型训练阶段加入了对象及其各个语义部件的强监督信息,而此类信息的获取在实际应用 中费时费力,较难获取。对象的各语义部件为对象的某个部位,比如腿部、头部。强监督信 息为需要大量人工标定信息,比如,人工指定对象W及对象位置,人工指定语义部件的类别 W及该部件的位置。所W基于该个原因也限制了此类方法的实际应用能力。另外,一般类 对象检测方法利用了图像数据的低层视觉线索,如基于图像的分割W及显著方面的特性, 其克服了特定对象检测方法仅能完成单一类对象检测问题,但该类方法的检测精度不如特 定类对象检测方法。
技术实现思路
本专利技术所要解决的技术问题是,提供一种基于语义部件的,不需要提供更多的强 监督部件信息的对象检测方法。 本专利技术为解决上述技术问题所采用的技术方案是,一种基于判别性语义部件学习 的对象检测方法,其特征在于,包括W下步骤: 1)训练步骤: 步骤1-1)将多类具有几何相似性对象的图像组成训练集合,人工标注训练集合 中每幅图像的对象窗口区域,对对象窗口区域进行图像块划分,对所有图像块提取特征后 进行聚类得到初始语义部件集合;[000引步骤1-2)根据初始语义部件集合中各聚类部件中的成员部件数目对初始语义 部件集合进行筛选,去掉成员部件数目小于预设最小值的聚类部件,得到候选语义部件集 合; 步骤1-3)优化候选语义部件集合中各聚类部件的表示系数A' j.;【主权项】1. ,其特征在于,包括以下步骤: 1) 训练步骤: 步骤1-1)将多类具有几何相似性对象的图像组成训练集合,人工标注训练集合中每 幅图像的对象窗口区域,对对象窗口区域进行图像块划分,对所有图像块提取特征后进行 聚类得到初始语义部件集合; 步骤1-2)根据初始语义部件集合中各聚类部件中的成员部件数目对初始语义部件集 合进行筛选,去掉成员部件数目小于预设最小值的聚类部件,得到候选语义部件集合; 步骤1-3)优化候选语义部件集合中各聚类部件的表示系数A' j:其中,A' ^表示候选语义部件集合中第j个聚类部件的表示系数,arg min表示函数 取最小值时Aj的值,11 · 11 2表示2范数,11 · 11 1表示Li范数,X」表示第j个聚类部件构 建的特征矩阵,I表示除去第j个聚类部件q之后,候选语义部件集合中其它的聚类部件 构建的特征矩阵,表示聚类部件q在特征矩阵Dj:的表示系数,λ表示用于平衡目标函 数中的正则化项; 再对候选语义部件集合中各聚类部件进行打分,打分的方法为步骤1-4)候选语义部件集合中各聚类部件的打分结果,选出分数高的前K个聚类部件 组成最终语义部件集合来训练分类器得到对于每一个聚类部件的语义部件检测器; 2) 检测步骤: 步骤2-1)对输入的待检测图像进行图像块划分,并提取划分后的图像块特征; 步骤2-2)将图像块特征输入语义部件检测器进行打分,待检测图像所有图像块的打 分完成后得到整幅待检测图像的置信度谱; 步骤2-3)根据置信度谱选择候选窗口,对各候选窗口进行打分,打分方法为:其中,F(W)表示当前窗口 W的分数,#;(·)表示计算括号内指定区域内像素值大于ρ的 像素的个数。Λ^(·)表示计算括号内指定区域内像素值小于P的像素的个数,P为待检测图 像的置信度谱的均值,Ws代表当前窗口 W的环绕窗口区域,W代表当前窗口所在区域; 步骤2-4)语义部件检测器将窗口分数大于门限值作为对象检测窗口,再除掉重叠率 较大的对象检测窗口,得到最终对象检测窗口结果。2. 如权利要求1所述,其特征在于,环 绕窗口区域%为当前窗口沿着水平垂直四个方向向外扩展30个像素后的区域。3. 如权利要求1所述,其特征在于,步 骤2-4)中使用非最大抑制NMS方法移除掉重叠率较大的窗口。4. 如权利要求1所述,其特征在于,所 述分类器为支持向量机SVM分类器。5.如权利要求1所述,其特征在于,所 述特征为方向梯度直方图HOG特征。【专利摘要】本专利技术提供。本专利技术提出的基于稀疏表示的判别性语义部件聚类提纯得到最终语义部件集合,以及利用学习的语义部件检测器的对象置信度谱获取检测结果。相对于现有基于部件的对象检测方法在对象模型训练过程中需要强监督信息且仅能对训练的特定类别对象进行检测,本专利技术语义部件学习过程完全自动化,且在整个部件学习过程中,仅需要对象的窗口标注信息,不需要提供更多的强监督部件信息;利用了不同类对象部件信息具有几何相似性的特点,基于不同类对象部件共享的方式,能对跨类别的对具有几何相似性的对象进行检测,提高了基于部件的对象检测算法的泛化性能。【IPC分类】G06K9-66【公开号】CN104537392【申请号】CN201410830356【专利技术人】李宏亮, 谢昱锐 【申请人】电子科技大学【公开日】2015年4月22日【申请日】2014年12月26日本文档来自技高网...
【技术保护点】
一种基于判别性语义部件学习的对象检测方法,其特征在于,包括以下步骤:1)训练步骤:步骤1‑1)将多类具有几何相似性对象的图像组成训练集合,人工标注训练集合中每幅图像的对象窗口区域,对对象窗口区域进行图像块划分,对所有图像块提取特征后进行聚类得到初始语义部件集合;步骤1‑2)根据初始语义部件集合中各聚类部件中的成员部件数目对初始语义部件集合进行筛选,去掉成员部件数目小于预设最小值的聚类部件,得到候选语义部件集合;步骤1‑3)优化候选语义部件集合中各聚类部件的表示系数A′j:Aj′=argminAj||Xj-DjAj||22+λ||Aj||1,]]>其中,A′j表示候选语义部件集合中第j个聚类部件的表示系数,arg min表示函数取最小值时Aj的值,||·||2表示2范数,||·||1表示L1范数,Xj表示第j个聚类部件构建的特征矩阵,Dj表示除去第j个聚类部件Cj之后,候选语义部件集合中其它的聚类部件构建的特征矩阵,Aj表示聚类部件Cj在特征矩阵Dj上的表示系数,λ表示用于平衡目标函数中的正则化项;再对候选语义部件集合中各聚类部件进行打分,打分的方法为:步骤1‑4)候选语义部件集合中各聚类部件的打分结果,选出分数高的前K个聚类部件组成最终语义部件集合来训练分类器得到对于每一个聚类部件的语义部件检测器;2)检测步骤:步骤2‑1)对输入的待检测图像进行图像块划分,并提取划分后的图像块特征;步骤2‑2)将图像块特征输入语义部件检测器进行打分,待检测图像所有图像块的打分完成后得到整幅待检测图像的置信度谱;步骤2‑3)根据置信度谱选择候选窗口,对各候选窗口进行打分,打分方法为:F(W)=Np+(W)Np-(W)-Np+(WS)Np-(WS)]]>其中,F(W)表示当前窗口W的分数,表示计算括号内指定区域内像素值大于p的像素的个数。表示计算括号内指定区域内像素值小于p的像素的个数,p为待检测图像的置信度谱的均值,WS代表当前窗口W的环绕窗口区域,W代表当前窗口所在区域;步骤2‑4)语义部件检测器将窗口分数大于门限值作为对象检测窗口,再除掉重叠率较大的对象检测窗口,得到最终对象检测窗口结果。...
【技术特征摘要】
【专利技术属性】
技术研发人员:李宏亮,谢昱锐,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。