当前位置: 首页 > 专利查询>清华大学专利>正文

一种基于回归模型的图像集合建模与匹配方法组成比例

技术编号:7759593 阅读:206 留言:0更新日期:2012-09-14 02:10
本发明专利技术提出了一种基于回归模型的图像集合建模与匹配方法,其包括如下步骤:组织训练图像集合;建立特征-类别回归模型;对测试图像集合进行投影;对测试图像集合进行分类。本发明专利技术针对具有任意样本分布形式的图像集合,采用样本特征与相应的类别标记学习双线性回归模型,建立起集合样本与其类别之间的本质语义关联;针对未知类别标记的集合,只需将其每个样本进行线性回归然后综合各样本的类别响应即可得到整体集合的类别输出。该方法直观高效,计算简便,其对集合样本的分布形式和集合样本的规模均无任何先验假设,对集合中可能存在的噪声数据具有很好的容忍性。

【技术实现步骤摘要】

本专利技术涉及计算机视觉
,特别涉及ー种基于回归模型的图像集合的建模与匹配方法。
技术介绍
长期以来,物体分类是计算机视觉研究中的ー项重要课题,分类器的训练和测试通常都是基于物体的单个或者很少量的样本进行的。随着摄像机和大容量存储设备等硬件技术的普及发展,在很多新的应用场景,例如视频监控、视频检索等任务中,可以获取到物体的大量图像数据,从而为后端分类问题的训练和测试阶段提供大量的样本,这些样本通常以图像集合的模式进行建模表示。在这类识别问题中,每个集合通常包含属于同一个物体类别的多个图像样本,这些图像样本涵盖了物体广泛的表观变化模式,比如姿态视角的变化、非刚性变形、光照变化等等。 基于图像集合的分类问题的难点在干,如何有效地刻画与建模集合中多幅图像的分布,并根据所建的模型综合利用多祥本提供的信息。近年来,典型的做法主要有两类,即分别从參数式与非參数式两个角度对图像集合建模,前者通常利用概率分布函数来表示图像集合的样本分布,进而采用诸如K-L散度之类的度量来计算两个概率分布函数之间的相似度。后者则根据图像集合中样本的本质变化模式将其建模为线性子空间或者更为一般的非线性流形,基于这种建模方式,集合匹配分类的问题就可以转化为子空间或者流形匹配的问题,从而采用子空间或者流形上的各种可能的相似性度量函数与匹配策略进行分类。总体而言,当前采用的这两类集合建模方法都对图像集合中样本分布的形式有一定程度的假设,而在实际问题中集合样本的来源通常是多种多祥的,当与模型所假设的样本分布形式差别较大时,分类效果就会有很大的偏差。
技术实现思路
本专利技术g在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于回归模型的图像集合的建模与匹配方法。为了实现本专利技术的上述目的,本专利技术提供了ー种基于回归模型的图像集合建模与匹配方法,其包括如下步骤SI :组织训练图像集合;S2 :建立特征-类别回归模型;S3 :对测试图像集合进行投影;S4 :对测试图像集合进行分类。本专利技术针对具有任意样本分布形式的图像集合,采用样本特征与相应的类别标记学习双线性回归模型,建立起集合样本与其类别之间的本质语义关联;针对未知类别标记的集合,只需将其每个样本进行线性回归然后综合各样本的类别响应即可得到整体集合的类别输出。该方法直观高效,计算简便,其对集合样本的分布形式和集合样本的规模均无任何先验假设,对集合中可能存在的噪声数据具有很好的容忍性。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中图I是本专利技术基于回归模型的图像集合建模与匹配方法的流程图;图2为本专利技术所采用的偏最小ニ乘回归方法的示意图。具体实施例方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过參考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。本专利技术提供了ー种基于回归模型的图像集合建模与匹配方法,如图I所示,其包括如下步骤SI:组织训练图像集合;S2 :建立特征-类别回归模型;S3 :对测试图像集合进行投影;S4 :对测试图像集合进行分类。本专利技术组织训练图像集合的方法为给定m个带有类别标签的训练图像集合,分别构造用于存放观察样本特征表示向量的预测矩阵X和用于存放观察样本类别指示向量的响应矩阵Y,其中,m为大于I的正整数。预测矩阵X的每一行对应ー个观察样本的特征表示向量,该特征表示向量可以是但不限于图像灰度特征、小波特征。响应矩阵Y的每一行对应ー个观察样本的类别属性指示向量。具体地,假设给定的类别数为c,那么响应矩阵Y的姆一行为c维的类别指示向量,如果ー个类别指示向量的第j个元素为1,其余元素全为0,即为,则表明当前观察样本属于第j类,其中,c为大于I的正整数,j为小于或等于c的正整数。本专利技术建立特征-类别回归模型的方法为采用偏最小ニ乘回归方法学习观察图像集合的预测矩阵X与响应矩阵Y之间的线性回归模型Y = XBpw如图2所示,该模型的具体求解步骤如下首先,根据构造的预测矩阵X和响应矩阵Y,定义偏最小ニ乘回归的目标函数X = ΤΡτ+ΕY = UQT+F其中,T为预测数据X对应的语义表示矩阵,U为响应数据Y对应的语义表示矩阵,P为X对应的荷载矩阵,Q为Y对应的荷载矩阵,E为X对应的残差矩阵,F为Y对应的残差矩阵。然后,采用迭代优化方法最大化目标语义空间变量T和U之间的协方差,在本实施方式中,可以采用但不限于NIPALS的方法求解目标语义空间变量T和U之间的协方差,其中,变量T和U之间为线性关系,具有U = TD+H,其中,D为对角矩阵,H为残差矩阵。最后,利用优化所得的变量T和U,推导出预测矩阵X与响应矩阵Y之间的关系Y= X(Pt)+DQt,得到线性回归模型Bm= (Pt)+DQt。通过这ー线性回归模型,可以建立不同类别观察数据的样本特征表示与其对应类别属性标签之间的本质语义关联,从而用于测试阶段的样本投影分类。本专利技术对测试集合进行投影的方法为给定未知类别的一个图像集合,按照训练图像集合的构造方式,将每个图像样本对应的特征表示向量作为观察图像预测矩阵Xt的一个行向量,利用训练阶段学习所得的线性回归模型Bpw得到测试图像样本集合对应的类别指示向量的响应矩阵Yt = XtBm。本专利技术对测试集合进行分类的方法为通过综合测试图像集合内各单样本的类别指示向量的投票得到。具体有两种投票方式第一种投票方式为首先根据各单样本对应的类别指示向量确定其所属类别,之 后依据各类别所对应的样本数进行最大数投票。具体操作为记录响应矩阵Yt每个行向量中最大元素所对应的位置标号,之后根据各标号出现的频次进行由大到小的排序,频次最高的标号即对应该测试图像集合的类别标号。第二种投票方式为首先将所有单样本的类别指示向量累加得到整体图像集合的类别指示向量,之后依据该类别指示向量针对不同类别的响应来进行投票。具体操作为累加矩阵Yt的所有行向量得到一个整体和向量,记录该和向量中最大元素值所对应的位置标号,即为给定测试图像集合的类别标号。在本说明书的描述中,參考术语“ー个实施例”、“一些实施例”、“示例”、“具体示例”、或“ー些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少ー个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管已经示出和描述了本专利技术的实施例,本领域的普通技术人员可以理解在不脱离本专利技术的原理和宗g的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由权利要求及其等同物限定。权利要求1.ー种基于回归模型的图像集合建模与匹配方法,其特征在于,包括如下步骤 Si:组织训练图像集合; S2:建立特征-类别回归模型; 53:对测试图像集合进行投影; 54:对测试图像集合进行分类。2.如权利要求I所述的基于回归模型的图像集合建模与匹配方法,其特征在于,所述本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:王瑞平戴琼海
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1