一种基于多模态字典学习的零样本分类方法技术

技术编号：14769835 阅读：231 留言：0更新日期：2017-03-08 13:52

一种基于多模态字典学习的零样本分类方法，包括：建立多模态字典学习模型；利用多模态字典学习模型学习字典矩阵D和兼容矩阵V；利用学习到的字典矩阵D和兼容矩阵V实现零样本分类。本发明专利技术的一种基于多模态字典学习的零样本分类方法，利用训练样本学习一个类别共享的字典矩阵将样本嵌入到一个由字典原子张成的隐空间中，并利用样本在隐空间中嵌入向量，样本对应的类别语义向量以及类别之间的对应关系学习一种联合嵌入模型。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种面向计算机视觉领域的零样本分类技术。特别是涉及一种将字典学习用于零样本分类的基于多模态字典学习的零样本分类方法。
技术介绍
与传统的机器学习方法不同，人类具有推断未知类别的能力，如：从未见过“斑马”的人能根据“斑马”的描述信息“斑马是与马相似，身上有黑边相间条纹的动物”对斑马进行识别。受人类推断能力的启发，零样本分类的目标能够对训练阶段未出现过的类别进行分类和预测。因此解决零样本分类的关键问题有两点：一是寻找一种有效的类别描述信息对未见过的类别进行表征；二是挖掘视觉特征和类别描述信息之间的匹配关系。针对问题一：研究者们提出了不同的类别描述信息对类别进行表征，如属性特征，类别文本描述特征等。针对问题二：因为样本的视觉特征和类别的语义特征分布在不同模态空间中，因此零样本分类可以看作是多模态学习的一种具体应用，基于多模态学习的零样本分类的基本框架为：在训练阶段，利用训练样本学习视觉特征和类别语义特征之间的映射关系，将样本从视觉空间转移到类别语义空间或者将不同模态空间中的特征转移到一个公共空间中。在测试阶段利用学习到的映射关系将样本嵌入到类别语义空间或者是公共空间中，根据样本对应的嵌入向量和类别对应的嵌入语义向量之间的关系，利用最近邻分类器进行分类。传统的零样本分类的性能很大程度上依赖类别语义信息的表征能力，而类别语义信息的获取过程与视觉样本的训练过程是独立的，因此获取的类别语义信息并不能保证充分地表征类别的语义。以斑马的语义表征“斑马是与马相似，身上有黑边相间条纹的动物”为例，类别的语义信息只是提供了基本的类别信息，并不能提供充分地判别信息；...
一种基于多模态字典学习的零样本分类方法

【技术保护点】
一种基于多模态字典学习的零样本分类方法，其特征在于，包括如下步骤：1)建立多模态字典学习模型：{D*,CS*,V*}=argminD,CS,V||XS-DCS||F2+α||CSTVAS-YS||F2+β||VAS||F2,s.t.||di||22≤1---(1)]]>其中，表示来自M个类别的m个样本，D为字典矩阵，CS表示训练样本XS在隐空间中的表征，V为兼容矩阵，表示M个类别的类别语义矩阵，α，β表示权重系数，||·||F表示Frobenius范数；2)利用多模态字典学习模型学习字典矩阵D和兼容矩阵V；3)利用学习到的字典矩阵D和兼容矩阵V实现零样本分类。

【技术特征摘要】
1.一种基于多模态字典学习的零样本分类方法，其特征在于，包...

【专利技术属性】
技术研发人员：冀中，于云龙，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人