一种基于智能协同学习的多标签标注方法技术

技术编号:29311498 阅读:34 留言:0更新日期:2021-07-17 02:19
本发明专利技术涉及一种以改进的标签嵌入方法为核心的多标签标注算法,包含以下步骤:民族服饰图案标签体系及数据集的构建,通过对民族服饰图案的特点及内容进行分析,形成一套有关民族服饰图案的标签体系,并在这套体系的基础上,构建一套民族服饰图案数据集;利用深度学习方法对民族服饰图案图像进行特征提取;通过构建标签网络来表达标签之间的关系,优化标签网络的权值表示;通过拉普拉斯特征降维方法对标签网络进行压缩并保留原始标签网络的结构;结合集成学习以及多标签分类学习器对民族服饰图案进行自动标注。饰图案进行自动标注。饰图案进行自动标注。

【技术实现步骤摘要】
一种基于智能协同学习的多标签标注方法


[0001]本专利技术涉及机器学习
,特别是涉及一种基于智能协同学习的多标签标注方法。

技术介绍

[0002]民族服饰图案领域,某一图像涉及文化领域的多个方面,包括名称、寓意、构型、颜色等字段。对于此类具有多义性图像数据,往往不能用单标签来完整地阐述其所有内容,而多标签标注能够比较准确完整地描述民族服饰图案地文化内容,用户可以通过自动标注的方式来获取丰富的民族服饰图案文化内容。
[0003]多标签标注是当下机器学习领域热门的研究方向,研究者们提出的基于标签嵌入的多标签标注方法适用于纷繁冗杂的民族服饰图案数据,比较好地解决了标签空间过大,以及样本标签类别不平衡地问题。
[0004]但标签嵌入方法在标签空间降维方面存在着一些问题,尤其是标签数量过大时,会产生降维提取不准确、速度过慢等问题,所以需要在标签嵌入的前置操作以及其本身进行优化。

技术实现思路

[0005]本专利技术的目的在于,克服现有技术的上述缺点,提供一种基于智能协同学习的多标签标注方法。可以对民族服饰图案文化内容进行自动标注。
[0006]本专利技术提供的一种基于智能协同学习的多标签标注方法,其特征在于:包括以下步骤:
[0007]步骤1、获取民族服饰图案图像,并进行人工标注,形成一套完整的民族服饰图案数据及对应的标签内容,每个标签内容包含有若干独立标签;
[0008]步骤2、将民族服饰图案数据及对应的标签内容分为训练集和验证集;
[0009]步骤3、在训练集中对算法模型进行训练,具体步骤如下:
[0010]3.1、通过残差网络提取训练集中民族服饰图案数据的特征向量,所有特征向量构成图像特征空间;
[0011]3.2、将训练集的每个独立标签作为网络结构中的一个节点,当两个标签同时出现在一个样本示例中时,两标签之间形成一条边,通过标签共现频率构成所述边的权重,完成标签网络的构建,其中,每条边的权重计算公式如下:
[0012][0013][0014]w(i,j)代表标签i与标签j之间边的权重,其中,分子代表标签i和标签j在训练集
的民族服饰图案的标签内容中同时出现的次数,分母代表标签i和标签j在训练集的民族服饰图案的标签内容中出现的总数,y
s,i
=1表示样本s中存在标签i,y
s,j
=1表示样本s中存在标签j;w
i
,w
j
分别代表标签网络中以标签i、标签j为端点的边的权重所构成的权重向量,为经过核函数构造的权重值,c为常量,0<c<1;
[0015]3.3、将标签网络通过拉普拉斯特征映射进行降维,获得标签嵌入空间,通过聚合方法确定每个图像特征向量所对应的标签嵌入向量;
[0016]3.4、利用训练集对决策树集成回归模型进行训练,输入数据为训练集中每幅图像的图像特征向量和所对应的标签嵌入向量;
[0017]步骤4、使用验证集进行多标签标注
[0018]4.1、通过残差网络提取验证集中民族服饰图案数据的特征向量,所有特征向量构成图像特征空间;
[0019]4.2、使用已完成训练的集对决策树集成回归模型对图像特征空间进行回归,输出与图像特征向量对应的标签嵌入向量;
[0020]4.3、利用分类器对回归后得到的标签嵌入向量进行多标签分类,得到验证集的最终预测结果即图像标注结果。
[0021]本专利技术创新在于:
[0022]1.构建标签网络来表达标签之间的关系,并通过核函数优化标签网络的权值表示。
[0023]2.将深度学习模型、嵌入方法、集成学习方法、多标签分类方法结合形成新的多标签标注算法,并取得更好的标注效果。
附图说明
[0024]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1为专利技术实施例提供的基于智能协同学习的多标签标注方法的流程图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]具体的,本实施例提基于智能协同学习的多标签标注方法包括以下步骤:
[0028]S110、通过对书籍数字化扫描的手段进行民族服饰图案图像的获取,并通过标注软件进行人工标注,形成一套完整的民族服饰图案数据及对应的标签内容,每个标签内容包含有若干独立标签。
[0029]S120、使用数据集构建程序对图像和标签内容处理为计算机0/1邻接矩阵,形成适用于算法模型的训练集和验证集。本例中,按照9:1的比例随机将所述数据集划分为训练集
和验证集两个部分。
[0030]S130、在训练集中对算法模型进行训练,具体步骤如下:
[0031]a1、通过残差网络提取训练集中民族服饰图案数据的特征向量,所有特征向量构成图像特征空间。
[0032]本步骤中,利用适应于多标签分类的目标函数BCEWithLogitsLoss,对经过ImageNet预训练后的Resnet模型通过民族服饰图案数据集进行图像特征提取。
[0033]具体过程如下:
[0034]随机选取输入的图片224*224大小的区域,并且利用水平翻转来增加输入图片样本,并且使用标准颜色增强。将Resnet中原有的全连接层剔除,重新构建全连接层,利用适应于多标签分类的目标函数BCEWithLogitsLoss,对经过ImageNet预训练后的Resnet模型对民族服饰图案数据集进行图像特征提取。从Resnet全连接层之前将2048维图像特征输出。BCELoss可以计算预测输出和真实输出之间的二元损失,作为单标签分类的判断依据。BCEwithLogitsLoss是Sigmoid函数与BCELoss函数的结合。本步骤中所用计算模型均为现有模型,参见论文:He K,Zhang X,Ren S,et al.Deep Residual Learning for Image Recognition[C].IEEE Conference on Computer Vision and Pattern Recognition(CVPR).IEEE Computer Society,2016.(请提供)。
[0035]a2、将训练集中每个标签作为网络结构中的一个节点,当两个标签同时出现在一个样本示例中时,两标签之间形成一条边,通过标签共现频率构成边的权重,完成标签网络的构建,其中,每条边的权重计算公式如下:
[0036][0037][003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能协同学习的多标签标注方法,其特征在于:包括以下步骤:步骤1、获取民族服饰图案图像,并进行人工标注,形成一套完整的民族服饰图案数据及对应的标签内容,每个标签内容包含有若干独立标签;步骤2、并将民族服饰图案数据及对应的标签内容分为训练集和验证集;步骤3、在训练集中对算法模型进行训练,具体步骤如下:3.1、通过残差网络提取训练集中民族服饰图案数据的特征向量,所有特征向量构成图像特征空间;3.2、将训练集的每个独立标签作为网络结构中的一个节点,当两个标签同时出现在一个样本示例中时,两标签之间形成一条边,通过标签共现频率构成所述边的权重,完成标签网络的构建,其中,每条边的权重计算公式如下:网络的构建,其中,每条边的权重计算公式如下:w(i,j)代表标签i与标签j之间边的权重,其中,分子代表标签i和标签j在训练集的民族服饰图案的标签内容中同时出现的次数,分母代表标签i和标签j在训练集的民族服饰图案的标签内容中出现的总数,y
s,i
=1表示样本s中存在标签i,y
s,j
=1表示样本s中存在标签j;w
i
,w
j
分别代表标签网络中以标签i、标签j为端点的边的权重所构成的权重向量,为经过核函数构造的权重值,c为常量,0<c<1;3.3、将标签网络通过拉普拉斯特征映射进行降维,获得标签嵌入空间,通过聚合方法确定每个图像特征向量所对应的标签嵌入向量;3.4、利用训练集对决策树集成回归模型进行训练,输入数据为训练集中每幅图像的图像特征向量和所对应的标签嵌入向量;步骤4、使用验证集进行多标签标注4.1、通过残差网络提取验证集中民族服饰图案数据的特...

【专利技术属性】
技术研发人员:赵海英贺延钊
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1