一种用于美学质量评价的构图表征学习方法技术

技术编号：25187998 阅读：78 留言：0更新日期：2020-08-07 21:15

本发明专利技术公开了一种用于美学质量评价的构图表征学习方法。本发明专利技术步骤如下：步骤(1)数据预处理，将所有数据集的图片经过调整尺寸和裁剪的操作缩放到统一大小；步骤(2)特征提取及全连接图构建，分别对两个预训练的Moblinet v2进行微调构成全局特征提取网络和构图特征提取网络，分别用来提取全局特征和构图特征；利用提取出来的构图特征构建全连接图；步骤(3)全局特征与构图特征相融合，将提取出来的全局特征与构图特征输入门控单元进行特征融合，获取融合特征；步骤(4)美学分数预测以及准确率度量。本发明专利技术提出了利用构图特征构建全连接图并与全局特征融合，而且获得了目前图片美学质量评价中的最好效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于美学质量评价的构图表征学习方法
本专利技术提到了一种用于美学质量评价的构图表征学习(RepresentationLearningofImageCompositionforAestheticEvaluation)的新方法，主要涉及一种利用卷积神经网络进行训练，对得到的深层特征即构图信息和全局信息进行表征学习的方式，以构建一个与人工评价结果更加一致的准确率较高的美学质量评价模型。
技术介绍
图像美学质量评价(PhotoQualityAssessment)是基于对图像的艺术理解通过计算方式准确的评估图片的美学质量。PQA应用空间广泛，例如最优图像筛选和自动搜索相机设置。此外，研究人员已在探索利用PQA从美学角度重构和增强图片。之前研究人员主要利用手动设计的特征通过“浅表”机器学习技术判断图片是否专业。手工特征主要是基于专家知识的亮度对比，构图几何，构图以及场景构图等，然后利用支持向量机和神经网络等机器学习方法产生二进制美学标签。所以传统方法主要面向分类问题，即明确美学质量的好与坏。近期受到机器学习在各领域取得成功的启发，卷积神经网络(CNN)被用于训练图片美学评价模型，并且取得了不错的进展。虽然PQA工作有一定的进展，但还是有很大的进步空间。现有方法方法大部分将图片输入CNN模型以取得美学质量评价结果，考虑到裁剪等数据预处理造成图片信息丢失，研究人员提出增加图片块和显著性图等补充信息作为额外输入，但额外的目标检测算法增加了计算复杂度；此外，尽管构图信息与美学质量评价息息相关，现存方法却很少将构图信息...

【技术保护点】
1.一种用于美学质量评价的构图表征学习方法,其特征在于包括如下步骤：/n步骤(1)数据预处理/n将所有数据集的图片经过调整尺寸和裁剪的操作缩放到统一大小；/n步骤(2)特征提取及全连接图构建/n分别对两个预训练的Moblinet v2进行微调构成全局特征提取网络和构图特征提取网络，分别用来提取全局特征和构图特征；/n利用提取出来的构图特征构建全连接图；/n所述的微调是指用指定的训练集对Moblinet v2进行训练，得到所需参数的指定网络；/n步骤(3)全局特征与构图特征相融合/n将提取出来的全局特征与构图特征输入门控单元进行特征融合，获取融合特征；/n步骤(4)美学分数预测以及准确率度量/n将融合特征输入美学评价模块得到美学质量分数，与数据集中原有的人工评分进行比较，计算美学质量分数的准确率。/n

【技术特征摘要】
1.一种用于美学质量评价的构图表征学习方法,其特征在于包括如下步骤：
步骤(1)数据预处理
将所有数据集的图片经过调整尺寸和裁剪的操作缩放到统一大小；
步骤(2)特征提取及全连接图构建
分别对两个预训练的Moblinetv2进行微调构成全局特征提取网络和构图特征提取网络，分别用来提取全局特征和构图特征；
利用提取出来的构图特征构建全连接图；
所述的微调是指用指定的训练集对Moblinetv2进行训练，得到所需参数的指定网络；
步骤(3)全局特征与构图特征相融合
将提取出来的全局特征与构图特征输入门控单元进行特征融合，获取融合特征；
步骤(4)美学分数预测以及准确率度量
将融合特征输入美学评价模块得到美学质量分数，与数据集中原有的人工评分进行比较，计算美学质量分数的准确率。

2.根据权利要求1所述的一种用于美学质量评价的构图表征学习方法,其特征在于步骤(1)所述的数据预处理：
1-1AVA数据集是一个包含25万多张图片的大型美学数据集，我们按照标准数据集划分方法，随机取80％的图片作为训练集，其余20％的数据集作为测试集；
1-2对图片进行预处理时先将图片缩放到256*256大小，然后对图片进行随机裁剪，大小变为224*224；
为防止过拟合，对训练集图片进行数据增强，所有图片进行随机水平翻转。

3.根据权利要求2所述的一种用于美学质量评价的构图表征学习方法,其特征在于步骤(2)所述的特征提取及全连接图构建：
2-1分别对两个预训练的Moblinetv2进行微调构成全局特征提取网络和构图特征提取网络用来进行特征提取；
将整张图片分别输入全局特征提取网络和构图特征提取网络，分别得到全局特征F1和构图特征F2,F1,F2∈R7×7×1280；
2-2全连接图的构建如下：把构图特征提取网络输出的构图特征F2中，设每个位置Xi视为一个节点，其中i＝1,2…,N；Xi位置对应的特征向量为节点特征；任意节点特征之间的余弦相似性视为边；该边的信息即图片的构图特征；对全局特征提取网络输出的全局特征F1进行全局池化，得到池化后包含全局信息的全局特征；
所述的全局特征F1和构图特征F2均为7*7的矩阵，矩阵中的每个位置作为节点；
所述的构图特征提取网络的输出的构图特征F2有N＝W×H个位置，其中W和...

【专利技术属性】
技术研发人员：俞俊，高飞，尚梅梅，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人