图像模型训练方法、图像处理方法、装置、介质及设备制造方法及图纸

技术编号：37843152 阅读：9 留言：0更新日期：2023-06-14 09:48

本说明书实施例公开了一种图像模型训练方法、图像处理方法、装置、存储介质及设备。该方法包括：将样本图像划分为多个图像分块，确定各个图像分块对应的分块向量，多个图像分块对应的分块向量形成分块向量序列；将分块向量序列与类标识向量序列进行连接处理，生成连接向量序列；将连接向量序列输入到图像特征提取模型，获取与N个输入类标识向量对应的N个输出类标识向量；基于输出类标识向量以及样本图像的标签，确定图像特征提取模型的模型损失，模型损失包括类标识约束损失，类标识约束损失用于通过约束输出类标识向量来学习样本图像的多类图像特征；基于模型损失调整输入类标识向量的参数以及图像特征提取模型的参数。量的参数以及图像特征提取模型的参数。量的参数以及图像特征提取模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
图像模型训练方法、图像处理方法、装置、介质及设备

[0001]本说明书涉及机器学习
，尤其涉及一种图像模型训练方法、图像处理方法、装置、存储介质及设备。

技术介绍

[0002]随着机器学习技术的发展，图像识别技术的应用也越来越广泛，例如身份识别技术可以应用到安检、门禁以及支付等领域。
[0003]在一种技术方案中，通过训练多个深度学习模型来进行图像的表征学习，由于不同模型提取的图像特征存在差异，将不同模型提取的存在差异的图像特征进行集成，来对图像进行表征。然而，在这种技术方案中，对多个模型进行训练的效率较低并且成本较高。
[0004]因此，如何高效低成本地获取多样化的图像特征，成为了亟待解决的技术难题。

技术实现思路

[0005]本说明书提供一种图像模型训练方法、图像处理方法、装置、存储介质及设备，能够高效低成本地获取多样化的图像特征，提升模型的鲁棒性。
[0006]第一方面，本说明书实施例提供一种图像模型训练方法，包括：
[0007]将样本图像划分为多个图像分块，确定各个所述图像分块对应的分块向量，所述多个图像分块对应的所述分块向量形成分块向量序列；
[0008]将所述分块向量序列与类标识向量序列进行连接处理，生成连接向量序列，所述类标识向量序列包括N个输入类标识向量，N为大于或者等于2的正整数，所述类标识向量用于对所述样本图像进行表征；
[0009]将所述连接向量序列输入到图像特征提取模型，获取与N个所述输入类标识向量对应的N个输出类标识向量；...

【技术保护点】

【技术特征摘要】
1.一种图像模型训练方法，包括：将样本图像划分为多个图像分块，确定各个所述图像分块对应的分块向量，所述多个图像分块对应的所述分块向量形成分块向量序列；将所述分块向量序列与类标识向量序列进行连接处理，生成连接向量序列，所述类标识向量序列包括N个输入类标识向量，N为大于或者等于2的正整数，所述类标识向量用于学习所述样本图像的图像特征；将所述连接向量序列输入到图像特征提取模型，获取与N个所述输入类标识向量对应的N个输出类标识向量；基于所述输出类标识向量以及所述样本图像的标签，确定所述图像特征提取模型的模型损失，所述模型损失包括类标识约束损失，所述类标识约束损失用于通过约束所述输出类标识向量来学习所述样本图像的多类图像特征；基于所述模型损失调整所述输入类标识向量的参数以及所述图像特征提取模型的参数。2.根据权利要求1所述的方法，所述确定所述图像特征提取模型的所述类标识约束损失，包括：确定所述N个输出类标识向量中每两个输出类标识向量之间的距离；基于每两个输出类标识向量之间的距离，确定所述图像特征提取模型的所述类标识约束损失，其中，所述类标识约束损失用于使得各个所述输出类标识向量之间相互正交。3.根据权利要求2所述的方法，所述基于每两个输出类标识向量之间的距离，确定所述类标识约束损失，包括：对所述N个输出类标识向量中每两个输出类标识向量之间的距离进行求和，得到距离和；确定从所述N个输出类标识向量中取两个输出类标识向量的组合数；基于所述组合数对所述距离和进行平均处理，得到所述类标识约束损失。4.根据权利要求2所述的方法，所述基于每两个输出类标识向量之间的距离，确定所述图像特征提取模型的所述类标识约束损失，包括：基于每两个输出类标识向量之间的距离，确定所述每两个输出类标识向量对应的类标识对损失权重；基于所述类标识对损失权重，对所述N个输出类标识向量中每两个输出类标识向量之间的距离进行加权求和，确定所述图像特征提取模型的所述类标识约束损失。5.根据权利要求4所述的方法，所述基于每两个输出类标识向量之间的距离，确定所述每两个输出类标识向量对应的类标识对损失权重，包括：基于每两个输出类标识向量之间的距离，确定所述每两个输出类标识向量对应的归一化指数函数值；基于所述归一化指数函数值，确定所述每两个输出类标识向量对应的类标识对损失权重。6.根据权利要求1所述的方法，所述模型损失还包括分类损失，所述基于所述输出类标识向量以及所述样本图像的标签，确定所述图像特征提取模型的所述分类损失，包括：确定所述输出类标识向量与所述样本图像的标签之间的交叉熵；
基于所述交叉熵，确定所述图像特征提取模型的所述分类损失。7.根据权利要求1所述的方法，在所述将所述连接向量序列输入到图像特征提取模型之前，所述方法还包括：获取与所述多个图像分块中各个所述图像分块的位置信息对应的位置嵌入向量；将所述位置嵌入向量与所述连接向量序列中的对应的连接向量相加，得到相加后的所述连接向量序列。8.根据权利要求1所述的方法，所述确定各个所述图像分块对应的分块向量，包括：将各个所述图像分块对应的像素矩阵进行线性投影，得到各个所述图像分块对应的所述分块向量，所述方法还包括：基于各个所述图像分块对应的分块向量，形成所述分块向量序列。9.根据权利要求1所述的方法，所述将所述连接向量序列输入到图像特征提取模型，获取与N个所述输入类标识向量对应的N个输出类标识向量，包括：确定与连接向量序列中各个连接向量对应的查询向量、键向量以及值向量；对各个所述连接向量...

【专利技术属性】
技术研发人员：李文，程远，王萌，邹城，赵佳男，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人