模型更新方法及装置制造方法及图纸

技术编号:36084340 阅读:18 留言:0更新日期:2022-12-24 10:59
本发明专利技术提供了一种模型更新方法及装置,属于机器学习技术领域。模型更新方法,包括:在利用第一训练数据集合对商品识别模型进行训练之后,分别计算所述第一训练数据集合中每一样本数据的不确定性和典型代表性,其中,所述典型代表性为所述样本数据与第一向量之间的余弦距离,所述第一向量为所述样本数据所属类别对应的标准向量;根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合;获取第二训练数据集合,利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练。本发明专利技术的技术方案能够降低模型更新的训练时间。方案能够降低模型更新的训练时间。方案能够降低模型更新的训练时间。

【技术实现步骤摘要】
模型更新方法及装置


[0001]本专利技术涉及机器学习
,特别是指一种模型更新方法及装置。

技术介绍

[0002]基于深度学习的商品识别模型因其高准确性,广泛用于智能货架、智能冰柜等业务场景。实际应用中,当商品类别增加或外包装/产品外观更新时,数字图像处理方法往往需要重新训练,以支持新样本,而模型的迭代更新具有较高的时间及算力成本。

技术实现思路

[0003]本专利技术要解决的技术问题是提供一种模型更新方法及装置,能够降低模型更新的训练时间。
[0004]为解决上述技术问题,本专利技术的实施例提供技术方案如下:
[0005]一方面,提供一种模型更新方法,包括:
[0006]在利用第一训练数据集合对商品识别模型进行训练之后,分别计算所述第一训练数据集合中每一样本数据的不确定性和典型代表性,其中,第一训练数据集合包括多种类别的样本数据,所述典型代表性为所述样本数据与第一向量之间的余弦距离,所述第一向量为所述样本数据所属类别对应的标准向量;
[0007]根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合;
[0008]获取第二训练数据集合,利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练,其中,所述第二训练数据集合包括新增的1种或多种类别的样本数据,或,属于所述第一训练数据集合的多种类别中的至少1种类别的新增的样本数据。
[0009]一些实施例中,所述根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合包括:
[0010]按照所述不确定性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前N个样本数据,N为大于1的整数;
[0011]按照所述典型代表性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前M个样本数据,M为大于1的整数;
[0012]利用每一类别的所述N个样本数据和所述M个样本数据组成所述第一数据集合。
[0013]一些实施例中,计算样本数据的不确定性包括:
[0014]对所述样本数据进行数据增强,所述数据增强包括以下至少一项:水平剪切、竖直剪切、水平平移、竖直平移、随机旋转、颜色抖动、随机颜色位数调整,随机曝光调整、随机对比度调整、随机锐化、随机亮度调整、对比度最大化、直方图均衡、像素值反转;
[0015]利用所述商品识别模型预测数据增强后的样本数据的类别;
[0016]根据数据增强后的样本数据和预测的类别计算所述样本数据的不确定性。
[0017]一些实施例中,所述方法还包括获取所述第一向量的步骤,获取所述第一向量包
括:
[0018]对于每一类别,建立长度为S的特征队列,所述特征队列包括最新的S个训练样本数据的特征向量,S为大于20的整数;
[0019]计算所述S个训练样本数据的特征向量的第一均值;
[0020]在所述特征队列加入新的训练样本数据后,重新计算S个训练样本数据的特征向量的第二均值;
[0021]计算所述第一均值和所述第二均值的加权和作为所述第一向量。
[0022]一些实施例中,所述利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练包括:
[0023]对所述第一数据集合和所述第二训练数据集合中的训练数据进行数据增强后输入所述商品识别模型;
[0024]在训练过程中,利用损失函数和优化器的输出调整所述商品识别模型的参数,所述损失函数为第一损失函数和第二损失函数的加权和,所述第一损失函数为根据样本数据的标签和所述商品识别模型的输出计算得到,所述第二损失函数为根据所述商品识别模型的输出与第一向量之间的余弦距离计算得到。
[0025]一些实施例中,N等于M。
[0026]本专利技术的实施例还提供了一种模型更新装置,所述模型更新装置包括:
[0027]处理模块,用于在利用第一训练数据集合对商品识别模型进行训练之后,分别计算所述第一训练数据集合中每一样本数据的不确定性和典型代表性,其中,第一训练数据集合包括多种类别的样本数据,所述典型代表性为所述样本数据与第一向量之间的余弦距离,所述第一向量为所述样本数据所属类别对应的标准向量;
[0028]筛选模块,用于根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合;
[0029]训练模块,用于获取第二训练数据集合,利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练,其中,所述第二训练数据集合包括新增的1种或多种类别的样本数据,或,属于所述第一训练数据集合的多种类别中的至少1种类别的新增的样本数据。
[0030]一些实施例中,所述筛选模块包括:
[0031]第一筛选单元,用于按照所述不确定性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前N个样本数据,N为大于1的整数;
[0032]第二筛选单元,用于按照所述典型代表性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前M个样本数据,M为大于1的整数;
[0033]第三处理单元,用于利用每一类别的所述N个样本数据和所述M个样本数据组成所述第一数据集合。
[0034]一些实施例中,所述处理模块具体用于对所述样本数据进行数据增强,所述数据增强包括以下至少一项:水平剪切、竖直剪切、水平平移、竖直平移、随机旋转、颜色抖动、随机颜色位数调整,随机曝光调整、随机对比度调整、随机锐化、随机亮度调整、对比度最大化、直方图均衡、像素值反转;利用所述商品识别模型预测数据增强后的样本数据的类别;根据数据增强后的样本数据和预测的类别计算所述样本数据的不确定性。
[0035]一些实施例中,所述装置还包括:
[0036]获取模块,用于对于每一类别,建立长度为S的特征队列,所述特征队列包括最新的S个训练样本数据的特征向量,S为大于20的整数;计算所述S个训练样本数据的特征向量的第一均值;在所述特征队列加入新的训练样本数据后,重新计算S个训练样本数据的特征向量的第二均值;计算所述第一均值和所述第二均值的加权和作为所述第一向量。
[0037]一些实施例中,所述训练模块具体用于对所述第一数据集合和所述第二训练数据集合中的训练数据进行数据增强后输入所述商品识别模型;在训练过程中,利用损失函数和优化器的输出调整所述商品识别模型的参数,所述损失函数为第一损失函数和第二损失函数的加权和,所述第一损失函数为根据样本数据的标签和所述商品识别模型的输出计算得到,所述第二损失函数为根据所述商品识别模型的输出与第一向量之间的余弦距离计算得到。
[0038]本专利技术的实施例还提供了一种模型更新装置,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上所述的方法的步骤。
[0039]本专利技术的实施例具有以下有益效果:
[0040]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法,其特征在于,所述模型更新方法包括:在利用第一训练数据集合对商品识别模型进行训练之后,分别计算所述第一训练数据集合中每一样本数据的不确定性和典型代表性,其中,第一训练数据集合包括多种类别的样本数据,所述典型代表性为所述样本数据与第一向量之间的余弦距离,所述第一向量为所述样本数据所属类别对应的标准向量;根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合;获取第二训练数据集合,利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练,其中,所述第二训练数据集合包括新增的1种或多种类别的样本数据,或,属于所述第一训练数据集合的多种类别中的至少1种类别的新增的样本数据。2.根据权利要求1所述的模型更新方法,其特征在于,所述根据每一样本数据的不确定性和典型代表性从所述第一训练数据集合中筛选出第一数据集合包括:按照所述不确定性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前N个样本数据,N为大于1的整数;按照所述典型代表性的从高到低对所述第一训练数据集合中每一类别的样本数据进行排序,选取前M个样本数据,M为大于1的整数;利用每一类别的所述N个样本数据和所述M个样本数据组成所述第一数据集合。3.根据权利要求1所述的模型更新方法,其特征在于,计算样本数据的不确定性包括:对所述样本数据进行数据增强,所述数据增强包括以下至少一项:水平剪切、竖直剪切、水平平移、竖直平移、随机旋转、颜色抖动、随机颜色位数调整,随机曝光调整、随机对比度调整、随机锐化、随机亮度调整、对比度最大化、直方图均衡、像素值反转;利用所述商品识别模型预测数据增强后的样本数据的类别;根据数据增强后的样本数据和预测的类别计算所述样本数据的不确定性。4.根据权利要求1所述的模型更新方法,其特征在于,所述方法还包括获取所述第一向量的步骤,获取所述第一向量包括:对于每一类别,建立长度为S的特征队列,所述特征队列包括最新的S个训练样本数据的特征向量,S为大于20的整数;计算所述S个训练样本数据的特征向量的第一均值;在所述特征队列加入新的训练样本数据后,重新计算S个训练样本数据的特征向量的第二均值;计算所述第一均值和所述第二均值的加权和作为所述第一向量。5.根据权利要求1所述的模型更新方法,其特征在于,所述利用所述第一数据集合和所述第二训练数据集合对所述商品识别模型再次进行训练包括:对所述第一数据集合和所述第二训练数据集合中的训练数据进行数据增强后输入所述商品识别模型;在训练过程中,利用损失函数和优化器的输出调整所述商品识别模型的参数,所述损失函数为第一损失函数和第二损失函数的加权和,所述第一损失函数为根据样本数据的标签和所述商品识别模型的输出计算得到,所述第二损失函数为根据所述商品识别模型的输出与第一向量之间的余弦距离计算得到。
6.根据权利要求2所述的模型更新方法,其特征在于,N等于M。7.一种模型更新装置,其特征在于,所述...

【专利技术属性】
技术研发人员:钟盼
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1