一种分类模型可迁移性确定方法技术

技术编号:39517266 阅读:21 留言:0更新日期:2023-11-25 18:55
本发明专利技术公开了一种分类模型可迁移性确定方法

【技术实现步骤摘要】
一种分类模型可迁移性确定方法、装置、设备及存储介质


[0001]本专利技术涉及分类模型可迁移性评估领域,特别涉及一种分类模型可迁移性确定方法

装置

设备及存储介质


技术介绍

[0002]模型可迁移性评估旨在验证已训练好的分类模型在不同领域

任务或数据集中的适应性和泛化能力

分类模型的可迁移性越高则可以认为在新任务中的性能越好

现有技术中对于模型可迁移性的评估是通过直接迁移的方法,将分类模型直接应用到需要分类的新任务中,通过测试准确率和计算评估指标来评估其性能,因为需要计算全部新任务数据,效率较低且耗费计算资源


技术实现思路

[0003]本专利技术的目的在于提供一种分类模型可迁移性确定方法

装置

设备及存储介质,应用于分类模型可迁移性评估领域,该方法通过确定分类模型中各类别图像的类别相关卷积核,进而获取各类别图像的特征向量,通过特征向量计算各类别之间的可分离度来评估可迁移性,相比于将新任务数据全部输入分类模型,根据测试结果评估其可迁移性,本专利技术方法降低了评估时间,节省了计算资源

[0004]为解决上述技术问题,本专利技术提供一种分类模型可迁移性确定方法,包括:
[0005]确定目标任务集中各目标类别的类别相关卷积核;
[0006]通过所述类别相关卷积核计算所述目标任务集中图像的特征向量;
[0007]根据所述特征向量计算各所述目标类别的类别可分离度;
[0008]根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值;
[0009]基于所述可迁移数值确定所述分类模型的可迁移性

[0010]可选的,所述确定目标任务集中各目标类别的类别相关卷积核,包括:
[0011]从所述目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
[0012]计算所述类别图像集在各卷积层的特征图;
[0013]根据所述特征图计算各卷积核对所述目标类别的重要度系数;
[0014]基于所述重要度系数确定所述目标类别的所述类别相关卷积核

[0015]可选的,所述确定目标任务集中各目标类别的类别相关卷积核,包括:
[0016]从目标任务集的各类别图像中选取预设数量的图像构建类别图像集;
[0017]计算所述类别图像集在各卷积层的特征图;
[0018]根据所述特征图计算各卷积核对所述目标类别的重要度系数;
[0019]基于所述重要度系数确定所述目标类别的所述类别相关卷积核

[0020]可选的,所述根据所述特征图计算各卷积核对所述目标类别的重要度系数,包括:
[0021]计算预测类别对所述特征图的一阶微分;
[0022]将所述一阶微分输入第一模型计算所述卷积核的所述重要度系数,所述第一模型
的表达式为:
[0023][0024]其中,为第
r
层所述卷积层中第
k
个所述卷积核对第
n
个所述目标类别的重要度系数,为矩阵元素求和运算,为第
n
个所述预测类别对所述类别图像集中图像
x
在第
r
层所述卷积层中第
k
个所述特征图的所述一阶微分

[0025]可选的,所述根据所述特征向量计算各所述目标类别的类别可分离度,包括:
[0026]计算各所述目标类别所包含图像的所述特征向量的均值与方差;
[0027]根据所述均值与所述方差计算各所述目标类别之间的
Bhattacharyya
系数

[0028]可选的,所述计算各所述目标类别所包含图像的所述特征向量的均值与方差,包括:
[0029]将各所述目标类别所包含图像的所述特征向量输入第二模型计算所述均值与所述方差,所述第二模型的表达式为:
[0030][0031]其中,
μ
q
为目标类别
q
所包含图像的所述特征向量的所述均值,

q
为所述目标类别
q
所包含图像的所述特征向量的所述方差,
N
q
表示所述目标类别
q
所包含图像的数量,为第
i
张图像的所述特征向量,
T
为矩阵转置,
y
i
为第
i
张图像的所述目标类别

[0032]可选的,所述根据所述均值与所述方差计算各所述目标类别之间的
Bhattacharyya
系数,包括:
[0033]判断所述目标任务集中各所述目标类别是否均服从高斯分布;
[0034]若是,根据所述均值与所述方差计算各所述目标类别的高斯分布,将所述高斯分布输入第三模型计算各所述目标类别的所述
Bhattacharyya
系数,所述第三模型的表达式为:
[0035][0036]其中,
BC(q
i
,q
j
)
为目标类别
q
i
与目标类别
q
j
的所述
Bhattacharyya
系数,为所述目标类别
q
i
所述的所述高斯分布,为所述目标类别
q
j
的所述高斯分布;
[0037]若否,将所述均值与所述方差输入第四模型计算各所述目标类别的
Bhattacharyya
距离,根据所述
Bhattacharyya
距离计算各所述目标类别的所述
Bhattacharyya
系数,所述第四模型的表达式为:
[0038][0039]其中,
BD(q
i
,q
j
)
为所述目标类别
q
i
与所述目标类别
q
j
的所述
Bhattacharyya
距离,为所述目标类别
q
i
所包含图像的所述特征向量的所述均值,为所述目标类别
q
i
所包含图像的所述特征向量的所述方差,为所述目标类别
q
j
所包含图像的所述特征向量的所述均值,为所述目标类别
q
j
所包含图像的所述特征向量的所述方差

[0040]可选的,所述根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值,包括:
[0041]将所述
Bhattacharyya
系数输入第五模型计算所述可迁移数值,所述第五模型的表达式为:...

【技术保护点】

【技术特征摘要】
1.
一种分类模型可迁移性确定方法,其特征在于,包括:确定目标任务集中各目标类别的类别相关卷积核;通过所述类别相关卷积核计算所述目标任务集中图像的特征向量;根据所述特征向量计算各所述目标类别的类别可分离度;根据所述类别可分离度计算分类模型对所述目标任务集的可迁移数值;基于所述可迁移数值确定所述分类模型的可迁移性
。2.
根据权利要求1所述分类模型可迁移性确定方法,其特征在于,所述确定目标任务集中各目标类别的类别相关卷积核,包括:从所述目标任务集的各类别图像中选取预设数量的图像构建类别图像集;计算所述类别图像集在各卷积层的特征图;根据所述特征图计算各卷积核对所述目标类别的重要度系数;基于所述重要度系数确定所述目标类别的所述类别相关卷积核
。3.
根据权利要求2所述分类模型可迁移性确定方法,其特征在于,所述根据所述特征图计算各卷积核对所述目标类别的重要度系数,包括:计算预测类别对所述特征图的一阶微分;将所述一阶微分输入第一模型计算所述卷积核的所述重要度系数,所述第一模型的表达式为:其中,为第
r
层所述卷积层中第
k
个所述卷积核对第
n
个所述目标类别的重要度系数,为矩阵元素求和运算,为第
n
个所述预测类别对所述类别图像集中图像
x
在第
r
层所述卷积层中第
k
个所述特征图的所述一阶微分
。4.
根据权利要求1所述分类模型可迁移性确定方法,其特征在于,所述根据所述特征向量计算各所述目标类别的类别可分离度,包括:计算各所述目标类别所包含图像的所述特征向量的均值与方差;根据所述均值与所述方差计算各所述目标类别之间的
Bhattacharyya
系数
。5.
根据权利要求4所述分类模型可迁移性确定方法,其特征在于,所述计算各所述目标类别所包含图像的所述特征向量的均值与方差,包括:将各所述目标类别所包含图像的所述特征向量输入第二模型计算所述均值与所述方差,所述第二模型的表达式为:其中,
μ
q
为目标类别
q
所包含图像的所述特征向量的所述均值,

q
为所述目标类别
q

包含图像的所述特征向量的所述方差,
N
q
表示所述目标类别
q
所包含图像的数量,为第
i
张图像的所述特征向量,
T
为矩阵转置,
y
i
为第
i
张图像的所述目标类别
。6.
根据权利要求4所述分类模型可迁移性确定方法,其特征在于,所述根据所述均值与所述方差计算各所述目标类别之间的
Bhattacharyya
系数,包括:判断所述目标任务集中各所述目标类别是否均服从高斯分布;若是,根据所述均值与所述方差计算各所述目标类别的高斯分布,将所述高斯分布输入第三模型计算各所述目标类别的所述
Bhattacharyya
系数,所述第三模...

【专利技术属性】
技术研发人员:宋杰张晨旭程晓宋明黎陈咏涛陈涛田鹏
申请(专利权)人:国网重庆市电力公司电力科学研究院国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1