特征分析方法、装置、设备及存储介质制造方法及图纸

技术编号:34839875 阅读:11 留言:0更新日期:2022-09-08 07:36
本申请涉及一种特征分析方法、装置、设备及存储介质。该方法包括获取第一评估数据集以及N个第二评估数据集;采用第一评估数据集对深度模型进行评估,得到第一模型评估指标;以及分别采用各第二评估数据集对深度模型进行评估,得到N个第二模型评估指标;基于第一模型评估指标和各第二模型评估指标,分析各特征的重要度。由于对深度模型进行评估的每个第二评估数据集中的特征为第一评估数据集中的M个特征去除任意一个特征后的特征,所以,基于第一模型评估指标和第二模型评估指标可以分析得到M个特征中所去除的特征的重要度。例如当第二模型评估指标相较于第一模型评估指标相差较多时,可以确定从M个特征中所去除的特征比较重要。较重要。较重要。

【技术实现步骤摘要】
特征分析方法、装置、设备及存储介质


[0001]本申请涉及计算机领域,尤其涉及一种特征分析方法、装置、设备及存储介质。

技术介绍

[0002]深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,通过模仿人脑的机制来解释数据。随着计算机和互联网的飞速发展,深度学习在大数据处理、人工智能分析等方面占有越来越重要的地位。
[0003]当前,实现深度学习的深度模型具有的参数比较多,一般可达千万级别的神经元,其表示的能力远超N维线性方程,因此深度模型的可解释性很差,大多数时候,算法人员很难知道是哪个特征起了作用,哪些特征丝毫不启作用,甚至起到反作用。

技术实现思路

[0004]本申请提供了一种特征分析方法、装置、设备及存储介质,用以对对模型进行评估的评估数据集中的特征进行分析。
[0005]一种特征分析方法,包括:
[0006]获取第一评估数据集以及N个第二评估数据集;所述第一评估数据集包括M个特征;任意一个所述第二评估数据集中的特征为从所述M个特征去除任意一个特征后的特征;任意两个所述第二评估数据集中的特征不完全相同;
[0007]采用所述第一评估数据集对深度模型进行评估,得到第一模型评估指标;以及分别采用各所述第二评估数据集对所述深度模型进行评估,得到N个第二模型评估指标;
[0008]基于所述第一模型评估指标和各所述第二模型评估指标,分析各所述特征的重要度;
[0009]其中,所述N个第二模型评估指标中,距离所述第一模型评估指标近的第二模型评估指标所对应的特征的重要度,低于距离所述第一模型评估指标远的第二模型评估指标所对应的特征的重要度。
[0010]可选地,基于所述第一模型评估指标和各所述第二模型评估指标,分析各所述特征的重要度,包括:
[0011]分别计算所述第一模型评估指标与各所述第二模型评估指标的第一差值;
[0012]基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度;
[0013]所述目标特征为所述第二模型评估指标对应的第二评估数据集相对于所述第一评估数据集所缺少的特征。
[0014]可选地,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:
[0015]对于各第一差值中的任意两个第一差值,确定第一差值大的第二模型评估指标对应的目标特征的重要度,高于第一差值小的第二模型评估指标对应的目标特征的重要度。
[0016]可选地,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:
[0017]对各所述第一差值进行降序排序;
[0018]确定降序排序后排序在前的第一差值的第二模型评估指标对应的目标特征的重要度,高于排序在后的第一差值的第二模型评估指标对应的目标特征的重要度。
[0019]可选地,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:
[0020]分别对各所述第一差值进行归一化处理,得到各所述第一差值各自的归一化结果;
[0021]基于各所述归一化结果,确定与各所述第二模型评估指标各自对应的目标特征的重要度。
[0022]可选地,分别对各所述第一差值进行归一化处理,得到各所述第一差值各自的归一化结果,包括:
[0023]获取各所述第一差值中的最大值和最小值;
[0024]计算所述最大值和所述最小值的第二差值;
[0025]对于各所述第一差值中的任一第一差值执行以下处理:
[0026]计算所述第一差值与所述最小值的第三差值;
[0027]计算所述第三差值与所述第二差值的比值;
[0028]将所述比值作为所述第一差值的归一化结果。
[0029]可选地,基于各所述归一化结果,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:
[0030]对各所述归一化结果进行降序排序;
[0031]确定降序排序后排序在前的归一化结果对应的目标特征的重要度,高于排序在后的归一化结果对应的目标特征的重要度。
[0032]一种特征分析装置,包括:
[0033]获取模块,用于获取第一评估数据集以及N个第二评估数据集;所述第一评估数据集包括M个特征;任意一个所述第二评估数据集中的特征为从所述M个特征去除任意一个特征后的特征;任意两个所述第二评估数据集中的特征不完全相同;
[0034]评估模块,用于采用所述第一评估数据集对深度模型进行评估,得到第一模型评估指标;以及分别采用各所述第二评估数据集对所述深度模型进行评估,得到N个第二模型评估指标;
[0035]分析模块,用于基于所述第一模型评估指标和各所述第二模型评估指标,分析各所述特征的重要度;
[0036]其中,所述N个第二模型评估指标中,距离所述第一模型评估指标近的第二模型评估指标所对应的特征的重要度,低于距离所述第一模型评估指标远的第二模型评估指标所对应的特征的重要度。
[0037]一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现上述的特征分析方法。
[0038]一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的特征分析方法。
[0039]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的技术方案中,获取第一评估数据集以及N个第二评估数据集;第一评估数据集包括N个特征;任意一个第二评估数据集中的特征为从N个特征去除任意一个特征后的特征;任意两个第二评估数据集中的特征不完全相同;采用第一评估数据集对深度模型进行评估,得到第一模型评估指标;以及分别采用各第二评估数据集对深度模型进行评估,得到N个第二模型评估指标;基于第一模型评估指标和各第二模型评估指标,分析各特征的重要度。由于对深度模型进行评估的每个第二评估数据集中的特征为第一评估数据集中的M个特征去除任意一个特征后的特征,所以,基于第一模型评估指标和第二模型评估指标可以分析得到M个特征中所去除的特征的重要度。例如当第二模型评估指标相较于第一模型评估指标相差较多时,可以确定从M个特征中所去除的特征比较重要。
附图说明
[0040]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0041]图1为本申请实施例中网络系统的结构示意图;
[0042]图2为本申请实施例中特征分析方法的流程示意图;
[0043]图3为本申请实施例中特征分析装置的结构示意图;
[0044]图4为本申请实施例中电子设备的结构示意图。
具体实施方式
[0045]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征分析方法,其特征在于,包括:获取第一评估数据集以及N个第二评估数据集;所述第一评估数据集包括M个特征;任意一个所述第二评估数据集中的特征为从所述M个特征去除任意一个特征后的特征;任意两个所述第二评估数据集中的特征不完全相同;采用所述第一评估数据集对深度模型进行评估,得到第一模型评估指标;以及分别采用各所述第二评估数据集对所述深度模型进行评估,得到N个第二模型评估指标;基于所述第一模型评估指标和各所述第二模型评估指标,分析各所述特征的重要度;其中,所述N个第二模型评估指标中,距离所述第一模型评估指标近的第二模型评估指标所对应的特征的重要度,低于距离所述第一模型评估指标远的第二模型评估指标所对应的特征的重要度。2.根据权利要求1所述的方法,其特征在于,基于所述第一模型评估指标和各所述第二模型评估指标,分析各所述特征的重要度,包括:分别计算所述第一模型评估指标与各所述第二模型评估指标的第一差值;基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度;所述目标特征为所述第二模型评估指标对应的第二评估数据集相对于所述第一评估数据集所缺少的特征。3.根据权利要求2所述的方法,其特征在于,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:对于各第一差值中的任意两个第一差值,确定第一差值大的第二模型评估指标对应的目标特征的重要度,高于第一差值小的第二模型评估指标对应的目标特征的重要度。4.根据权利要求2所述的方法,其特征在于,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:对各所述第一差值进行降序排序;确定降序排序后排序在前的第一差值的第二模型评估指标对应的目标特征的重要度,高于排序在后的第一差值的第二模型评估指标对应的目标特征的重要度。5.根据权利要求2所述的方法,其特征在于,基于各所述第一差值,确定与各所述第二模型评估指标各自对应的目标特征的重要度,包括:分别对各所述第一差值进行归一化处理,得到各所述第一差值各自的归一化结果;基于各...

【专利技术属性】
技术研发人员:李灏
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1