一种卷积神经网络的神经节点的影响因子分析方法及装置制造方法及图纸

技术编号:23363733 阅读:26 留言:0更新日期:2020-02-18 17:35
本发明专利技术公开了一种卷积神经网络的神经节点的影响因子分析方法及装置,本发明专利技术所提供的基于PageRank的卷积神经网络可视化算法,提供了大多数卷积神经网络训练过程中都需要的通用模块,如:调整参数、选择重要节点、降低计算量、归一化处理、重要影响因子分析、输入输出结果的流向等功能,并可以与任何标准化的卷积神经网络和多种评价节点重要关联程度的指标的集成,以高效率,高精度的关联分析和最大限度的利用已有数据。解决传统卷积神经网络调整参数时的盲目和结果的不可解释性,依靠全局遍历所有参数组合和算法调参经验进行模型调优的可解释性不高,效率慢,费时等问题,更大地提高了卷积神经网络的可解释性和模型的准确性。

An influence factor analysis method and device of neural nodes in convolution neural network

【技术实现步骤摘要】
一种卷积神经网络的神经节点的影响因子分析方法及装置
本专利技术涉及大数据领域,特别涉及一种卷积神经网络的神经节点的影响因子分析方法及装置。
技术介绍
首先,在现有卷积神经网络训练过程中,尽管卷积神经网络对于输入额图像或其他类型的数据具有强大的特征提取功能,但是对于初学者和没有项目调参经验的项目执行者可科研工作者来说,输出结果的不可解释性很难得到一个很好的归宿,一度被认为是暴力算法,所以对输出结果的可解释性提出了很大的需求。现有的卷积神经网络的调参往往都是根据暴力组合模型参数,随机选取模型组合参数择优作为最终结果,或者基于经验来盲目调参,对于具体的调参方向还没有一个更加科学的方法,对于业务迁徙场景下的应用效果也不是很好。反而在调参过程中耗费了大量的人力,计算力和时间,对于所做的项目采取的方法也无法正确的说出为什么这么做,在迁徙上难度更是加深。因此寻找一种对于结果的可解释性就非常有必要,同时能够为模型调参提供改进模型的方法方向就显得非常有必要。传统的基于卷积神经网络的局限性。当前所有知名的图像检测团队在面对庞大,冗杂的数据时仍然需要使用深度学习,卷积神经网络进行特征的学习,图像边缘的获取,但是对于初学者以及没有训练经验和模型嫁接能力非常差的情况下,亟需实现可视化图像检测流行图侦察蓝判定卷积神经网络里哪些神经节点对于最终的结果有较大影响,对于实现不同的业务场景下的不同节点的作用也需要进行可视化分析,方便后续调参,更加针对性的去优化模型和算法,从而达到很好的模型训练和测试效果。而许多高深有效的人工智能框架的功能、特征、倾向性均由美国等发布组织所把持,这也是整个人工智能产业难以在不同领域实现商用的重要原因之一,因为中小型公司几乎只能使用这些公开的框架进行上层包装式研发,受限技术实力,缺乏根据真实需求和不同应用深度定制一个标准的可视化流行图的方法。
技术实现思路
本专利技术的目的在于:提供了一种卷积神经网络的神经节点的影响因子分析方法及装置,解决了现有公开的框架只能进行上层包装式研发,用户受限技术实力,缺乏根据真实需求和不同应用深度定制一个标准的可视化流行图的方法。本专利技术采用的技术方案如下:一种卷积神经网络的神经节点的影响因子分析方法,包括以下步骤:对神经网络的神经节点进行分析,标记每个神经节点的分布,获取神经节点与层之间的联系、神经节点与神经节点之间的联系;确定中心节点,根据神经节点与层之间的联系、神经节点与神经节点之间的联系,使用PageRank拓展算法按照IV指标、基尼指数指标、熵指标、信息增益指标、皮尔逊相关指标高斯混合模型指标、层内间距指标和层间间距指标中的至少两种指标对每个神经节点对中心节点的影响因子进行迭代训练;当所有指标在单位时间内的变化小于阈值时,停止迭代训练,输出前N个综合指标最小、影响因子最大的神经节点;N为正整数;根据前N个综合指标最小、影响因子最大的神经节点得到对应中心节点的神经节点影响分析模型。本方案采用8种PageRank具体衡量指标来对判定待分析节点是否参与中心节点的构成。第一个指标是IV指标,用于挑选节点,IV就越大,该待分析节点就对中心节点的构成参与越多。第二个指标是Gini增益指标,是不纯度衡量指标。分别计算待分析的节点中的数据加入到中心节点的子节点Gini增益,找到使得Gini增益最小的中心节点,把待分析的节点加入到中心节点的影响因子子节点中去。第三个指标是熵指标,是不纯度衡量指标。对一个节点而言,中心节点有它和没它时信息量将发生变化,而前后信息量的差值就是这个节点特征给系统带来的信息量,即熵。分别计算待分析的节点中的数据加入到中心节点的影响因子节点的子序列中的熵,找到使得熵最小的N个节点,把待分析的节点放入中心节点影响因子的子节点序列中,建立边连接,进行可视化。第四个指标是信息增益指标,衡量标准是看节点特征能够为中心节点系统带来多少信息,带来的信息越多,该节点越重要。信息增益能考察待分析节点对每个中心节点的贡献。第五个指标是皮尔逊相关指标,用来衡量两个节点的子集合是否符合统一分布,变化规律是否一致,可以衡量节点间的线性关系。相关系数的绝对值越大,相关性越强:相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。第六个指标是距离相关系数指标,计算待分析的节点和中心节点的距离,层间距离逆排序,选出使得N个待分析节点与中心节点的距离最小的节点。第七个指标是高斯混合模型指标,分别拟合中心节点的子节点序列和待分析节点的子序列的高斯混合模型,若待分类节点的参数和某个中心节点的参数的方差和欧式距离最小,则认为待分析节点和中心节点的流向一致,可以认为待分析节点是中心节点的一个子节点。第八个指标是层间间距指标。分别计算待分析的节点和中心节点之间的层间间距,使得层间间距保持即使距离较远,但是仍然保持着很大的影响因子,这里采取的是路径距离的归一化,可以更加直观的获取节点之间的影响关系。相对于传统的节点关联算法,我们综合8个指标,来训练对于每一个节点,每一个表格指标的权重,根据节点的特征偏重于选择哪些指标来进行关联实现很好的效果,这不仅对特定的数据具有深攻性,也具有很好的鲁棒性。实现换一批数据,依然能够训练得出好的聚类关联推荐效果。使用综合评判待分类节点是否应该加入到某一中心节点中,此处使用机器学习中常用的加权求和的综合评价指标方法。通过训练各个指标的权重参数获得最优PageRank权重模型。其中参数对应于每一个节点的权重子节点。相对于传统的一个或者两个指标来评价节点关联程度,此处结合了8种评价指标,对应于特定的节点,训练得出偏重的更适合的评价指标来进行关联,实现了节点的影响因子分析,从而实现更合理、更直观、更准确的可视化流形分析方法。中心节点是使用k-means算法对所有节点进行聚类分析得出聚类分析结果数据,进而通过各个类簇内部数据求组内平均值来确定的各个中心节点。进一步的,对神经网络的神经节点进行分析前还包括对神经节点数据进行数据预处理。进一步的,所述数据预处理包括数据准备和数据特征工程。为了使机器学习算法在数据集上获得最优的精确性,数据预处理必不可少。其特征在于对数据进行整理,整合,方便后续的统一关联,所述数据预处理模块分为两个步骤,其一是数据准备,其二是数据特征工程,采用如下流程工作:数据准备中,接收多站点传输过来的数据的操作,数据清洗可使数据获得用于分析的正确形状(shape)和质量(quality);该操作依次包括了许多不同的功能,例如:1、基本功能,包括:选择、过滤、去重等;2、采样,包括:平衡(balanced)、分层(stratified)等;3、数据分配,包括:创建训练数据集、验证数据集和测试数据集等;4、变换,包括:归一化、标准化、缩放、pivoting等;5、分箱,包括:计数、缺失值处理等;6、数据替换,包括:剪切(cutting)、分割(splitting)、合并等;<本文档来自技高网
...

【技术保护点】
1.一种卷积神经网络的神经节点的影响因子分析方法,其特征在于:包括以下步骤:/n对神经网络的神经节点进行分析,标记每个神经节点的分布,获取神经节点与层之间的联系、神经节点与神经节点之间的联系;/n确定中心节点,根据神经节点与层之间的联系、神经节点与神经节点之间的联系,使用PageRank拓展算法按照IV指标、基尼指数指标、熵指标、信息增益指标、皮尔逊相关指标高斯混合模型指标、层内间距指标和层间间距指标中的至少两种指标对每个神经节点对中心节点的影响因子进行迭代训练;/n当所有指标在单位时间内的变化小于阈值时,停止迭代训练,输出前N个综合指标最小、影响因子最大的神经节点;N为正整数;/n根据前N个综合指标最小、影响因子最大的神经节点得到对应中心节点的神经节点影响分析模型。/n

【技术特征摘要】
1.一种卷积神经网络的神经节点的影响因子分析方法,其特征在于:包括以下步骤:
对神经网络的神经节点进行分析,标记每个神经节点的分布,获取神经节点与层之间的联系、神经节点与神经节点之间的联系;
确定中心节点,根据神经节点与层之间的联系、神经节点与神经节点之间的联系,使用PageRank拓展算法按照IV指标、基尼指数指标、熵指标、信息增益指标、皮尔逊相关指标高斯混合模型指标、层内间距指标和层间间距指标中的至少两种指标对每个神经节点对中心节点的影响因子进行迭代训练;
当所有指标在单位时间内的变化小于阈值时,停止迭代训练,输出前N个综合指标最小、影响因子最大的神经节点;N为正整数;
根据前N个综合指标最小、影响因子最大的神经节点得到对应中心节点的神经节点影响分析模型。


2.根据权利要求1所述的一种卷积神经网络的神经节点的影响因子分析方法,其特征在于:对神经网络的神经节点进行分析前还包括对神经节点数据进行数据预处理。


3.根据权利要求2所述的一种卷积神经网络的神经节点的影响因子分析方法,其特征在于:所述数据预处理包括数据准备和数据特征工程。


4.根据权利要求1所述的一种卷积神经网络的神经节点的影响因子分析方法,其特征在于:对应中心节点的神经节点影响分...

【专利技术属性】
技术研发人员:查文宇张艳清王伟才潘小东殷腾蛟王纯斌赵神州
申请(专利权)人:成都四方伟业软件股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1