数据处理方法、装置、电子设备及可存储介质制造方法及图纸

技术编号:38542133 阅读:18 留言:0更新日期:2023-08-19 17:10
本申请涉及一种数据处理方法、装置、电子设备及可存储介质。该方法包括:获取训练样本数据集,并将所述训练样本数据集输入至深度学习网络模型,获得由所述深度学习网络模型中损失函数处理模块输出的N个损失值;分别根据所述N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值;根据所述N个损失值中各个损失值、以及所述N个损失值中各个损失值对应的权重值,获得总体损失值;根据所述总体损失值对所述深度学习网络模型进行训练优化。本申请提供的方案,能够提高深度学习网络的预测准确度,提高深度学习网络的训练效果。果。果。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及可存储介质


[0001]本申请涉及数据处理
,尤其涉及一种数据处理方法、装置、电子设备及可存储介质。

技术介绍

[0002]深度学习是一个复杂的机器学习算法,它的最终目标是让机器人能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。在深度学习过程中,首先将每一批次的训练数据输入模型,通过前向传播输出预测值,然后应用损失函数计算预测值与真实值的差异值,即损失(loss)值,得到损失值后模型再通过反向传播训练网络。
[0003]对于一次训练的不同样本,会产生多个不同的损失值,相关技术的深度学习过程中,通常是以样本中各个损失值的平均值作为最终损失值,但是采用上述损失函数进行深度学习网络模型训练时,其训练效果不佳,进而导致在进行例如图像分类处理、图像识别处理等操作时效果不佳。

技术实现思路

[0004]为解决或部分解决相关技术中存在的问题,本申请提供一种数据处理方法、装置、电子设备及可存储介质,能够提高深度学习网络的预测准确度,提高深度学习网络的训练效果。
[0005]本申请第一方面提供一种数据处理方法,包括:
[0006]获取训练样本数据集,并将所述训练样本数据集输入至深度学习网络模型,获得由所述深度学习网络模型的损失函数处理模块输出的N个损失值;
[0007]分别根据所述N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值;
[0008]根据所述N个损失值中各个损失值、以及所述N个损失值中各个损失值对应的权重值,获得总体损失值;
[0009]根据所述总体损失值对所述深度学习网络模型进行训练优化。
[0010]在一实施方式中,所述分别根据所述N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值,包括:
[0011]分别根据所述N个损失值中各个损失值,获得所述N个损失值的均值;
[0012]根据所述N个损失值中各个损失值、以及所述N个损失值的均值,获得所述N个损失值中各个损失值对应的权重值。
[0013]在一实施方式中,所述根据所述N个损失值中各个损失值、以及所述N个损失值的均值,获得所述N个损失值中各个损失值对应的权重值,包括:
[0014]根据所述N个损失值中各个损失值、所述N个损失值的均值以及超参数,获得所述N个损失值中各个损失值对应的权重值。
[0015]在一实施方式中,通过激活函数获得所述N个损失值中各个损失值对应的权重值。
[0016]在一实施方式中,所述通过激活函数获得所述N个损失值中各个损失值对应的权重值,包括:
[0017]根据所述N个损失值中各个损失值l
i
、所述N个损失值的均值m以及超参数K,通过以下公式获得所述N个损失值中各个损失值对应的权重值w
i

[0018][0019]在一实施方式中,所述通过激活函数获得所述N个损失值中各个损失值对应的权重值,包括:
[0020]根据所述N个损失值中各个损失值l
i
、所述N个损失值的均值m以及超参数K,通过以下公式获得所述N个损失值中各个损失值对应的权重值w
i

[0021][0022]在一实施方式中,所述根据所述N个损失值中各个损失值、以及所述N个损失值中各个损失值对应的权重值,获得总体损失值,包括:
[0023]根据所述N个损失值中各个损失值l
i
、以及所述N个损失值中各个损失值对应的权重值w
i
,通过以下公式获得总体损失值Loss:
[0024][0025]本申请第二方面提供一种数据处理装置,包括:
[0026]获取单元,用于获取训练样本数据集,并将所述训练样本数据集输入至深度学习网络模型,获得由所述深度学习网络模型的损失函数处理模块输出的N个损失值;
[0027]第一计算单元,用于分别根据所述获取单元获取的N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值;
[0028]第二计算单元,用于根据所述获取单元获取的N个损失值中各个损失值、以及所述第一计算单元获得的N个损失值中各个损失值对应的权重值,获得总体损失值;
[0029]更新模块,用于根据所述第二计算单元获得的总体损失值对所述深度学习网络模型进行训练优化。
[0030]本申请第三方面提供一种电子设备,包括:
[0031]处理器;以及
[0032]存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
[0033]本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
[0034]本申请提供的技术方案可以包括以下有益效果:
[0035]通过降低对预测效果好(损失值数值更小)的位置的关注度、增大对预测效果差(损失值数值更大)的位置的关注度,使得深度学习网络模型在预测效果差的位置的性能提升,有助于提高效果差的位置的预测效果,能够提高深度学习网络的预测准确度,提高深度学习效果。该方法用于图像分类处理时,可以获得较好的分类效果。
[0036]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本申请。
附图说明
[0037]通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其他目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
[0038]图1是本申请实施例示出的数据处理方法的流程示意图;
[0039]图2是本申请实施例示出的数据处理装置的结构示意图;
[0040]图3是本申请实施例示出的电子设备的结构示意图。
具体实施方式
[0041]下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
[0042]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0043]应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取训练样本数据集,并将所述训练样本数据集输入至深度学习网络模型,获得由所述深度学习网络模型中损失函数处理模块输出的N个损失值;分别根据所述N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值;根据所述N个损失值中各个损失值、以及所述N个损失值中各个损失值对应的权重值,获得总体损失值;根据所述总体损失值对所述深度学习网络模型进行训练优化。2.根据权利要求1所述的方法,其特征在于,所述分别根据所述N个损失值中各个损失值,获得所述N个损失值中各个损失值对应的权重值,包括:分别根据所述N个损失值中各个损失值,获得所述N个损失值的均值;根据所述N个损失值中各个损失值、以及所述N个损失值的均值,获得所述N个损失值中各个损失值对应的权重值。3.根据权利要求2所述的方法,其特征在于,所述根据所述N个损失值中各个损失值、以及所述N个损失值的均值,获得所述N个损失值中各个损失值对应的权重值,包括:根据所述N个损失值中各个损失值、所述N个损失值的均值以及超参数,获得所述N个损失值中各个损失值对应的权重值。4.根据权利要求2或3所述的方法,其特征在于,通过激活函数获得所述N个损失值中各个损失值对应的权重值。5.根据权利要求4所述的方法,其特征在于,所述通过激活函数获得所述N个损失值中各个损失值对应的权重值,包括:根据所述N个损失值中各个损失值l
i
、所述N个损失值的均值m以及超参数K,通过以下公式获得所述N个损失值中各个损失值对应的权重值w
i
:6.根据权利要求4所述的方法,其特征在于,所述通过激活函数获得所述N个损失值中各个损失值对应的权重...

【专利技术属性】
技术研发人员:单国航万如贾双成孟鹏飞
申请(专利权)人:智道网联科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1