一种字符的确定方法、装置、存储介质及电子装置制造方法及图纸

技术编号:35926729 阅读:18 留言:0更新日期:2022-12-10 11:21
本发明专利技术实施例提供了一种字符的确定方法、装置、存储介质及电子装置,其中,该方法包括:按照第一采样规则从训练数据集中抽取第一训练数据,以及按照第二采样规则从训练数据集中抽取第二训练数据;将第一训练数据输入至目标网络模型中包括的第一分支网络中,确定第一训练数据的第一特征;将第二训练数据输入至目标网络模型中包括的第二分支网络中,确定第二训练数据的第二特征;基于目标网络模型中包括的分类模型的网络参数融合第一特征以及第二特征,得到融合特征;基于融合特征确定目标网络模型的目标损失值,并基于目标损失值迭代更新目标网络模型的目标网络参数。通过本发明专利技术,达到提高确定字符的准确性的效果。到提高确定字符的准确性的效果。到提高确定字符的准确性的效果。

【技术实现步骤摘要】
一种字符的确定方法、装置、存储介质及电子装置


[0001]本专利技术实施例涉及通信领域,具体而言,涉及一种字符的确定方法、装置、存储介质及电子装置。

技术介绍

[0002]随着卷积神经网络的发展,图像分类和识别领域取得了长足的进步。这种进步与获得高质量的大规模数据集密不可分。常见的大规模数据集ImageNet,COCO,Places Database等都是经典的分类数据集,这些数据集的特点是类别标签的大致均匀分布,但是在现实世界中的数据集上,通常会有分布的长尾效应。
[0003]车牌识别数据中,长尾分布尤其明显,因为各个省份数据采集的难易程度,往往会造成数据分布的严重不均匀,比如A、B、C等省份的图片相对容易采集,所以每个省份的图片数量比较多,但是类似D、E、F等地区的车牌图片采集难度相对困难,所以每个省份的图片数量也会相对较少。这种不同省份的车牌数量分布的极度不均衡,会导致的结果是:车牌识别数据比较多的省份的识别准确率比较高,车牌识别数据比较少的省份的识别准确率就会相对低很多,从而影响整体的识别准确率。
[0004]所谓长尾效应是指,数据集中的一少部分类别(头部类别)占据了绝大多数样本量,大多数的类别(尾部类别)仅有非常少的样本量。而在现有技术中,长尾效应的优化方式往往存在数据丢失、后续处理难度大、模型算力要求高等问题。
[0005]由此可知,相关技术中存在由于模型训练数据存在长尾效应,导致通过模型确定字符不准确的问题。
[0006]针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。

技术实现思路

[0007]本专利技术实施例提供了一种字符的确定方法、装置、存储介质及电子装置,以至少解决相关技术中存在的由于模型训练数据存在长尾效应,导致通过模型确定字符不准确的问题。
[0008]根据本专利技术的一个实施例,提供了一种字符的确定方法,包括:将目标数据输入至目标网络模型中,确定所述目标数据的目标特征;基于所述目标特征确定所述目标数据对应的目标字符; 其中,所述目标网络模型是通过如下方式进行训练的:按照第一采样规则从训练数据集中抽取第一训练数据,以及按照第二采样规则从所述训练数据集中抽取第二训练数据,所述训练数据集中包括第一类型的训练数据和第二类型的训练数据,所述第一类型的训练数据的数量大于所述第二类型的训练数据的数量,所述第一采样规则包括每个训练数据被抽取到的概率相同,所述第二采样规则包括所述第二类型的训练数据被抽取到的概率大于所述第一类型的训练数据被抽取到的概率,所述第一训练数据、所述第二训练数据以及所述目标数据为采集设备采集到的数据;将所述第一训练数据输入至目标网络模型中包括的第一分支网络中,确定所述第一训练数据的第一特征;将所述第二训练数据输
入至所述目标网络模型中包括的第二分支网络中,确定所述第二训练数据的第二特征;基于所述目标网络模型中包括的分类模型的网络参数融合所述第一特征以及所述第二特征,得到融合特征;基于所述融合特征确定所述目标网络模型的目标损失值,并基于所述目标损失值迭代更新所述目标网络模型的目标网络参数。
[0009]根据本专利技术的另一个实施例,提供了一种字符的确定装置,包括:第一确定模块,用于将目标数据输入至目标网络模型中,确定所述目标数据的目标特征;第二确定模块,用于基于所述目标特征确定所述目标数据对应的目标字符;其中,所述目标网络模型是通过如下方式进行训练的:按照第一采样规则从训练数据集中抽取第一训练数据,以及按照第二采样规则从所述训练数据集中抽取第二训练数据,所述训练数据集中包括第一类型的训练数据和第二类型的训练数据,所述第一类型的训练数据的数量大于所述第二类型的训练数据的数量,所述第一采样规则包括每个训练数据被抽取到的概率相同,所述第二采样规则包括所述第二类型的训练数据被抽取到的概率大于所述第一类型的训练数据被抽取到的概率,所述第一训练数据、所述第二训练数据以及所述目标数据为采集设备采集到的数据;将所述第一训练数据输入至目标网络模型中包括的第一分支网络中,确定所述第一训练数据的第一特征;将所述第二训练数据输入至所述目标网络模型中包括的第二分支网络中,确定所述第二训练数据的第二特征;基于所述目标网络模型中包括的分类模型的网络参数融合所述第一特征以及所述第二特征,得到融合特征;基于所述融合特征确定所述目标网络模型的目标损失值,并基于所述目标损失值迭代更新所述目标网络模型的目标网络参数。
[0010]根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项中所述的方法的步骤。
[0011]根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0012]通过本专利技术,将目标数据输入至目标网络模型中,确定目标数据的目标特征,根据目标特征确定目标数据对应的目标字符,其中,目标网络模型是通过如下方式进行训练的:按照第一采样规则从训练数据集中抽取第一训练数据,以及按照第二采样规则从训练数据集中抽取第二训练数据。将第一训练数据输入值目标网络模型中包括的第一分支网络中,确定第一训练数据的第一特征,将第二训练数据输入至目标网络模型中包括的第二分支网络中,确定第二训练数据的第二特征。根据目标网络模型中包括的分类模型的网络参数融合第一特征以及第二特征,得到融合特征,根据融合特征确定目标网络模型的目标损失值,根据目标损失值迭代更新目标网络模型的目标网络参数。由于在进行模型训练时,将按照不同采样规则抽取的训练数据分别输入值不同的分支网络中,确定每个分支网络输出的特征,并根据分类模型的网络参数融合第一特征和第二特征,并根据融合特征确定目标损失值,因此,能够兼顾第一类型的训练数据和第二类型的训练数据,从而提高了训练后的模型的精度。因此,可以解决相关技术中存在的由于模型训练数据存在长尾效应,导致通过模型确定字符不准确的问题,达到提高确定字符的准确性的效果。
附图说明
[0013]图1是本专利技术实施例的一种字符的确定方法的移动终端的硬件结构框图;图2是根据本专利技术实施例的字符的确定方法的流程图;图3是根据本专利技术示例性实施例的长尾效应示意图;图4是根据本专利技术具体实施例的字符的确定方法中的模型训练方法流程图;图5是根据本专利技术实施例的字符的确定装置的结构框图。
具体实施方式
[0014]下文中将参考附图并结合实施例来详细说明本专利技术的实施例。
[0015]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0016]本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本专利技术实施例的一种字符的确定方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符的确定方法,其特征在于,包括:将目标数据输入至目标网络模型中,确定所述目标数据的目标特征;基于所述目标特征确定所述目标数据对应的目标字符;其中,所述目标网络模型是通过如下方式进行训练的:按照第一采样规则从训练数据集中抽取第一训练数据,以及按照第二采样规则从所述训练数据集中抽取第二训练数据,所述训练数据集中包括第一类型的训练数据和第二类型的训练数据,所述第一类型的训练数据的数量大于所述第二类型的训练数据的数量,所述第一采样规则包括每个训练数据被抽取到的概率相同,所述第二采样规则包括所述第二类型的训练数据被抽取到的概率大于所述第一类型的训练数据被抽取到的概率,所述第一训练数据、所述第二训练数据以及所述目标数据为采集设备采集到的数据;将所述第一训练数据输入至所述目标网络模型中包括的第一分支网络中,确定所述第一训练数据的第一特征;将所述第二训练数据输入至所述目标网络模型中包括的第二分支网络中,确定所述第二训练数据的第二特征;基于所述目标网络模型中包括的分类模型的网络参数融合所述第一特征以及所述第二特征,得到融合特征;基于所述融合特征确定所述目标网络模型的目标损失值,并基于所述目标损失值迭代更新所述目标网络模型的目标网络参数。2.根据权利要求1所述的方法,其特征在于,基于所述目标网络模型中包括的分类模型的分类网络参数融合所述第一特征以及所述第二特征,得到融合特征包括:确定所述第一分支网络对应的第一权重,以及所述第二分支网络对应的第二权重;将所述第一特征与所述第一权重相乘,得到第三特征,以及将所述第二特征与所述第二权重相乘,得到第四特征;基于所述分类网络参数融合所述第三特征以及所述第四特征,得到所述融合特征。3.根据权利要求2所述的方法,其特征在于,基于所述分类网络参数融合所述第三特征以及所述第四特征,得到所述融合特征包括:确定所述分类网络参数中包括的第一子分类网络参数以及第二子分类网络参数,其中,所述第一子分类网络参数为第一子分类网络的参数,所述第一子分类网络与所述第一分支网络连接,所述第二子分类网络参数为第二子分类网络的参数,所述第二子分类网络与所述第二分支网络连接;将所述第三特征与所述第一子分类网络参数相乘,得到第五特征,以及将所述第四特征与所述第二子分类网络参数相乘,得到第六特征;连接所述第五特征以及所述第六特征,得到所述融合特征。4.根据权利要求3所述的方法,其特征在于,基于所述融合特征确定所述目标网络模型的目标损失值包括:基于所述第五特征确定所述第一分支网络的第一损失值;基于所述第六特征确定所述第二分支网络的第二损失值;基于所述第一损失值以及所述第二损失值确定所述目标网络模型的目标损失值。5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:赵之健汪传坤林亦宁
申请(专利权)人:上海闪马智能科技有限公司杭州闪马智擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1