一种基于残差网络的烟叶智能分级模型及利用该模型分级的方法技术

技术编号:32873135 阅读:34 留言:0更新日期:2022-04-02 12:03
本发明专利技术公开了基于残差网络的烟叶智能分级模型及利用其分级的方法,该模型为先对烟叶图像进行编码,再将烟叶等级映射数字编码,创建样本和标签表格,接着将表格数据划分为训练集、测试集和验证集,利用深度学习残差网络对训练集和验证集进行不断的迭代训练,直至训练出最优的烟叶等级模型。通过基于卷积残差神经网络搭建自定义训练模型对烟叶进行智能分级。在预处理模块加入图像增强功能,扩充烟叶样本的多态性,提高模型的兼容能力。在卷积神经网络模块中加入了正则化,解决网络中过拟合的现象。在自定义网络模型中添加了空洞卷积,空洞卷积在不增加网络参数量的情况下,增大了感受野区域,有效的提高了烟叶分级模型的准确率。有效的提高了烟叶分级模型的准确率。

【技术实现步骤摘要】
一种基于残差网络的烟叶智能分级模型及利用该模型分级的方法


[0001]本专利技术属于烟叶分级
,具体涉及一种基于残差网络的烟叶智能分级模型及利用该模型分级的方法。

技术介绍

[0002]烟叶是烟制品生产中的重要原料,将质量不同的烟叶加以区分,卷烟工业才能针对各级别的质量特点,调配各种风格的卷烟,并保持卷烟产品的质量稳定。不同质量的烟叶具有不同的使用价值,也具有不同的经济价值。只有经过准确分级,才能使各种烟叶的质量得以充分体现。目前采用的烟叶分级方法是人工分级,主要依靠烟叶分级工的经验和感官判断,耗时、费力且具有很大的主观性;分级准确率则依赖于分级工的经验和环境,所以烟叶的智能分级势在必行。
[0003]近年来,烟叶智能分级方面的研究主要集中在基于图像特征的分级方法。利用烟叶图像提取与人工分级因素相关的颜色、纹理和几何等图像特征,采用一定分类方法进行烟叶的分级识别。但对于相邻等级烟叶,其图像交叉特征明显,等级标准难以统一规范,导致烟叶分级识别效率低、分级不稳定的问题,不利于烟叶分级的规模化生产。

技术实现思路

[0004]本申请的专利技术目的在于提供一种基于残差网络的烟叶智能分级模型,同时还提供了及利用该模型的分级方法,旨在提供一种稳定的分级模型及高效的分级方法,能够有效实时的对烟叶进行分级预测,提高烟叶分级的识别效率。
[0005]一种基于残差网络的烟叶智能分级模型,先对烟叶图像进行编码,再将烟叶等级映射数字编码,将编码转化为images和labels列表,之后根据这两个列表的信息创建样本和标签表格,接着将表格数据按照8:1:1的比例划分为训练集、测试集和验证集,利用深度学习残差网络对训练集和验证集进行不断的迭代训练,直至训练出最优的烟叶等级模型。
[0006]具体步骤为:
[0007]步骤1:烟叶样本处理
[0008]步骤1.1将烟叶样本按照42等级分为42个文件夹,并以等级名称作为重命名,将对应的烟叶分别按照等级存放在对应等级文件夹下;
[0009]步骤1.2将烟叶42等级编码为[0,41]的数字,烟叶等级和数字的映射关系成为编码表;
[0010]步骤1.3对步骤1.2所述的编码表确定后,根据烟叶的实际存储方式获取每个烟叶样本的存储路径和它对应的标签数字,分别表示为images和labels两个列表对象,其中images列表对象存储了每个样本的路径字符串,labels列表存储了样本的类别数字,两者长度一致,且对应元素位置相互关联;
[0011]步骤1.4将步骤1.3所述images和labels存储到样本和标签表格CSV中;
[0012]步骤2:烟叶图像预处理
[0013]步骤2.1读取image列表对应路径的图片,并转换为张量形式;
[0014]步骤2.3对读取转换完成的图像进行数据增强操作;
[0015]步骤2.4将数据增强后的图像进行归一标准化处理;
[0016]步骤2.5将烟叶等级标签进行张量转换,并进行独热编码,如:
[0017]等级1:10000000000000000000000000000000000000000(41个0)
[0018]等级2:01000000000000000000000000000000000000000(41个0)
[0019]等级3:00100000000000000000000000000000000000000(41个0)
[0020]依次类推,共计42个等级;
[0021]步骤3:数据集划分
[0022]步骤3.1加载数据集,选择步骤1.4所述的CSV中的数据,并按照8:1:1的比例划分为训练集、测试集和验证集;训练集用于训练模型的参数,测试集用于测试模型的泛化能力,验证集用于反馈模型的超参数的选择,表现为调整学习率、衰减系数、训练次数、网络的拓扑结构、过拟合、欠拟合等。根据验证集的表现结果不断调整模型的超参数设置,提高模型的准确度和泛化能力。
[0023]步骤3.2将步骤3.1的训练集打散,防止计算机记住位置信息,容易产生过拟合现象;使用打散工具打散数据间的顺序,防止每次训练时数据按照固定顺序产生,从而使得模型记忆标签信息,容易产生过拟合现象;
[0024]步骤4:自定义网络模型搭建,该模型是基于残差网络的自定义ResNet18神经网络模型;
[0025]步骤4.1:搭建残差单元,残差单元的结构示意图如附录图2所示,一个残差单元模块由2部分组成,其中F(x)表示输入x经过2个卷积层计算后的结果,Identity相当于一条线,把x不做处理直接传过去,最后相加计算F(x)+x,为了F(x)+x能够直接相加,需要保证x与F(x)的形状一样,不一致时需要进行下卷积运算变换成一样的形状;在输入和输出之间添加一条Skip Connection,在网络中添加连跳,防止出现网络在梯度消失,网络不再更新优化;
[0026]步骤4.2搭建残差模块,如附录图2所示,输入x需要经过2个卷积层,输入x经过一个3*3大小的卷积和一个BN层后,进行Relu计算后进入第二层,再经过一个3*3大小的卷积和BN后与x相加,最后进行Relu计算;
[0027]步骤4.3搭建残差堆叠模块,残差网络是由不同数量的堆叠模块组成,通过调整堆叠数量和不同的图像特征通道搭建不同层数的ResNet;
[0028]步骤5:烟叶分级模型训练;具体包括:
[0029]步骤5.1模型装配,设置模型的优化器、损失函数和监测指标;所述优化器为Adam自适应优化器,监测指标为准确度指标,损失函数为交叉熵损失函数,交叉熵损失函数公式为:
[0030][0031]其中N是训练数据的总数,y
i
是网络的预测值,t
i
是网络的目标值;
[0032]在损失函数上添加额外的约束项,即在网络中添加L2正则化,正则化是采用L2范
数作为损失函数的约束项,L2正则项公式为:
[0033][0034]其中E0为所述的交叉熵损失函数,λ是正则项的系数,w代表所有的权重参数和偏置量。添加正则项后在网络中减少了非线性的特征,网络的复杂度降低了,从而获得更好的泛化能力;
[0035]使用交叉熵损失函数对所预测结果进行损失计算,得到真实的烟叶结果与预测结果的损失值;网络的误差越大,网络的学习速度越快,可快速加快网络的收敛速度。
[0036]使用Adam自适应优化器来进行梯度下降,Adam优化器每一次训练,都会从训练集中抽取1个批次的数据进行一次梯度计算,通过计算梯度并沿着梯度反方向移动,进而减少网络预测值与真实值之间的误差,从而找到合适的权重和偏差使得网络的损失值越来越小;
[0037]使用准确度作为模型的监测指标,每一次训练完成后,都对测试集数据进行一次测试,得到模型的训练准确度,以此来评测模型性能;
[0038]步骤5.2模型训练,模型装配完成后,将待训练的数据集和测试本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于残差网络的烟叶智能分级模型,其特征在于,先对烟叶图像进行编码,再将烟叶等级映射数字编码,将编码转化为images和labels列表,之后根据这两个列表的信息创建样本和标签表格,接着将表格数据按照8:1:1的比例划分为训练集、测试集和验证集,利用深度学习残差网络对训练集和验证集进行不断的迭代训练,直至训练出最优的烟叶等级模型。2.如权利要求1所述的基于残差网络的烟叶智能分级模型,其特征在于,其通过以下具体步骤得到:步骤1:烟叶样本处理步骤1.1将烟叶样本按照42等级分为42个文件夹,并以等级名称作为重命名,将对应的烟叶分别按照等级存放在对应等级文件夹下;步骤1.2将烟叶42等级编码为[0,41]的数字,烟叶等级和数字的映射关系成为编码表;步骤1.3对步骤1.2所述的编码表确定后,根据烟叶的实际存储方式获取每个烟叶样本的存储路径和它对应的标签数字,分别表示为images和labels两个列表对象,其中images列表对象存储了每个样本的路径字符串,labels列表存储了样本的类别数字,两者长度一致,且对应元素位置相互关联;步骤1.4将步骤1.3所述images和labels存储到样本和标签表格CSV中;步骤2:烟叶图像预处理步骤2.1读取image列表对应路径的图片,并转换为张量形式;步骤2.3对读取转换完成的图像进行数据增强操作;步骤2.4将数据增强后的图像进行归一标准化处理;步骤2.5将烟叶等级标签进行张量转换,并进行独热编码,如:等级1:10000000000000000000000000000000000000000(41个0)等级2:01000000000000000000000000000000000000000(41个0)等级3:00100000000000000000000000000000000000000(41个0)依次类推,共计42个等级;步骤3:数据集划分步骤3.1加载数据集,选择步骤1.4所述的CSV中的数据,并按照8:1:1的比例划分为训练集、测试集和验证集;步骤3.2将步骤3.1的训练集打散;步骤4:自定义网络模型搭建步骤4.1:搭建残差单元,一个残差单元模块由2部分组成,其中F(x)表示输入x经过2个卷积层计算后的结果,Identity相当于一条线,把x不做处理直接传过去,最后相加计算F(x)+x;步骤4.2搭建残差模块,输入x需要经过2个卷积层,输入x经过一个3*3大小的卷积和一个BN层后,进行Relu计算后进入第二层,再经过一个3*3大小的卷积和BN后与x相加,最后进行Relu计算;步骤4.3搭建残差堆叠模块,残差网络是由不同数量的堆叠模块组成,通过调整堆叠数量和不同的图像特征通道搭建不同层数的ResNet;步骤5:烟叶分级模型训练;具体包括:
步骤5.1模型装配,设置模型的优化器、损失函数和监测指标;所述优化器为Adam自适应优化器,监测指标为准确度指标,损失函数为交叉熵损失函数,交叉熵损失函数公式为:其中N是训练数据的总数,y
i
是网络的预测值,t
i
是网络的目标值;在损失函数上添加额外的约束项,即在网络中添加L2正则化,...

【专利技术属性】
技术研发人员:王德吉王宏李广才甄焕菊王改丽徐丽娟牛慧伟倪克平梅涛方健李钊
申请(专利权)人:中国烟草总公司职工进修学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1