一种基于机器学习卷烟机剔除率特征选取的方法技术

技术编号：38127036 阅读：26 留言：0更新日期：2023-07-08 09:31

本发明专利技术公开了一种基于机器学习卷烟机剔除率特征选取的方法，该方法包括：采集数据、清洗数据、数据泄漏处理；以“空头当前剔除率”为目标值，其他特征为输入特征，将处理后的数据以7：3的方式，分为训练集和验证集，分别用线性回归、支持向量机和随机森林进行建模，采用R2和MSE作为评估依据，确定随机森林为基准模型，获得模型的特征重要性并进行排序；选择不同特征逐一建模，与基准模型比对，最终选定部分特征，作为建模的特征；通过其他数据集验证该方法的有效性。本发明专利技术通过选定的特征对卷烟的参数调整提供了依据，为卷烟数字化表征提供了有力保障。力保障。力保障。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习卷烟机剔除率特征选取的方法

[0001]本专利技术属于烟草行业卷烟机剔除率特征评价、信息技术(人工智能)
，具体涉及一种基于机器学习卷烟机剔除率特征选取的方法。

技术介绍

[0002]卷烟机剔除率特征指标主要包括SRM相关烟支剔除率与CIS相关烟支剔除率。为降低生产过程中烟支缺陷提高卷烟质量，通常在卷烟机内部安装有各项烟支缺陷剔除功能的外挂设备，当某质量缺陷发生时能够自动识别并剔除，而机器参数和工艺参数的异常会对烟支质量造成影响导致烟支出现各种缺陷而被剔除。影响缺陷产生的因素很多，当卷烟机某一特征缺陷剔除率升高时，技术人员往往从自身经验与部分关键影响因素着手，现阶段还无法做到对错综复杂的技术参数和各参数间的相互作用进行整体分析。
[0003]卷烟机各质量缺陷指标剔除率的大小直接反映卷烟机的机械效率与稳定性。而卷烟机各剔除率指标受各技术参数的影响，大量的设备参数与工艺参数间又存在相互影响、交叉作用的情况，简单单一的数据分析方法已经不能全面系统地评价卷烟机剔除率特征。
[0004]目前，针对卷烟机剔除率特征选取尚未有系统的评价方法，也没有相关研究，因此，亟需提供一种卷烟机剔除率特征选取的方法。

技术实现思路

[0005]为解决现有技术存在的上述技术问题，本专利技术提供一种基于机器学习卷烟机剔除率特征选取的方法，基于机器学习的卷烟机剔除率特征评价方法可根据各参数指标变化全面分析各技术参数对卷烟机剔除率的影响预测烟支质量缺陷并及时解决，能够实现当某剔除率指标出现异常时可综...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习卷烟机剔除率特征选取的方法，其特征在于，具体包括如下步骤：S1、采集数据；在卷烟生产过程中，以每2秒的速度在线实时采集卷烟机特征数据；S2、清洗数据；将步骤S1中采集到的特征数据进行清洗，剔除缺失值特征，删除含有空值的特征，剔除方差为零特征，其中包括字符型，删除没有变化的特征，并对字符型数据进行分类编码处理；S3、处理数据泄漏；以“空头当前剔除率”为目标值，其他特征为输入特征，将步骤S2的数据以7：3的方式，分为训练集和验证集，分别用线性回归，支持向量机和随机森林建模，得到R2均超过0.999的成绩，说明存在数据泄漏问题，需要将泄漏特征剔除。在其他的特征中有“剔除量”和“剔除率”指标共80个，因此需要进行剔除；S4、选择模型；以“空头当前剔除率”为目标值，其他特征为输入特征，将步骤S3数据以7：3的分配比例分为训练集和验证集，分别用线性回归、支持向量机以及随机森林这三种模型进行建模，用训练集数据进行训练，验证集数据进行验证，采用R平方值和均方误差值进行评估，分别记为R2和MSE；根据上述模型的评估结果，依据R2越接近1和MSE最小的原则，选择随机森林作为基准模型；S5、获得模型的特征重要性；用步骤S4选择的随机森林模型的feature_importances_和eli5工具的Permut...

【专利技术属性】
技术研发人员：林建南，柴武君，倪建彬，郑闪闪，陆成飞，李茂松，
申请(专利权)人：浙江中烟工业有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人