System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及棉花品级分类,尤其涉及一种基于优化随机森林模型的锯齿棉品级分类方法及系统。
技术介绍
1、品级是棉花最重要的质量指标之一,起初棉花品级的检测仍采用传统检测方法,通过分级员根据棉花质量的差异进行感官判定对棉花进行分类,观察结果会出现因主观性而引起观察偏移,随后通过棉花大容量纤维检测仪(hvi)可获得反射率、黄度、杂质含量、长度、马克隆值等10余种指标,检测仪仅能测量出棉花的上述指标数据,为了达到棉花等级的自动分级,仍需要借助光电测量仪或激光扫描仪等设备将数字数据转换为图像数据才能用于后续的分析得到品级的分类,现有棉花品级自动分类方法大都基于较强的图像处理技术,对采集的棉花样品图像质量要求过高,应用受到很多限制,现有技术中的随机森林模型可以用于分类,通过调整超参数提高模型性能,输入棉花数据可以直接输出棉花品级结果,但是棉花数据比较庞大且具有不规律性,需要在大范围内选取超参数组合用于模型优化,虽然能够达到精度要求但是搜索速度会大大减慢,使得优化后的随机森林模型的效率降低,若在较小范围内选取超参数组合,可以提高随机森林模型的输出效率,但是优化后的随机森林模型在精度方面达不到要求,进而导致随机森林模型输出的分类结果缺乏一定准确度,降低了分类精度,基于上述理由,用于棉花分类的随机森林模型无法在整体精度和效率两方面达到平衡,为此本专利技术提出一种基于优化随机森林模型的锯齿棉品级分类方法及系统,解决上述技术问题。
技术实现思路
1、为了解决上述技术问题,本专利技术提供了一种基于优化随
2、本专利技术提供了一种基于优化随机森林模型的锯齿棉品级分类方法,包括:
3、步骤s1,对锯齿棉样品进行粗分类取得优品锯齿棉和差品锯齿棉,获得优品锯齿棉样品数据和差品锯齿棉样品数据;
4、步骤s2,对所述优品锯齿棉样品数据和所述差品锯齿棉样品数据进行标准化处理并分别计算所述优品锯齿棉样品数据的方差和所述差品锯齿棉样品数据的方差,根据所述优品锯齿棉样品数据的方差和所述差品锯齿棉样品数据的方差获得所述优品锯齿棉的分类参数和所述差品锯齿棉的分类参数;
5、步骤s3,建立随机森林模型;
6、步骤s4,确定所述随机森林模型的优化参数,所述优化参数包括超参数以及所述超参数的搜索空间;
7、步骤s5,根据所述优化参数对所述步骤s3中所述随机森林模型进行优化,获得优化好的随机森林模型;
8、所述步骤s5中获得优化好的随机森林模型包括第一随机森林模型和第二随机森林模型,所述第一随机森林模型用于对所述优品锯齿棉的品级进行分类,所述第二随机森林模型用于对所述差品锯齿棉的品级进行分类;
9、步骤s6,将所述优品锯齿棉的分类参数和所述差品锯齿棉的分类参数输入到所述步骤s5中获得的优化好的随机森林模型中,输出锯齿棉品级分类结果。
10、进一步地,所述超参数包括子模型数、最大树深度、分裂所需最小样本数、最大叶节点数、最大特征数、叶节点最小样本数。
11、进一步地,第一随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[70,150],所述最大树深度的搜索空间为[10,20],所述分裂所需最小样本数的搜索空间为[20,35],所述最大叶节点数的搜索空间为[15,40],所述最大特征数的搜索空间为[0.1,0.9],所述叶节点最小样本数的搜索空间为[10,250]。
12、进一步地,第二随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[50,300],所述最大树深度的搜索空间为[5,30],所述分裂所需最小样本数的搜索空间为[1,50],所述最大叶节点数的搜索空间为[5,60],所述最大特征数的搜索空间为[0.1,0.99],所述叶节点最小样本数的搜索空间为[2,30]。
13、进一步地,所述步骤s5中根据所述优化参数对所述随机森林模型进行优化,获得优化好的随机森林模型是指:基于贝叶斯算法对所述随机森林模型中的所述超参数进行优化处理,获得最优超参数,根据所述最优超参数优化所述随机森林模型,得到所述优化好的随机森林模型。
14、进一步地,基于贝叶斯算法对所述随机森林模型中的所述超参数进行优化处理,获得最优超参数,根据所述最优超参数优化所述随机森林模型,得到所述优化好的随机森林模型,具体包括以下步骤:
15、步骤s51,建立贝叶斯优化的目标函数;
16、步骤s52,设置贝叶斯优化的最大循环次数;
17、步骤s53,在所述随机森林模型的所述超参数的搜索空间内选择超参数组合;
18、步骤s54,基于所述超参数组合,利用分类参数训练所述随机森林模型获得目标函数值,所述超参数组合与所述目标函数值构成已知点数据集;
19、步骤s55,对所述已知点数据集进行高斯过程拟合,获得高斯分布函数,根据高斯分布函数计算目标函数在任意待测试点的后验概率分布;
20、步骤s56,根据所述后验概率分布构造采集函数;
21、步骤s57,取所述采集函数最大值作为新的所述超参数组合,循环执行步骤s55-s56,不断更新所述超参数组合,直到循环次数大于最大循环次数,获得最优超参数,将所述最优超参数输入至所述步骤s3中建立的随机森林模型,获得最优的随机森林模型。
22、进一步地,所述步骤s51中建立贝叶斯优化的目标函数为
23、;
24、式中:为贝叶斯优化的目标函数,表示随机森林模型在第i次十折交叉验证时测试集的第j个数据,表示第i次十折交叉验证的预测值的第j个数据,n表示所有锯齿棉样品数据中测试集的样本数量, n=10,代表随机森林模型在十折交叉验证时重复验证的次数。
25、进一步地,所述步骤s55中对所述已知点数据集进行高斯过程拟合,获得高斯分布函数,根据高斯分布函数计算目标函数在任意待测试点的后验概率分布,具体包括以下步骤:
26、步骤s551,为高斯过程回归模型建立核函数;
27、步骤s552,根据所述核函数计算所述已知点数据集的协方差矩阵;
28、步骤s553,通过所述协方差矩阵构建所述目标函数的高斯分布;
29、步骤s554,根据所述高斯分布获得高斯分布函数;
30、步骤s555,获取新的数据点作为待测试点;
31、步骤s556,根据所述高斯分布函数,获得所述待测试点和所述已知数据集的联合高斯分布;
32、步骤s557,根据所述联合高斯分布计算在待测试点的后验概率分布。
33、进一步地,所述步骤s56中根据所述后验概率分布构造采集函数,具体包括以下步骤:
34、步骤s561,根据联合高斯分布计算在待测试点的后验概率分布建立概率密度函数;
35、步骤s562,根据所述概率密本文档来自技高网...
【技术保护点】
1.一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述超参数包括子模型数、最大树深度、分裂所需最小样本数、最大叶节点数、最大特征数、叶节点最小样本数。
3.根据权利要求2所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,第一随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[70,150],所述最大树深度的搜索空间为[10,20],所述分裂所需最小样本数的搜索空间为[20,35],所述最大叶节点数的搜索空间为[15,40],所述最大特征数的搜索空间为[0.1,0.9],所述叶节点最小样本数的搜索空间为[10,250]。
4.根据权利要求2所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,第二随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[50,300],所述最大树深度的搜索空间为[5,30],所述分裂所需最小样本数的搜索空间为[1,50],所述最大叶节点数的
5.根据权利要求1所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述步骤S5中根据所述优化参数对所述随机森林模型进行优化,获得优化好的随机森林模型是指:基于贝叶斯算法对所述随机森林模型中的所述超参数进行优化处理,获得最优超参数,根据所述最优超参数优化所述随机森林模型,得到所述优化好的随机森林模型。
6.根据权利要求5所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,基于贝叶斯算法对所述随机森林模型中的所述超参数进行优化处理,获得最优超参数,根据所述最优超参数优化所述随机森林模型,得到所述优化好的随机森林模型,具体包括以下步骤:
7.根据权利要求6所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述步骤S51中建立贝叶斯优化的目标函数为
8.根据权利要求6所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述步骤S55中对所述已知点数据集进行高斯过程拟合,获得高斯分布函数,根据高斯分布函数计算目标函数在任意待测试点的后验概率分布,具体包括以下步骤:
9.根据权利要求6所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述步骤S56中根据所述后验概率分布构造采集函数,具体包括以下步骤:
10.一种基于优化随机森林模型的锯齿棉品级分类系统,用于执行如上述权利要求1-9任一所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,包括以下模块:
...【技术特征摘要】
1.一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,包括:
2.根据权利要求1所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述超参数包括子模型数、最大树深度、分裂所需最小样本数、最大叶节点数、最大特征数、叶节点最小样本数。
3.根据权利要求2所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,第一随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[70,150],所述最大树深度的搜索空间为[10,20],所述分裂所需最小样本数的搜索空间为[20,35],所述最大叶节点数的搜索空间为[15,40],所述最大特征数的搜索空间为[0.1,0.9],所述叶节点最小样本数的搜索空间为[10,250]。
4.根据权利要求2所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,第二随机森林模型的所述优化参数中的所述超参数的搜索空间为:所述子模型数的搜索空间为[50,300],所述最大树深度的搜索空间为[5,30],所述分裂所需最小样本数的搜索空间为[1,50],所述最大叶节点数的搜索空间为[5,60],所述最大特征数的搜索空间为[0.1,0.99],所述叶节点最小样本数的搜索空间为[2,30]。
5.根据权利要求1所述的一种基于优化随机森林模型的锯齿棉品级分类方法,其特征在于,所述...
【专利技术属性】
技术研发人员:董绍伟,徐静,丁友超,周宇航,王铭,董俊哲,兰丽丽,
申请(专利权)人:南京海关工业产品检测中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。