System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于杂种优势理论工业制造数据特征选择方法及系统技术方案_技高网

一种基于杂种优势理论工业制造数据特征选择方法及系统技术方案

技术编号:43173477 阅读:5 留言:0更新日期:2024-11-01 20:02
本发明专利技术提供一种基于杂种优势理论工业制造数据特征选择方法及系统,涉及机器学习领域,包括以下步骤:数据准备,进行预处理;设置算法相关参数,利用反向学习初始化种群;计算平衡因子,决定白鲸进入探索阶段或开发阶段,更新个体位置信息;计算鲸落概率,调节运动轨迹;当前的迭代次数达到预定迭代条件时,则进行最优邻域搜索;计算所有白鲸的目标函数值,进行非支配排序,选择第一非支配前沿的个体更新外部存档;输出非支配解集。本发明专利技术将特征选择建模为多目标优化问题,以数据分类性能和特征子集所占比例为目标函数,利用基于杂种优势理论改进的白鲸优化算法,获得一组最优特征子集来满足机器学习分类器的要求。

【技术实现步骤摘要】

本专利技术涉及机器学习,具体为一种基于杂种优势理论工业制造数据特征选择方法及系统


技术介绍

1、工业制造领域正处于快速发展和深刻变革的时期,其产生的数据规模不断扩大,数据中存在的各种无关特征和冗余信息也在不断增加,数据具有异构性、通量大且关联性强的特点。因此,如何从复杂的数据中提取有价值的信息,优化工业制造流程、提升产品质量和生产效率,是研究和推动制造业的智能化转型的关键问题之一。

2、特征选择是数据挖掘的重要手段之一,通过从初始特征中探索寻找具有代表性的特征达到降低数据复杂度的目的。在现实生活中,往往会有多个与特征选择相关的目标需要达成平衡,比如最大化预测准确性、最小化模型复杂度、保持特征之间的相关性等。在多目标特征选择中,常用的方法包括多目标优化算法,如多目标遗传算法、多目标粒子群优化算法等。这些算法能够同时考虑多个目标,并给出一组平衡的解决方案,用户可以根据具体需求选择最适合的解决方案。

3、杂种优势理论是指自然界中基因组成不同的个体或自交系亲本杂交产生的后代,其环境适应性、生殖繁育能力、生长优势、抗逆性以及产量品质等某些方面或整体水平优于父代。根据杂种优势,对育种手段进行改进和创新,可以使农产品产量获得显著增长。此外,杂种优势理论对生态系统的维持和物种进化也有一定的影响,它促进了不同种群之间的杂交,增加了遗传多样性,有助于物种的适应性和生存能力。

4、白鲸优化算法是一种元启发式算法,用于模拟白鲸在海洋中的行为,在单模态测试函数、多模态函数、优化问题等方面都取得了良好的效果,但随着问题复杂度的增加和测试函数的变化,白鲸优化算法容易陷入局部最优状态,无法连续收敛,因此如何提升该类算法的收敛速度是面临的重要问题之一。


技术实现思路

1、针对现有技术存在的不足,本专利技术目的是提供一种基于杂种优势理论工业制造数据特征选择方法及系统,以解决上述
技术介绍
中提出的问题,本专利技术将特征选择建模为多目标优化问题,以数据分类性能和特征子集所占比例为目标函数,利用基于杂种优势理论改进的白鲸优化算法,获得一组最优特征子集,从而满足决策者的各种要求。

2、为了实现上述目的,本专利技术是通过如下的技术方案来实现:一种基于杂种优势理论改进白鲸优化算法的工业制造数据多目标特征选择方法,包括以下步骤:

3、步骤一、数据准备,包括获取工业制造过程中产生的数据,并对其进行预处理;

4、步骤二、设置算法相关参数,利用反向学习初始化种群,并进行高效的非支配排序,更新外部存档;

5、步骤三、计算平衡因子,决定白鲸进入探索阶段或开发阶段,更新个体位置信息;

6、步骤四、计算鲸落概率,当鲸落概率大于平衡因子时,则通过两种不同的策略共同调节运动轨迹;

7、步骤五、当前的迭代次数达到预定迭代条件时,对处在第一非支配前沿的个体进行最优邻域搜索;

8、步骤六、计算所有个体的目标函数值,进行高效的非支配排序,选择第一非支配前沿的个体更新外部存档;

9、步骤七、判断是否满足终止条件,如果是,则输出非支配解集;否则,返回步骤三。

10、进一步的,所述步骤二中利用反向学习来初始化种群的步骤包括:

11、将样本集中的特征数量编码为优化问题的维度,假设特征数量为d,在搜索空间内随机生成白鲸的初始位置xi=(xi,1,xi,2,…,xi,j,…xi,d),xi,j∈{0,1},xi是一个包含d个元素的向量,其中每个元素xi,j代表第i个体在第j维特征上的取值,当xi,j取1时,代表选择第j维特征,反之则不选,然后计算解xi的相反解xi;

12、计算初始种群x和反向种群x的目标函数,使用高效的非支配排序(ens)算法来确定各个等级的非支配解集合,从中选择最佳的n个个体组成初始种群,更新外部存档。

13、进一步的,所述步骤三中的根据平衡因子bf更新位置,实现步骤为:

14、如果平衡因子bf>0.5,则进入探索阶段,白鲸以镜像或同步的方式随机移动,更新白鲸的位置;如果平衡因子bf<0.5,则更新由开发阶段控制,白鲸通过共享彼此的位置信息来捕食,每头白鲸都可以依据自身情况选择多个领导者跟随,通过海明距离来计算当前白鲸到第一前沿各白鲸的距离,选择距离最近的三头白鲸,若第一前沿白鲸的个数少于三头,则从第二前沿进行选取,对他们进行杂交操作,新产生的白鲸个体作为最佳位置来引导更新,其更新公式如下:

15、

16、

17、其中,t是当前迭代,和是第i头白鲸和随机白鲸的当前位置,是白鲸中的最佳位置,r3,r4,r5,r6和r7是(0,1)之间的随机数,c1是衡量levy飞行强度的随机跳跃强度,代表的是第一前沿中与当前白鲸距离最近的三头白鲸,通过计算适应度函数来评估更新解的位置;

18、第t代的原始种群为pt,更新后的种群为pt+1,比较更新后的白鲸位置与原位置如果支配则将保存到pt+1中;如果支配则将保存到pt+1中;否则,和都将被保存到pt+1中。

19、进一步的,所述步骤四中的鲸落概率计算公式如下:

20、

21、其中,t为当前迭代,tmax为最大迭代次数,f1(xi)为当前个体xi的第一个目标函数值,f2(xi)为第二个目标函数值,f1min和f1max为第一个目标函数下的最小值和最大值,f2min和f2max为第二个目标函数下的最小值和最大值,α是一个权重因子,用来平衡迭代次数和适应度水平对鲸落概率的影响,其范围在[0,1],θ=10-5避免分母为0。

22、进一步的,所述步骤四中通过两种不同的策略共同调节运动轨迹,一种是原始算法使用白鲸的位置和鲸鱼下落的步长来建立更新的位置,另一种是引入杂交技术加强对于空间的探索,促进个体间的信息交流,从第一非支配前沿和种群中随机选择两个个体进行杂交,产生新个体yi,定义公式为:

23、

24、其中,是第一非支配前沿中的随机个体,是种群中的随机个体,r11和r12是(0,1)之间的随机数,然后,对新个体yi和当前白鲸个体xi执行交叉操作,过程如下式所示:

25、

26、其中,cr为交叉概率,jrand为[1,2,…,d]的随机整数,为了确保yi中至少有一个基因被遗传给下一代,白鲸可以通过这两种不同的策略共同来调节自身的运动轨迹。

27、进一步的,所述步骤五中最优邻域搜索,新个体产生步骤如下:

28、

29、其中,为当前个体,为当前个体距离最近的解,为距离最远的解,根据高斯函数生成多个新个体,使用pareto优势概念确定更优的个体。

30、进一步的,所述步骤六中使用高效的非支配排序更新种群,具体步骤如下:

31、目标函数为分类错误率和特征子集数量,根据目标函数计算适应度值;将种群pt+1根据第一目标函数值按升序排序,如果两个解的第一个目标函数具有相同的值,则使本文档来自技高网...

【技术保护点】

1.一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤二中利用反向学习来初始化种群的步骤包括:

3.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤三中的根据平衡因子Bf更新位置,实现步骤为:

4.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤四中的鲸落概率计算公式如下:

5.根据权利要求4所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于:所述步骤四中通过两种不同的策略共同调节运动轨迹,一种是原始算法使用白鲸的位置和鲸鱼下落的步长来建立更新的位置,另一种是引入杂交技术加强对于空间的探索,促进个体间的信息交流,从第一非支配前沿和种群中随机选择两个个体进行杂交,产生新个体yi,定义公式为:

6.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤五中最优邻域搜索,新个体产生步骤如下:>

7.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤六中使用高效的非支配排序更新种群,具体步骤如下:

8.根据权利要求7所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤六中外部存档更新策略为:

9.一种如权利要求1所述的方法中使用的多目标特征选择系统,其特征在于:包括预处理模块、初始化模块、搜索开发模块、非支配排序模块、迭代模块和外部存档模块。

10.根据权利要求9所述的多目标特征选择系统,其特征在于:所述预处理模块用于获取工业制造过程中产生的数据,并对其进行预处理;

...

【技术特征摘要】

1.一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤二中利用反向学习来初始化种群的步骤包括:

3.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤三中的根据平衡因子bf更新位置,实现步骤为:

4.根据权利要求1所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于,所述步骤四中的鲸落概率计算公式如下:

5.根据权利要求4所述的一种基于杂种优势理论工业制造数据特征选择方法,其特征在于:所述步骤四中通过两种不同的策略共同调节运动轨迹,一种是原始算法使用白鲸的位置和鲸鱼下落的步长来建立更新的位置,另一种是引入杂交技术加强对于空间的探索,促进个体间的信息交流,从第一非支配前沿和...

【专利技术属性】
技术研发人员:叶志伟曾颖蔡婷周雯王明威何其祎高榕谢海涛严灵毓王治之朱禹帆
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1