System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种避免过拟合的机器学习模型超参数优化方法技术_技高网
当前位置: 首页 > 专利查询>天津大学专利>正文

一种避免过拟合的机器学习模型超参数优化方法技术

技术编号:42313688 阅读:4 留言:0更新日期:2024-08-14 15:57
本发明专利技术公开了一种避免过拟合的机器学习模型超参数优化方法,属于机器学习与环境交叉技术领域。方法包括以下步骤:S1、配置若干组不同浓度的砷离子溶液,并获取砷离子溶液的光谱图数据;S2、对光谱图数据进行预处理,得到处理后的样本数据;S3、采用样本数据训练回归模型,得到训练后的回归模型;训练后的回归模型用于进行砷离子浓度预测;S4、对待预测砷离子浓度的光谱图数据进行预处理,将预处理后的待预测砷离子浓度的光谱图数据输入训练后的回归模型,得到砷离子浓度预测结果。采用机器学习模型超参数优化方法处理数据,能有效地防止过拟合现象的出现,有效提升低浓度下DBD原子发射光谱对低浓度的砷离子的定性与定量检测性能。

【技术实现步骤摘要】

本专利技术属于机器学习与环境交叉,具体涉及一种避免过拟合的机器学习模型超参数优化方法


技术介绍

1、目前针对过拟合的机器学习模型超参数优化问题,比较常用的方法有网格搜索、随机搜索、贝叶斯优化、动态资源分配、神经架构搜索等,传统机器学习模型超参数优化时,一般是随机把样本分为训练集、交叉验证集、测试集,虽然理论上来说这种数据样本划分方法可以避免过拟合,但这些手段仍主要存在两方面问题:

2、(1)由于样本选取的随机性,还是有一定概率使得模型的超参数优化结果过拟合。

3、(2)超参数优化作为一个组合优化问题,无法像一般参数那样通过梯度下降方法来优化,因而没有一种通用有效的优化方法。


技术实现思路

1、本专利技术旨在解决现有技术的不足,提出一种避免过拟合的机器学习模型超参数优化方法,通过开发新的机器学习模型超参数优化方法,从而降低由于传统超参数优化方法造成的过拟合对金属离子浓度检测结果的影响,建立砷离子检测谱图数据分析模型。

2、为实现上述目的,本专利技术提供了如下方案:一种避免过拟合的机器学习模型超参数优化方法,包括以下步骤:

3、s1、配置若干组不同浓度的砷离子溶液,并获取所述砷离子溶液的光谱图数据;

4、s2、对所述光谱图数据进行预处理,得到处理后的样本数据;

5、s3、采用所述样本数据训练回归模型,得到训练后的回归模型;训练后的回归模型用于进行砷离子浓度预测;

6、s4、对待预测砷离子浓度的光谱图数据进行预处理,将预处理后的待预测砷离子浓度的光谱图数据输入训练后的回归模型,得到砷离子浓度预测结果。

7、进一步优选地,获取所述砷离子溶液的光谱图数据的方法包括:

8、采用介质阻挡发电-离子发射光谱仪对砷离子溶液进行测试;设定峰位置范围以及分辨率;将砷离子溶液加入盐酸配置成载流溶液,制备还原剂;分别取载流溶液和还原剂加入至离心管中,蠕动泵抽取离心管溶液后在气液分离器中进行反应,反应后产生的目标元素的氢化物在氧化气氛和高压放电的条件下捕获在dbd石英管表面,经过载气的吹扫,被捕获的元素在氢气气氛和高压放电的条件下被释放,完成富集过程,对激发态砷离子气体进行光谱检测,得到光谱图数据。

9、进一步优选地,所述预处理的方法包括:特征提取和降维处理。

10、进一步优选地,所述回归模型包括:支持向量机回归模型。

11、进一步优选地,所述支持向量机回归模型的核函数采用线性核函数、径向基核函数、多项式核函数之一。

12、进一步优选地,s3包括以下步骤:

13、s31、对所述样本数据进行超参数优化处理,信号强度的最大值和最小值对应的所述样本数据构成测试集;在剩余的所述样本数据中再次选取信号强度的最大值和最小值的所述样本数据,构成交叉验证集;余下的作为训练集;

14、s32、采用训练集对所述回归模型进行训练,采用交叉验证集对训练后的所述回归模型进行迭代训练和验证,验证结果满足迭代停止条件时,输出训练后的回归模型;验证结果不满足迭代停止条件时,继续对所述回归模型进行迭代训练和验证,直到验证结果满足迭代停止条件;采用测试集对训练后的回归模型进行性能测试。

15、与现有技术相比,本专利技术的有益效果为:

16、通过本专利技术提供的方法,基于光谱法和机器学习算法,构建了光谱图数据与重金属离子浓度之间的机器学习模型的方式,解决了现有技术再对低浓度砷离子检测中由于噪声、基线漂移导致定量不准以及其他信号峰干扰等因素对金属离子浓度检测结果的影响的问题,实现了dbd发射光谱仪高效,快速,便携式的高精确度定性定量检测分析。

17、采用机器学习模型超参数优化方法处理数据,能有效地防止过拟合现象的出现,并且通过超参数优化方法处理后的数据可以更好的训练回归模块模型,有效提升低浓度下dbd原子发射光谱对低浓度的砷离子的定性与定量检测性能。

18、通过对数据优化后的模型下dbd原子发射光谱对低浓度的砷离子的定性与定量检测性能反向验证超参数优化方法的作用,确立为一种通用有效的优化方法。对业内相关的光谱数据超参数优化提供参考作用。

本文档来自技高网...

【技术保护点】

1.一种避免过拟合的机器学习模型超参数优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,获取所述砷离子溶液的光谱图数据的方法包括:

3.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,所述预处理的方法包括:特征提取和降维处理。

4.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,所述回归模型包括:支持向量机回归模型。

5.根据权利要求4所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,所述支持向量机回归模型的核函数采用线性核函数、径向基核函数、多项式核函数之一。

6.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,S3包括以下步骤:

【技术特征摘要】

1.一种避免过拟合的机器学习模型超参数优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,获取所述砷离子溶液的光谱图数据的方法包括:

3.根据权利要求1所述一种避免过拟合的机器学习模型超参数优化方法,其特征在于,所述预处理的方法包括:特征提取和降维处理。

4.根据权利要求1所...

【专利技术属性】
技术研发人员:陈冠益侯东昊颜蓓蓓郭炜陶俊宇程占军陈超
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1