一种基于大语言模型的机器学习算法改进方法及系统技术方案

技术编号：42657186 阅读：59 留言：0更新日期：2024-09-10 12:16

本发明专利技术公开了一种基于大语言模型的机器学习算法改进方法及系统，其中方法包括：将分析提示与技术文档输入大语言模型，生成现有机器学习算法的分析结果；基于分析结果，利用大语言模型挖掘潜在的创新点；利用大语言模型通过使用元学习策略，生成新的机器学习算法；结合大语言模型与模型解释工具所述机器学习算法的特征贡献度；利用大语言模型生成模型融合策略，组合多个新生成的机器学习算法的预测结果；利用大语言模型自动生成特征工程策略，将生成的特征工程策略输入自动化特征工具进行特征提取；利用训练与验证数据集对最终的机器学习算法进行训练与评估。本发明专利技术通过利用大语言模型分析现有机器学习算法，提高机器学习算法的性能和准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能，特别涉及一种基于大语言模型的机器学习算法改进方法及系统。

技术介绍

1、随着数据量的急剧增长和计算能力的提升，机器学习已经广泛应用于各种领域，如图像识别、自然语言处理、推荐系统等。然而，设计和优化机器学习算法通常需要大量的专业知识和时间。即使是经验丰富的数据科学家，也很难手动设计出最优的机器学习算法，因为需要考虑的因素太多，如特征选择、模型选择、超参数调整、模型融合等。另一方面，大语言模型如gpt-3和gpt-4，已经表现出强大的理解和生成自然语言的能力。这些模型在大规模文本数据上进行预训练，能够理解复杂的语言结构和语义信息，生成连贯和准确的文本。因此亟需一种基于大语言模型的机器学习算法改进方法，通过使用大语言模型来分析和生成新的机器学习算法，以提高模型性能和准确度，加速算法研究和创新。

2、公开号为cn109961142b的中国专利公开了一种基于元学习的神经网络优化方法及装置，所述方法包括：部署多个机器学习任务，每个机器学习任务均运行于学习框架中，每个学习框架均包括神经网络本体和神经网络优化器，所述神经网络优化器用于对与其对应的神经网络本体的参数权重进行调整；设置元学习组合优化器；基于所述元学习组合优化器拟合机器学习任务运行过程中各个神经网络组合的状态特征与质量参数的映射关系；响应于优化指令，使用所述元学习组合优化器输出组合优化策略；使用所述组合优化策略对待优化的神经网络进行优化。所述专利技术存在以下问题：一、由于不同的机器学习任务可能具有不同的数据分布、特征和模式，元学习得到的优化策略可能

技术实现思路

1、为了解决上述现有技术中存在的问题，本专利技术提供一种基于大语言模型的机器学习算法改进方法及系统，通过利用大语言模型分析现有机器学习算法和其模型结构，提高机器学习算法的性能和准确度。

2、为解决上述技术问题，本专利技术提供一种基于大语言模型的机器学习算法改进方法，包括以下步骤：

3、s1：选择合适的机器学习算法分析提示与待分析的机器学习算法技术文档输入大语言模型提取关键技术信息，生成现有机器学习算法的分析结果。

4、s2：基于分析结果利用大语言模型根据已有的机器学习算法挖掘潜在的创新点。

5、s3：根据挖掘的潜在创新点，通过使用元学习策略以现有机器学习算法生成新的机器学习算法。

6、s4：结合大语言模型与模型解释工具分析新生成的机器学习算法，评估所述机器学习算法的算法特征贡献度。

7、s5：利用大语言模型生成模型融合策略，生成最终的机器学习算法。

8、s6：根据需要利用机器学习算法解决的特定问题建立特征工程提示，将特征工程提示输入大语言模型生成特征工程策略，将生成的特征工程策略输入自动化特征工具进行数据特征提取。

9、s7：对提取的数据特征划分训练数据集和验证数据集，利用训练数据集对最终的机器学习算法进行训练，并根据验证数据集评估所述机器学习算法的性能。

10、优选的，所述步骤s4具体为：

11、s41：利用模型解释工具分析新的机器学习算法，分析结果为机器学习算法中每个算法特征对机器学习算法预测结果的贡献。

12、s42：将模型解释工具的分析结果编码为文本输入大语言模型，得到相应的解释性文本，评估机器学习算法的算法特征贡献度。

13、优选的，所述步骤s5具体为：

14、s51：利用大语言模型评估多个新的机器学习算法的模型结构与预测性能，根据大语言模型生成的评估信息设计优化问题。

15、s52：通过利用大语言模型求解优化问题得到模型融合策略，通过模型融合策略组合多个新的机器学习算法的预测结果，提高机器学习算法的预测性能。

16、优选的，所述步骤s7具体为：

17、s71：利用训练数据集对最终的机器学习算法进行训练，联合大语言模型与automl工具进行参数调优。

18、s72：利用大语言模型生成参数优化建议，将参数优化建议输入automl工具，利用automl工具自动测试不同的参数组合，通过比较验证集评估的机器学习算法性能，选择性能最优的参数配置组合。

19、另一方面，本专利技术提供一种基于大语言模型的机器学习算法改进系统，所述系统实现如本专利技术任一实施例所述的一种基于大语言模型的机器学习算法改进方法，包括算法分析模块、算法挖掘模块、元学习模块、模型解释模块、模型融合模块、特征提取模块与算法训练模块。

20、算法分析模块，用于选择合适的机器学习算法分析提示与待分析的机器学习算法技术文档输入大语言模型提取关键技术信息，生成现有机器学习算法的分析结果。

21、算法挖掘模块，用于基于分析结果利用大语言模型根据已有的机器学习算法挖掘潜在的创新点。

22、元学习模块，用于根据挖掘的潜在创新点，通过使用元学习策略以现有机器学习算法生成新的机器学习算法。

23、模型解释模块，用于结合大语言模型与模型解释工具分析新生成的机器学习算法，评估所述机器学习算法的算法特征贡献度。

24、模型融合模块，用于利用大语言模型生成模型融合策略，生成最终的机器学习算法。

25、特征提取模块，用于根据需要利用机器学习算法解决的特定问题建立特征工程提示，将特征工程提示输入大语言模型生成特征工程策略，将生成的特征工程策略输入自动化特征工具进行数据特征提取。

26、算法训练模块，用于对提取的数据特征划分训练数据集和验证数据集，利用训练数据集对最终的机器学习算法进行训练，并根据验证数据集评估所述机器学习算法的性能。

27、再一方面，本专利技术还提供一种电子设备，所述电子设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本专利技术任一实施例所述的一种基于大语言模型的机器学习算法改进方法。

28、再一方面，本专利技术还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如本专利技术任一实施例所述的一种基于大语言模型的机器学习算法改进方法。

29、与现有技术相比，本专利技术具有以下技术效果：

30、本专利技术提供一种基于大语言模型的机器学习算法改进方法，用于提高机器学习模型的性能和准确度。该方法包括利用大语言模型分析现有机器学习算法和模型结构，挖掘潜在的改进和创新点，提出新的机器学习算法。此外，该方法还引入了元学习、模型解释性、模型融合和自动化特征工程等创新技术。本专利技术使得机器学习算法能够更好地适应复杂的数据分布，提高模型的泛化能力，使模型在未知数据上表现得更好，加速算法的研究和创新，推动机器学习领域的发展。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的机器学习算法改进方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤S4具体为：

3.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤S5具体为：

4.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤S7具体为：

5.一种基于大语言模型的机器学习算法改进系统，其特征在于，所述系统实现如权利要求1至4中任一项所述的一种基于大语言模型的机器学习算法改进方法，包括算法分析模块、算法挖掘模块、元学习模块、模型解释模块、模型融合模块、特征提取模块与算法训练模块；

6.一种电子设备，所述电子设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的一种基于大语言模型的机器学习算法改进方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序

...

【技术特征摘要】

1.一种基于大语言模型的机器学习算法改进方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤s4具体为：

3.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤s5具体为：

4.根据权利要求1所述的一种基于大语言模型的机器学习算法改进方法，其特征在于，所述步骤s7具体为：

5.一种基于大语言模型的机器学习算法改进系统，其特征在于，所述系统实现如权利要求1至4中任一项所述的一种基于大语言模型的...

【专利技术属性】
技术研发人员：郑耀松，庄莉，梁懿，王秋琳，吴佩颖，
申请(专利权)人：福建亿榕信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人