System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图神经网络架构构建,尤其涉及一种图神经网络最优架构构建方法、系统及药物分子性质预测方法、系统。
技术介绍
1、图神经网络(gnn)在处理具有丰富关系的图数据时,相较于循环神经网络等传统神经网络,可以更好地捕捉图数据的非欧几里得性质,所以现在有许多方法使用gnn根据分子图的信息预测分子性质。
2、同时,为了得到相应任务上的gnn最优架构,减少算法设计人员的调参时间,衍生出了图神经网络架构搜索。这类方法对于给定的一个搜索空间和数据集,使用特定的搜索策略,选出一个最好的架构,可以最大化上网络的精度。目前主要的搜索策略有基于强化学习、进化学习和可微方法的算法。
3、虽然各种图架构搜索算法在不同的领域任务中都取得了不错的结果,但设计架构搜索算法也需要大量的领域知识。像随机采样等搜索方式,虽然也能取得不错的性能效果,但是需要对大量的架构进行训练和验证,对资源和时间都有一定的需求。且现有方法更换不同的搜索空间、参考指标等都需要在代码内进行修改。这其实对于非计算机领域的使用者是十分不便的。
技术实现思路
1、为了解决上述技术问题,本专利技术提出了一种图神经网络最优架构构建方法、系统及药物分子性质预测方法、系统,以自动获得最优的图神经网络架构,节约时间与人力资源成本。
2、根据本专利技术的一方面,提出一种图神经网络最优架构构建方法,该方法包括:
3、预先设计包含多个图神经网络参数的搜索空间;
4、预先设计用于引导大语言模型进行
5、基于提示语模板获取初始触发的提示语;
6、将初始触发的提示语输入预训练的大语言模型中进行采样,获取初始多组图神经网络配置参数;
7、基于初始多组图神经网络配置参数构建对应的多个图神经网络;
8、利用训练集对多个图神经网络分别进行训练,并利用测试集进行筛选;
9、迭代重复上述采样、构建、训练、筛选过程直至达到最大迭代次数,获取最终的最优图神经网络。
10、进一步地,所述搜索空间中多个图神经网络参数包括:归一化操作、激活函数、卷积层操作、读出层操作、循环数量、学习率、隐藏层维度、批数量、比率;其中每个参数包含多个选项。
11、进一步地,所述提示语模板还包括任务说明、回复范式规定、搜索策略;其中,任务说明用于说明本次任务是根据搜索空间中的图神经网络参数训练构建具有最优架构的图神经网络;回复范式规定用于规定大语言模型回复输出的参数形式;搜索策略用于给出大语言模型推理获得最优图神经网络配置的方法。
12、进一步地,所述搜索策略包括:在探索阶段即缺乏实验数据阶段,搜索时关注搜索空间中没有出现过的图神经网络配置;在开发阶段即已有实验数据阶段,给出高性能图神经网络架构的常用配置、对应的性能指标、性能指标均值、高性能图神经网络架构性能指标和均值的偏差,搜索时保留高性能图神经网络配置中共同点,修改配置其他部分,以生成新的图神经网络架构。
13、进一步地,所述迭代重复上述采样、构建、训练、筛选过程,获取最终的最优图神经网络包括:采用低精度和高精度结合的训练方式,将训练轮次分为低精度、高精度和训练至收敛;在利用训练集训练阶段,先通过少数轮次的训练获得低精度图神经网络模型,在测试集上得到低精度图神经网络模型的性能,筛选出性能最好的半数模型再进行多数轮次的训练,再将训练结果反馈给预训练的大语言模型;大语言模型采样输出其推理获得的较优的图神经网络配置参数;在多次迭代后,在构建的所有图神经网络中选出性能最好的模型,训练直至收敛,根据最终的性能筛选得到最优的图神经网络模型。
14、根据本专利技术的另一方面,提出一种图神经网络最优架构构建系统,该系统包括:
15、提示语模板设计模块,其配置成预先设计包含多个图神经网络参数的搜索空间;预先设计用于引导大语言模型进行回复的提示语模板;所述提示语模板包括对预先设计的搜索空间的描述;
16、初始提示语获取模块,其配置成基于提示语模板获取初始触发的提示语;
17、最优模型构建模块,其配置成将初始触发的提示语输入预训练的大语言模型中进行采样,获取初始多组图神经网络配置参数;基于初始多组图神经网络配置参数构建对应的多个图神经网络;利用训练集对多个图神经网络分别进行训练,并利用测试集进行筛选;迭代重复上述采样、构建、训练、筛选过程直至达到最大迭代次数,获取最终的最优图神经网络。
18、进一步地,所述提示语模板设计模块中多个图神经网络参数包括:归一化操作、激活函数、卷积层操作、读出层操作、循环数量、学习率、隐藏层维度、批数量、比率;其中每个参数包含多个选项;
19、所述提示语模板还包括任务说明、回复范式规定、搜索策略;其中,任务说明用于说明本次任务是根据搜索空间中的图神经网络参数训练构建具有最优架构的图神经网络;回复范式规定用于规定大语言模型回复输出的参数形式;搜索策略用于给出大语言模型推理获得最优图神经网络配置的方法。
20、进一步地,所述搜索策略包括:在探索阶段即缺乏实验数据阶段,搜索时关注搜索空间中没有出现过的图神经网络配置;在开发阶段即已有实验数据阶段,给出高性能图神经网络架构的常用配置、对应的性能指标、性能指标均值、高性能图神经网络架构性能指标和均值的偏差,搜索时保留高性能图神经网络配置中共同点,修改配置其他部分,以生成新的图神经网络架构。
21、根据本专利技术的又一方面,提出一种基于图神经网络的药物分子性质预测方法,该方法包括:
22、获取药物分子图数据集;
23、将所述药物分子图数据集作为训练集和测试集,利用上述所述的图神经网络最优架构构建方法获取基于最优图神经网络的分子性质预测模型;
24、将待预测分子图输入基于最优图神经网络的分子性质预测模型中,获取预测性质结果。
25、根据本专利技术的又一方面,还提出一种基于图神经网络的药物分子性质预测系统,该系统具有与上述基于图神经网络的药物分子性质预测方法所述的步骤对应的程序模块,运行时执行上述药物分子性质预测方法中的步骤。
26、本专利技术具有以下技术效果:
27、本专利技术提出了一种图神经网络最优架构构建方法、系统及药物分子性质预测方法、系统。包括:预先设计包含多个图神经网络参数的搜索空间;
28、预先设计用于引导大语言模型进行回复的提示语模板;所述提示语模板包括对预先设计的搜索空间的描述;基于提示语模板获取初始触发的提示语;
29、将初始触发的提示语输入预训练的大语言模型中进行采样,获取初始多组图神经网络配置参数;基于初始多组图神经网络配置参数构建对应的多个图神经网络;利用训练集对多个图神经网络分别进行训练,并利用测试集进行筛选;迭代重复上述采样、构建、训练、筛选过程直至达到最大迭代次数,获取最终的最优图神经网络;并将构建的最优图神经网络应用本文档来自技高网...
【技术保护点】
1.一种图神经网络最优架构构建方法,其特征在于,包括:
2.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述搜索空间中多个图神经网络参数包括:归一化操作、激活函数、卷积层操作、读出层操作、循环数量、学习率、隐藏层维度、批数量、比率;其中每个参数包含多个选项。
3.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述提示语模板还包括任务说明、回复范式规定、搜索策略;其中,任务说明用于说明本次任务是根据搜索空间中的图神经网络参数训练构建具有最优架构的图神经网络;回复范式规定用于规定大语言模型回复输出的参数形式;搜索策略用于给出大语言模型推理获得最优图神经网络配置的方法。
4.根据权利要求3所述的一种图神经网络最优架构构建方法,其特征在于,所述搜索策略包括:在探索阶段即缺乏实验数据阶段,搜索时关注搜索空间中没有出现过的图神经网络配置;在开发阶段即已有实验数据阶段,给出高性能图神经网络架构的常用配置、对应的性能指标、性能指标均值、高性能图神经网络架构性能指标和均值的偏差,搜索时保留高性能图神经网络配置中共同点,修改配
5.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述迭代重复上述采样、构建、训练、筛选过程,获取最终的最优图神经网络包括:采用低精度和高精度结合的训练方式,将训练轮次分为低精度、高精度和训练至收敛;在利用训练集训练阶段,先通过少数轮次的训练获得低精度图神经网络模型,在测试集上得到低精度图神经网络模型的性能,筛选出性能最好的半数模型再进行多数轮次的训练,再将训练结果反馈给预训练的大语言模型;大语言模型采样输出其推理获得的较优的图神经网络配置参数;在多次迭代后,在构建的所有图神经网络中选出性能最好的模型,训练直至收敛,根据最终的性能筛选得到最优的图神经网络模型。
6.一种图神经网络最优架构构建系统,其特征在于,包括:
7.根据权利要求6所述的一种图神经网络最优架构构建系统,其特征在于,所述提示语模板设计模块中多个图神经网络参数包括:归一化操作、激活函数、卷积层操作、读出层操作、循环数量、学习率、隐藏层维度、批数量、比率;其中每个参数包含多个选项;
8.根据权利要求7所述的一种图神经网络最优架构构建系统,其特征在于,所述搜索策略包括:在探索阶段即缺乏实验数据阶段,搜索时关注搜索空间中没有出现过的图神经网络配置;在开发阶段即已有实验数据阶段,给出高性能图神经网络架构的常用配置、对应的性能指标、性能指标均值、高性能图神经网络架构性能指标和均值的偏差,搜索时保留高性能图神经网络配置中共同点,修改配置其他部分,以生成新的图神经网络架构。
9.一种基于图神经网络的药物分子性质预测方法,其特征在于,包括:
10.一种基于图神经网络的药物分子性质预测系统,其特征在于,该系统具有与上述权利要求9所述的步骤对应的程序模块,运行时执行上述药物分子性质预测方法中的步骤。
...【技术特征摘要】
1.一种图神经网络最优架构构建方法,其特征在于,包括:
2.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述搜索空间中多个图神经网络参数包括:归一化操作、激活函数、卷积层操作、读出层操作、循环数量、学习率、隐藏层维度、批数量、比率;其中每个参数包含多个选项。
3.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述提示语模板还包括任务说明、回复范式规定、搜索策略;其中,任务说明用于说明本次任务是根据搜索空间中的图神经网络参数训练构建具有最优架构的图神经网络;回复范式规定用于规定大语言模型回复输出的参数形式;搜索策略用于给出大语言模型推理获得最优图神经网络配置的方法。
4.根据权利要求3所述的一种图神经网络最优架构构建方法,其特征在于,所述搜索策略包括:在探索阶段即缺乏实验数据阶段,搜索时关注搜索空间中没有出现过的图神经网络配置;在开发阶段即已有实验数据阶段,给出高性能图神经网络架构的常用配置、对应的性能指标、性能指标均值、高性能图神经网络架构性能指标和均值的偏差,搜索时保留高性能图神经网络配置中共同点,修改配置其他部分,以生成新的图神经网络架构。
5.根据权利要求1所述的一种图神经网络最优架构构建方法,其特征在于,所述迭代重复上述采样、构建、训练、筛选过程,获取最终的最优图神经网络包括:采用低精度和高精度结合的训练方式,将训练轮次分为低精度、高精度和训练至收敛;在利用训练集训练阶段,先通过少数...
【专利技术属性】
技术研发人员:高扬,饶亦涵,姜煜飞,王海帅,杨建军,
申请(专利权)人:杭州心智医联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。