System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的异质图元结构发现方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>清华大学专利>正文

基于大语言模型的异质图元结构发现方法及系统技术方案

技术编号:42808153 阅读:9 留言:0更新日期:2024-09-24 20:51
本发明专利技术涉及人工智能技术领域,提供一种基于大语言模型的异质图元结构发现方法及系统,该方法包括:确定异质图的候选元结构;将异质图的候选元结构输入元结构选择的大语言模型,得到元结构选择的大语言模型输出的选择的元结构;基于遗传算法对选择的元结构进行优化,重复迭代执行确定异质图的候选元结构的步骤和输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将发现的元结构输入差分解释的大语言模型,得到差分解释的大语言模型输出的语义解释。本发明专利技术利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种基于大语言模型的异质图元结构发现方法及系统


技术介绍

1、异质图数据挖掘是指通过分析和挖掘异质图中的节点和边之间的复杂关系,揭示隐藏在数据中的有意义的模式、关联和知识的过程。异质图是由多种类型的节点或边构成的图结构,其广泛存在于各种实际应用场景中,例如社交网络、生物信息学、金融交易、推荐系统等。通过应用异质图挖掘技术,可以发现节点之间的相似性、群组结构、关键路径、推荐关系等信息,从而支持数据分析、知识发现、推荐系统和智能决策等领域的应用。由于节点和边关系复杂,异质图数据挖掘的重要方案是进行元路径(meta-path)或元结构(meta-structure)发现。元路径是一种用于描述异质图中节点之间特定关系模式的概念,它可以通过定义节点类型和边类型的序列来表示,而元结构是对元路径的泛化,使其从线性结构扩展为图结构。通过发现和分析不同类型的元路径或元结构,可以揭示节点之间的复杂关联和模式,从而获得对图结构的深入理解。

2、现有人工设计元结构的方法高度依赖专家领域知识,人力成本高昂,难以规模化,且无法有效保障模型性能。基于强化学习或机器学习的方法进行元结构搜索,只优化在下游任务的预测性能,故往往搜索到高度复杂的元结构,难以解释和理解。

3、因此,如何设计一种从异质图数据中自动发现兼顾预测性能与可解释性的元结构,并能高效应用于不同复杂网络和多种下游任务的算法是一个亟待解决的问题。


技术实现思路

1、本专利技术提供一种基于大语言模型的异质图元结构发现方法及系统,用以解决现有技术中难以解释高度复杂的元结构的缺陷。本专利技术利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。

2、本专利技术提供一种基于大语言模型的异质图元结构发现方法,包括:确定异质图的候选元结构;所述异质图的候选元结构包含语义信息;将所述异质图的候选元结构输入元结构选择的大语言模型,得到所述元结构选择的大语言模型输出的选择的元结构;所述元结构选择的大语言模型用于以语义相似性为导向对所述异质图的候选元结构进行评估和选择;基于遗传算法对所述选择的元结构进行优化,重复迭代执行所述确定异质图的候选元结构的步骤和所述输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将所述发现的元结构输入差分解释的大语言模型,得到所述差分解释的大语言模型输出的语义解释;所述差分解释的大语言模型用于解释所述发现的元结构的结构属性和在下游任务的性能之间的联系。

3、根据本专利技术提供的一种基于大语言模型的异质图元结构发现方法,所述确定异质图的候选元结构,包括:确定初始元结构;基于所述初始元结构进行元结构修改,得到修改后的元结构;所述元结构修改的方式包括插入操作、嫁接操作和删除操作;基于所述语义信息对修改后的元结构进行自然语言编码,得到所述异质图的候选元结构。

4、根据本专利技术提供的一种基于大语言模型的异质图元结构发现方法,所述元结构选择的大语言模型包括小样本预测器和语义相似性导向的元结构选择器;所述将所述异质图的候选元结构输入元结构选择的大语言模型,得到所述元结构选择的大语言模型输出的选择的元结构,包括:将所述异质图的候选元结构和预设提示词分别输入所述小样本预测器和所述语义相似性导向的元结构选择器;所述预设提示词包括性能预测提示词和选择提示词;所述性能预测提示词包括从预设记忆池中采样的元结构评估记录,所述选择提示词包括从所述预设记忆池中采样的元结构选择记录;根据所述性能预测提示词,通过所述小样本预测器确定每个所述异质图的候选元结构的性能预测对;所述性能预测对为关联所述异质图的候选元结构的性能预测结果和所述性能预测结果的置信度的数据对;所述置信度用于表征所述异质图的候选元结构与所述预设记忆池中采样的元结构的语义相似性;根据所述选择提示词和所述性能预测对,通过所述语义相似性导向的元结构选择器从所述异质图的候选元结构中确定所述选择的元结构。

5、根据本专利技术提供的一种基于大语言模型的异质图元结构发现方法,所述基于遗传算法对所述选择的元结构进行优化,包括:对每个所述选择的元结构进行性能评估,得到评估结果;所述性能评估的方式为通过所述选择的元结构训练在所述下游任务的图神经网络的方式;所述下游任务包括节点分类、链接预测、图形归类和推荐系统;将不佳元结构从所述选择的元结构中淘汰;所述不佳元结构为所述选择的元结构中评估结果不满足预设评估条件的元结构;将幸存元结构进行繁殖,得到优化后的异质图的候选元结构;所述幸存元结构为所述选择的元结构中评估结果满足预设评估条件的元结构。

6、根据本专利技术提供的一种基于大语言模型的异质图元结构发现方法,所述预设记忆池用于存储历史选择的元结构训练所述下游任务的图神经网络的性能。

7、根据本专利技术提供的一种基于大语言模型的异质图元结构发现方法,所述将所述发现的元结构输入差分解释的大语言模型,得到所述差分解释的大语言模型输出的语义解释,包括:根据所述发现的元结构确定邻居元结构;所述邻居元结构为对所述发现的元结构进行元结构修改和自然语言编码后得到的元结构;所述元结构修改的方式包括插入操作、嫁接操作和删除操作;通过所述差分解释的大语言模型分别对所述发现的元结构和所述邻居元结构进行结构属性分解,得到发现子结构和邻居子结构;所述发现子结构与所述发现的元结构对应,所述邻居子结构与所述邻居元结构对应;分别通过所述发现子结构和所述邻居子结构训练在所述下游任务的图神经网络,得到性能结果;所述性能结果用于表征所述发现子结构和所述邻居子结构在所述下游任务的性能;基于所述性能结果,通过所述差分解释的大语言模型进行语义解释;所述语义解释包括所述发现子结构中有利于所述下游任务的性能提升的结构和不利于所述下游任务的性能提升的结构。

8、本专利技术还提供一种基于大语言模型的异质图元结构发现系统,包括:确定模块,用于确定异质图的候选元结构;所述异质图的候选元结构包含语义信息;选择模块,用于将所述异质图的候选元结构输入元结构选择的大语言模型,得到所述元结构选择的大语言模型输出的选择的元结构;所述元结构选择的大语言模型用于以语义相似性为导向对所述异质图的候选元结构进行评估和选择;优化模块,用于基于遗传算法对所述选择的元结构进行优化,重复迭代执行所述确定异质图的候选元结构的步骤和所述输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;解释模块,用于将所述发现的元结构输入差分解释的大语言模型,得到所述差分解释的大语言模型输出的语义解释;所述差分解释的大语言模型用于解释所述发现的元结构的结构属性和在下游任务的性能之间的联系。

9、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于大语言模型的异质图元结构发现方法。

10、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的异质图元结构发现方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述确定异质图的候选元结构,包括:

3.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,

4.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述基于遗传算法对所述选择的元结构进行优化,包括:

5.根据权利要求3所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述预设记忆池用于存储历史选择的元结构训练所述下游任务的图神经网络的性能。

6.根据权利要求1至5任一项所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述将所述发现的元结构输入差分解释的大语言模型,得到所述差分解释的大语言模型输出的语义解释,包括:

7.一种基于大语言模型的异质图元结构发现系统,其特征在于,包括:

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于大语言模型的异质图元结构发现方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于大语言模型的异质图元结构发现方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于大语言模型的异质图元结构发现方法。

...

【技术特征摘要】

1.一种基于大语言模型的异质图元结构发现方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述确定异质图的候选元结构,包括:

3.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,

4.根据权利要求1所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述基于遗传算法对所述选择的元结构进行优化,包括:

5.根据权利要求3所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述预设记忆池用于存储历史选择的元结构训练所述下游任务的图神经网络的性能。

6.根据权利要求1至5任一项所述的基于大语言模型的异质图元结构发现方法,其特征在于,所述将所述发现的元结构输入差...

【专利技术属性】
技术研发人员:李勇徐丰力
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1