System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及的是一种机器学习领域的技术,具体是一种基于双图表示学习预训练模型的推荐系统。
技术介绍
1、随着深度学习技术的快速发展,越来越多的预训练模型被广泛应用于各类任务中,这些模型大多被发布在开放或私有的模型库。然而面对庞大的模型库,如何为特定的任务选择合适的模型成为一个极具挑战性的问题。一方面,模型库中模型检索主要依赖于标签或描述信息对模型进行简单的分类和筛选,这些方法通常只关注模型的任务类型标签,并未深入理解任务的具体需求,也未能充分利用模型架构信息,导致推荐结果的准确性和适用性受限。另一方面,基于标签来筛选模型的方式忽视数据集和模型之间的复杂关系,难以有效捕捉跨数据集和模型之间的细微差异。
技术实现思路
1、本专利技术针对现有模型推荐系统在应对复杂任务时存在的推荐精度不足以及泛化能力较差的问题,提出一种基于双图表示学习预训练模型的推荐系统,通过对模型和数据集进行元特征提取,并基于相似关系进行双图表示学习,本专利技术能够有效捕捉数据集与模型之间的复杂关系,从而实现高效、准确的模型推荐。
2、本专利技术是通过以下技术方案实现的:
3、本专利技术涉及一种基于双图表示学习预训练模型的推荐系统,包括:数据录入模块、元特征提取模块、图谱构建模块和智能推荐模块,其中:数据录入模块录入外部数据源的模型数据和数据集数据并解析后输出至元特征提取模块;元特征提取模块提取和聚合模型与数据集的元特征向量;图谱构建模块基于元特征向量构建模型图谱和数据集图谱的双图表示并通过计
4、所述的模型数据通过接口正则匹配的方式加载录入,数据集数据通过元信息解析的方式加载录入。
5、所述的数据录入模块,通过自动数据录入的方式对系统内相关数据进行定期更新。
6、所述的提取和聚合是指:数据集和模型的数据将分别进行多元特征的提取,在提取得到模型和数据集若干个关键特征后,这些特征将基于维度放缩的方式进行特征聚合,并输出元特征向量至图谱构建模块。
7、技术效果
8、本专利技术基于双图表示学习的深度神经网络模型推荐系统根据录入数据进行双图构建和模型推荐;利用残差图卷积和多层感知机针对数据集和模型进行回归预测。相比现有技术,本专利技术能够自动化、数据驱动地进行模型推荐,降低模型选择过程中对人工参与和专家经验的依赖。通过构建模型图谱和数据集图谱,能有效捕捉数据集与模型之间的复杂关系,显著提升模型推荐的精度和效率;能够动态适应模型库的变化的同时,在不同领域的应用以及不同的场景中均能表现出良好的性能、效率和泛化性。
本文档来自技高网...【技术保护点】
1.一种基于双图表示学习预训练模型的推荐系统,其特征在于,包括:数据录入模块、元特征提取模块、图谱构建模块和智能推荐模块,其中:数据录入模块录入外部数据源的模型数据和数据集数据并解析后输出至元特征提取模块;元特征提取模块提取和聚合模型与数据集的元特征向量;图谱构建模块基于元特征向量构建模型图谱和数据集图谱的双图表示并通过计算模型间的架构特征相似度以及分析数据集间的标签权重关系;智能推荐模块在双图表示和对应的元特征向量的基础上,通过使用基于残差图卷积和多层感知机的深度推荐模型,针对数据集进行回归准确率预测,进而得到模型推荐的结果列表。
2.根据权利要求1所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的模型数据通过接口正则匹配的方式加载录入,数据集数据通过元信息解析的方式加载录入。
3.根据权利要求1所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的提取和聚合是指:数据集和模型的数据将分别进行多元特征的提取,在提取得到模型和数据集若干个关键特征后,这些特征将基于维度放缩的方式进行特征聚合,并输出元特征向量至图谱构建模块。
4.
5.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的元特征提取模块包括:预训练模型多元特征提取单元、数据集多元特征提取单元以及基于维度放缩的特征聚合单元,其中:预训练模型多元特征提取单元根据模型文件提取得到预训练模型的三类特征,包括模型架构特征、模型参数量以及推理复杂度;数据集多元特征提取单元根据数据集文件提取得到数据集的两类特征,包括数据集基数特征、类别基数特征和标签构成特征;基于维度放缩的特征聚合单元针对提取的多个特征,进行特征权重计算得到每个数值特征的权重大小,并对数值特征向量进行基于权重的维度放缩,最后使用多元特征拼接方法将多个特征聚合为一个完整的元特征。
6.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的图谱构建模块包括:基于架构余弦相似度的模型关系计算单元、基于标签权重的数据集关系计算单元以及基于实体关系的双图表示构建单元,其中:基于架构余弦相似度的模型关系计算单元计算模型图谱中所有模型之间的相似性关系;基于标签权重的数据集关系计算单元计算数据集图谱中所有数据集的相似性关系并将数据集间的关系用额外的标签节点进行关联;基于实体关系的双图表示构建单元基于计算的模型相似关系构建模型图谱。
7.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的智能推荐模块包括:基于残差连接的图卷积模型单元和基于多层感知机的回归分数计算模型单元,其中:基于残差连接的图卷积模型单元从双图表示中提取特征,同时通过残差连接来保持原始特征信息,一共堆叠K层;基于多层感知机的回归分数计算模型单元在获得图卷积模型输出的隐层图表示后,使用多层感知机(MLP)进行最终的回归评分计算,预测每个模型在特定数据集上的准确率;基于残差连接的图卷积模型单元和基于多层感知机的回归分数计算模型单元两者组成基于双图表示的深度推荐模型。
8.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的提取特征,具体包括:首先图卷积模型接受输入的双图表示,包括数据集图谱GD和模型图谱GM;随后经过K层带残差的图卷积层对图谱中的节点进行特征聚合,每一层的图卷积操作均为其中:是第k层图卷积后节点i的特征向量,表示第k层图卷积操作,A是图的邻接矩阵,rk是第k层的残差权重,经过堆叠K层的带残差图卷积连接后,最终输出隐图表示和其中:节点i的高维特征向量为
9.根据权利要求1所述的基于双图表示学习预训练模型的推荐...
【技术特征摘要】
1.一种基于双图表示学习预训练模型的推荐系统,其特征在于,包括:数据录入模块、元特征提取模块、图谱构建模块和智能推荐模块,其中:数据录入模块录入外部数据源的模型数据和数据集数据并解析后输出至元特征提取模块;元特征提取模块提取和聚合模型与数据集的元特征向量;图谱构建模块基于元特征向量构建模型图谱和数据集图谱的双图表示并通过计算模型间的架构特征相似度以及分析数据集间的标签权重关系;智能推荐模块在双图表示和对应的元特征向量的基础上,通过使用基于残差图卷积和多层感知机的深度推荐模型,针对数据集进行回归准确率预测,进而得到模型推荐的结果列表。
2.根据权利要求1所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的模型数据通过接口正则匹配的方式加载录入,数据集数据通过元信息解析的方式加载录入。
3.根据权利要求1所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的提取和聚合是指:数据集和模型的数据将分别进行多元特征的提取,在提取得到模型和数据集若干个关键特征后,这些特征将基于维度放缩的方式进行特征聚合,并输出元特征向量至图谱构建模块。
4.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的数据录入模块包括:基于调用信息的模型录入单元和基于元信息的数据集录入单元,其中:基于调用信息的模型录入单元,根据已知预训练模型库的模型调用接口,构造对应的正则匹配表达式来匹配文档中的调用接口;通过录入各个预训练模型库中的模型调用接口信息,并基于先前定义的正则模式对模型说明文档进行正则匹配,得到模型说明中对应的模型调用接口;随后对具体调用接口中使用的库类型进行识别,并使用对应python库进行模型的内容加载和元数据提取,最终加载的模型内容和数据将输入元特征提取模块;基于元信息的数据集录入单元加载图像数据集平台对应的python库,通过调用库中提供的全量数据集元信息提取函数,录入数据集的元信息;随后通过图像数据集库中的自动化加载方法,基于提取的数据集元信息进行图像数据集的内容加载,最终加载的数据集内容和数据将输入元特征提取模块。
5.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的元特征提取模块包括:预训练模型多元特征提取单元、数据集多元特征提取单元以及基于维度放缩的特征聚合单元,其中:预训练模型多元特征提取单元根据模型文件提取得到预训练模型的三类特征,包括模型架构特征、模型参数量以及推理复杂度;数据集多元特征提取单元根据数据集文件提取得到数据集的两类特征,包括数据集基数特征、类别基数特征和标签构成特征;基于维度放缩的特征聚合单元针对提取的多个特征,进行特征权重计算得到每个数值特征的权重大小,并对数值特征向量进行基于权重的维度放缩,最后使用多元特征拼接方法将多个特征聚合为一个完整的元特征。
6.根据权利要求1-3中任一所述的基于双图表示学习预训练模型的推荐系统,其特征是,所述的图谱构建模块包括:基于架构余弦相似度的模型关系计算单元、基于标签权重的数据集关系计算单元以及基于实体关系的双图表示构建单元,其中:基于架构余弦相似度的模型关系计算单元计算模型图谱中所有模型之间的相似性关系;基于标签权重的数据集关系计算单元计算数据集图谱中所有数据集的相似...
【专利技术属性】
技术研发人员:于晗,钱麒丹,蔡鸿明,陈治源,胡畔,陈诺,姜丽红,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。