System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
所属的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。上述计算机可读存储介质中存储的指令可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,应注意,上述指令还可用于执行除了上述步骤以外的附加步骤或者在执行上述步骤时执行更为具体的处理,这些附加步骤和进一步处理的内容已经在参照图1至图7进行相关系统和方法的描述过程中提及,因此这里为了避免重复将不再进行赘述。应注意,根据本公开示例性实施例的交通流预测方法可完全依赖计算机程序或指令的运行来实现相应的功能,即,各个装置在计算机程序的功能架构中与各步骤相应,使得整个系统通过专门的软件包(例如,lib库)而被调用,以实现相应的功能。另一方面,当附图所示的系统、单元或模块以软件、固件、中间件或微代码实现时,用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的计算机可读介质中,使得至少一个处理器或至少一个计算装置可通过读取并运行相应的程序代码或者代码段来执行相应的操作,另外,该计算机可读介质或存储介质可在计算机程序被处理器执行时,促使处理器执行上述训练方法和/或预测方法。这里的计算机可读存储介质的示例包括:只读存储器(rom)、随机存取可编程只读存储器(prom)、电可擦除可编程只读存储器(eeprom)、随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)、闪存、非易失性存储器等等。根据本公开的实施例的训练方法训练的图分类模型能够有效预测诸如情感文本图、分
技术介绍
1、在图像识别中,典型的虚假相关例子是依赖背景而不是物体的形状。在自然语言理解中,它表现为偏好特定词汇而非把握句子的整体意义。在基于图的任务中,显著的示例为关注分子的支架而非实际上重要的功能团。由于消息传递机制,具有更高度和更高模块性的结构模式可能受到更多关注。
2、更具体地说,在预测水溶性的背景下,环状结构的存在并不是溶性的实际决定因素。尽管具有环状结构的分子通常表现出较差的水溶性,但溶性的实际决定因素是赋予分子极性的极性功能团,如羟基和氨基团。然而,对于使用随机梯度下降(sgd)训练的模型,关注图中的环状结构通常比专注于极性功能团结构更简单。这可能导致模型过分强调简单和虚假特征,而忽视学习复杂但因果的特征,显著影响模型的泛化能力。
3、为了解决分布外泛化失败的问题,目前最有效且广泛采用的策略是基于子图混合。子图混合方法首先使用子图提取器来识别与不同环境中的各种图分布的目标标签保持一致相关性的底层不变或因果子图。随后,它将不变子图与另一个实例的虚假子图(不变子图的补集)结合起来,以扩充数据集并实现改进的结果。当虚假子图是更简单的模式且同样能预测训练标签时,子图提取器由于简单性偏差而面临提取不变子图的挑战。如果估计的不变子图部分包含了虚假信息,将对应于不变部分的标签分配给混合图可能会加强虚假子图与标签之间的虚假相关性。另一类工作基于信息瓶颈(ib),通过最大化标签与不变子图之间的互信息,同时最小化子图与整个图之间的互信息来实现泛化。然而,ib方法本身并不能区分提取子图与标签之间的因果相关性和虚假相关性。这一限制可能导致ib方法保留提取子图的虚假信息。当虚假子图是更简单的模式且在训练集上同样具有预测性时,这个问题将变得更加严重。
技术实现思路
1、本专利技术的目的之一在于获得能够有效预测诸如情感文本图、分子结构图等的信息结构图的标签的图分类模型。
2、根据本公开的第一方面,提供一种图分类模型的训练方法,图分类模型包括第一图分类器和第二图分类器,第一图分类器包括第一子图提取器和与第一子图提取器对应的第一子图分类器,第二图分类器包括第二子图提取器和与第二子图提取器对应的第二子图分类器,训练方法包括:获取包括信息结构图的训练图数据,其中,信息结构图包括分子结构图或情感文本图;分别利用第一子图提取器和第二子图提取器从训练图数据提取第一标签预测性子图和第二标签预测性子图;分别利用第一子图分类器和第二子图分类器预测与第一标签预测性子图和第二标签性子图对应的第一标签和第二标签;根据第一标签、第二标签、第一子图提取器和第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失,并且以综合损失最小为目标调整第一图分类器和第二图分类器的各个参数,以训练得到图分类模型,其中,第一掩码矩阵和第二掩码矩阵彼此不同。
3、根据本公开的实施例,根据第一标签、第二标签、第一子图提取器和第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失的步骤可包括:根据第一标签和第二标签计算主损失;基于第一掩码矩阵和第二掩码矩阵之间的杰卡德相似度确定互异性损失;根据主损失和互异性损失计算得到综合损失。
4、根据本公开的实施例,综合损失可根据主损失、互异性损失以及预先确定的多样性权重计算得到。
5、根据本公开的实施例,第一标签预测性子图和第二标签预测性子图中的每者可通过如下步骤获得:通过图神经网络将训练图数据编码为节点;使用多层感知机将根据节点得到的节点对的串联表征映射为掩码概率;利用gumbel-sigmoid技术对掩码概率进行采样,以得到二值化掩码概率;基于二值化掩码概率和掩码概率获得掩码矩阵;根据掩码矩阵以及图数据的邻接矩阵获得第一预测性子图或第二预测性子图。
6、根据本公开的实施例,第一标签和第二标签中的每者可通过如下方式预测得到:通过gnn模型将预测性子图映射为特征矩阵;对所有节点的特征矩阵进行聚合以获得特征向量;将特征向量输入到多层感知机,预测得到第一标签或第二标签。
7、根据本公开的第二方面,提供一种图分类模型的预测方法,预测方法包括:获取包括信息结构图的验证图数据,其中,信息结构图包括分子结构图或情感文本图;将验证图数据输入到上述训练方法训练的图分类模型;在第一图分类模型和第二图分类模型中选择准确率最高的图分类模型;获取包括信息结构图的测试图数据;将测试图数据输入到选择的图分类模型,预测得到与分子结构图或情感文本图相关的标签。
8、根据本公开的第三方面,提供一种图分类模型的训练装置,训练装置包括:图分类模型包括第一图分类器和第二图分类器,第一图分类器包括第一子图提取器和与第一子图提取器对应的第一子图分类器,第二图分类器包括第二子图提取器和与第二子图提取器对应的第二子图分类器,训练装置包括:获取模块,获取包括信息结构图的训练图数据,其中,信息结构图包括分子结构图或情感文本图;标签预测性子图获取本文档来自技高网...
【技术保护点】
1.一种图分类模型的训练方法,其特征在于,所述图分类模型包括第一图分类器和第二图分类器,所述第一图分类器包括第一子图提取器和与所述第一子图提取器对应的第一子图分类器,所述第二图分类器包括第二子图提取器和与所述第二子图提取器对应的第二子图分类器,所述训练方法包括:
2.根据权利要求1所述的图分类模型的训练方法,其特征在于,根据所述第一标签、所述第二标签、所述第一子图提取器和所述第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失的步骤包括:
3.根据权利要求2所述的图分类模型的训练方法,其特征在于,所述综合损失根据所述主损失、所述互异性损失以及预先确定的多样性权重计算得到。
4.根据权利要求1所述的图分类模型的训练方法,其特征在于,所述第一标签预测性子图和第二标签预测性子图中的每者通过如下步骤获得:
5.根据权利要求4所述的图分类模型的训练方法,其特征在于,所述第一标签和所述第二标签中的每者通过如下方式预测得到:
6.一种图分类模型的预测方法,其特征在于,所述预测方法包括:
7.一种图分类模型
8.根据权利要求7所述的图分类模型的训练装置,其特征在于,模型生成模块被配置为:
9.一种图分类模型的预测装置,其特征在于,所述预测装置包括:
10.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有指令或程序,当所述指令或程序由所述处理器加载并且运行时,促使处理器执行根据权利要求1至5中的任一项所述的训练方法和/或根据权利要求6所述的预测方法。
...【技术特征摘要】
1.一种图分类模型的训练方法,其特征在于,所述图分类模型包括第一图分类器和第二图分类器,所述第一图分类器包括第一子图提取器和与所述第一子图提取器对应的第一子图分类器,所述第二图分类器包括第二子图提取器和与所述第二子图提取器对应的第二子图分类器,所述训练方法包括:
2.根据权利要求1所述的图分类模型的训练方法,其特征在于,根据所述第一标签、所述第二标签、所述第一子图提取器和所述第二子图提取器分别通过学习得到的第一掩码矩阵和第二掩码矩阵计算综合损失的步骤包括:
3.根据权利要求2所述的图分类模型的训练方法,其特征在于,所述综合损失根据所述主损失、所述互异性损失以及预先确定的多样性权重计算得到。
4.根据权利要求1所述的图分类模型的训练方法,其特征在于,所述第一标签预测性子图和...
【专利技术属性】
技术研发人员:王亮,刘强,吴书,孙鑫,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。