System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及计算机,特别涉及一种特征提取模型的训练方法、特征提取方法、装置及设备。
技术介绍
1、在计算机
中,相关性识别任务是一种常见的任务。通常情况下,需要训练得到特征提取模型,通过特征提取模型对目标信息进行特征提取,得到目标信息的特征,通过两个目标信息的特征来确定两个目标信息之间相关的可能性,从而确定两个目标信息是否相关,实现相关性识别。基于此,如何训练得到特征提取模型成为一个重要问题。
技术实现思路
1、本申请提供了一种特征提取模型的训练方法、特征提取方法、装置及设备,能够训练得到特征提取效率较高的特征提取模型,所述技术方案包括如下内容。
2、第一方面,提供了一种特征提取模型的训练方法,所述方法包括:
3、获取样本图结构,所述样本图结构中包括多个样本节点和多个样本边,任一个样本节点表征一个样本信息,任一个样本边表征两端样本节点的相关程度;
4、基于所述样本图结构确定多个样本子图,任一个样本子图包括中心节点和邻居节点,所述邻居节点通过样本边与所述中心节点连接;
5、对于任一个样本子图,通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,所述任一个样本子图包括的中心节点的语义特征包括所述任一个样本子图包括的中心节点表征的样本信息的语义和所述任一个样本子图包括的邻居节点表征的样本信息的语义;
6、基于各个样本子图包括的中心节点的语义特征,对所述神经网络
7、第二方面,提供了一种特征提取方法,所述方法包括:
8、获取目标图结构,所述目标图结构中包括多个目标节点和多个目标边,任一个目标节点表征一个目标信息,任一个目标边表征两端目标节点的相关程度;
9、基于所述目标图结构确定多个目标子图,任一个目标子图包括中心节点和邻居节点,所述邻居节点通过目标边与所述中心节点连接;
10、对于任一个目标子图,通过特征提取模型基于所述任一个目标子图包括的中心节点和邻居节点,确定所述任一个目标子图包括的中心节点的语义特征,所述特征提取模型是按照第一方面所述的特征提取模型的训练方法训练得到的,所述任一个目标子图包括的中心节点的语义特征包括所述任一个目标子图包括的中心节点表征的目标信息的语义和所述任一个目标子图包括的邻居节点表征的目标信息的语义。
11、第三方面,提供了一种特征提取模型的训练装置,所述装置包括:
12、获取模块,用于获取样本图结构,所述样本图结构中包括多个样本节点和多个样本边,任一个样本节点表征一个样本信息,任一个样本边表征两端样本节点的相关程度;
13、确定模块,用于基于所述样本图结构确定多个样本子图,任一个样本子图包括中心节点和邻居节点,所述邻居节点通过样本边与所述中心节点连接;
14、所述确定模块,还用于对于任一个样本子图,通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,所述任一个样本子图包括的中心节点的语义特征包括所述任一个样本子图包括的中心节点表征的样本信息的语义和所述任一个样本子图包括的邻居节点表征的样本信息的语义;
15、训练模块,用于基于各个样本子图包括的中心节点的语义特征,对所述神经网络模型进行训练,得到特征提取模型,所述特征提取模型用于确定目标子图包括的中心节点的语义特征。
16、在一种可能的实现方式中,所述获取模块,用于获取多个交互行为信息,任一个交互行为信息用于表征一个样本对象选中一个样本物品的交互行为;基于所述多个交互行为信息构建初始图结构,所述初始图结构包括多个初始节点和多个初始边,任一个初始节点表征一个样本信息,任一个初始边表征两端初始节点的相关程度;将所述初始图结构中相关程度满足第一相关条件的初始边过滤掉,得到样本图结构。
17、在一种可能的实现方式中,所述获取模块,用于基于所述多个交互行为信息确定多个样本物品的信息以及每两个样本物品的共现次数,任两个样本物品的共现次数是所述任两个样本物品由同一个样本对象选中的次数;基于所述多个样本物品的信息确定所述多个初始节点,任一个初始节点表征的样本信息为一个样本物品的信息;基于所述任两个样本物品的共现次数,确定所述任两个样本物品对应的初始节点之间的初始边,所述任两个样本物品的共现次数为所述任两个样本物品对应的初始节点之间的初始边表征的相关程度;基于所述多个初始节点以及每两个初始节点之间的初始边确定所述初始图结构。
18、在一种可能的实现方式中,所述确定模块,用于通过神经网络模型确定所述任一个样本子图包括的中心节点的初始特征和所述任一个样本子图包括的邻居节点的初始特征,所述任一个样本子图包括的中心节点的初始特征用于描述所述任一个样本子图包括的中心节点表征的样本信息的语义,所述任一个样本子图包括的邻居节点的初始特征用于描述所述任一个样本子图包括的邻居节点表征的样本信息的语义;将所述任一个样本子图包括的中心节点的初始特征和所述任一个样本子图包括的邻居节点的初始特征进行拼接,得到所述任一个样本子图包括的中心节点的语义特征。
19、在一种可能的实现方式中,所述确定模块,用于通过神经网络模型确定所述任一个样本子图包括的中心节点的嵌入向量,所述任一个样本子图包括的中心节点的嵌入向量是用于描述所述任一个样本子图包括的中心节点表征的样本信息的低维向量;通过所述神经网络模型对所述任一个样本子图包括的中心节点的嵌入向量进行池化处理,得到所述任一个样本子图包括的中心节点的池化向量;通过所述神经网络模型对所述任一个样本子图包括的中心节点的池化向量进行融合处理,得到所述任一个样本子图包括的中心节点的初始特征。
20、在一种可能的实现方式中,所述获取模块,用于基于所述多个交互行为信息确定多个样本对象、多个样本物品以及各个样本对象选中各个样本物品的次数;基于所述多个样本对象和所述多个样本物品分别确定初始节点,任一个初始节点表征的样本信息为一个样本物品的信息或者一个样本对象的信息;对于任一个样本对象和任一个样本物品,基于所述任一个样本对象选中所述任一个样本物品的次数,确定所述任一个样本对象对应的初始节点与所述任一个样本物品对应的初始节点之间的初始边,所述任一个样本对象选中所述任一个样本物品的次数为所述任一个样本对象对应的初始节点与所述任一个样本物品对应的初始节点之间的初始边表征的相关程度;基于所述多个初始节点以及每两个初始节点之间的初始边确定所述初始图结构。
21、在一种可能的实现方式中,所述神经网络模型包括第一子模型和第二子模型,所述第一子模型的模型参数和所述第二子模型的模型参数不同;
22、所述确定模块,用于响应于所述任一个样本子图包括的中心节点表征一个样本对象的信息,则通过所述第一子模型基于所述任一个样本子图本文档来自技高网...
【技术保护点】
1.一种特征提取模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取样本图结构,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个交互行为信息构建初始图结构,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述通过神经网络模型确定所述任一个样本子图包括的中心节点的初始特征,包括:
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个交互行为信息构建初始图结构,包括:
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型包括第一子模型和第二子模型,所述第一子模型的模型参数和所述第二子模型的模型参数不同;所述通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,包括:
8.根据权利要求1所述的方法,其特征在于,
9.根据权利要求1所述的方法,其特征在于,所述基于各个样本子图包括的中心节点的语义特征,对神经网络模型进行训练,得到特征提取模型,包括:
10.根据权利要求9所述的方法,其特征在于,所述获取所述任一对样本子图包括的中心节点之间的标注相关性,包括:
11.一种特征提取方法,其特征在于,所述方法包括:
12.根据权利要求11所述的方法,其特征在于,任一对目标子图包括的中心节点中包括目标中心节点,所述目标中心节点表征待推荐的目标信息;所述方法还包括:
13.一种特征提取模型的训练装置,其特征在于,所述装置包括:
14.一种特征提取装置,其特征在于,所述装置包括:
15.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以使所述电子设备实现如权利要求1至10任一所述的特征提取模型的训练方法或者如权利要求11至12任一所述的特征提取方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现如权利要求1至10任一所述的特征提取模型的训练方法或者如权利要求11至12任一所述的特征提取方法。
17.一种计算机程序产品,其特征在于,所述计算机程序产品中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以使电子设备实现如权利要求1至10任一所述的特征提取模型的训练方法或者如权利要求11至12任一所述的特征提取方法。
...【技术特征摘要】
1.一种特征提取模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取样本图结构,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个交互行为信息构建初始图结构,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,包括:
5.根据权利要求4所述的方法,其特征在于,所述通过神经网络模型确定所述任一个样本子图包括的中心节点的初始特征,包括:
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个交互行为信息构建初始图结构,包括:
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型包括第一子模型和第二子模型,所述第一子模型的模型参数和所述第二子模型的模型参数不同;所述通过神经网络模型基于所述任一个样本子图包括的中心节点和邻居节点,确定所述任一个样本子图包括的中心节点的语义特征,包括:
8.根据权利要求1所述的方法,其特征在于,所述基于所述样本图结构确定多个样本子图,包括:
9.根据权利要求1所述的方法,其特征在于,所述基于各个样本子图包括的中心节点的语义特征,对神经网络模型进行训练,得到特征提取模型,包括:
10.根据权利要求9所述的方法,...
【专利技术属性】
技术研发人员:叶祺,王峰,郑智勇,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。