System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机数据处理领域,特别涉及一种图神经网络训练方法、设备、介质、程序产品和推荐系统。
技术介绍
1、即便是成熟的数据分享大平台,每天新增的大量内容也存在冷启动问题,出于对作者的保护,一般都会对新内容进行保护性分发,但新内容缺乏交互,如果只存在协同过滤这类靠用户交互行为来图神经网络训练的策略,则新发布的内容很难得到曝光的机会,新物品的推荐是推荐系统中的一个难点,原因在于新物品尚未与用户发生交互,无法根据用户—物品交互学习物品的向量表征。
2、推荐系统的物品冷启动常基于物品的标签图神经网络训练,现有技术中,用到的物品的标签是两套系统算出的:一套系统给物品打标签,存入物品画像;另一套系统给用户打标签,存入用户画像。举个例子,物品的标签可以是“口红”、“买房”、“特斯拉”,表示物品属性或用户兴趣。给物品打标签的自然语言处理(nlp)技术比较成熟,可信度高。给用户打标签的系统需要用到用户历史记录、以及物品的标签,有较多中间环节,用户物品的标签可信度不高。
3、本专利技术提出一种端到端的深度学习方法,只使用可信度高的物品物品的标签,而不使用可信度低用户物品的标签,利用用户与物品的交互、物品的标签构成一张图,用图神经网络做端到端的学习,学到用户、物品、物品的标签这三者的向量表征。
技术实现思路
1、本专利技术的目的在于提供一种图神经网络训练方法、设备、介质、程序产品和推荐系统。本专利技术通过对新发布的物品,用某种nlp技术打标签,然后用图神经网络做推理,得到
2、本专利技术的实施方式公开了一种图神经网络训练方法,所述方法包括:
3、构造用户、物品、所述物品的标签的关系图;
4、训练所述图神经网络,产生所述用户的向量表征、所述物品的向量表征和所述物品的标签的向量表征;其中,
5、基于所述物品的向量表征计算所述用户的向量表征;
6、基于所述物品的标签的向量表征计算所述物品的向量表征;
7、基于所述物品的向量表征计算所述物品的标签的向量表征。
8、可选地,图神经网络的输入向量可以为用户的特征向量、物品的特征向量和物品的标签的特征向量。
9、可选地,所述用户的特征向量为空,所述物品的特征向量由文本中提取,所述物品的标签的特征向量可以是embedding向量或由文本中提取。
10、可选地,图神经网络的输出向量为所述用户的embedding向量、物品的embedding向量、物品的标签的embedding向量,并分别记作xu、xi、xt。
11、可选地,设计图神经网络拟合的目标函数、损失函数,包括
12、用户与物品之间的第一拟合目标pui=sigmoid(xutxi);
13、用户与物品之间的第一损失函数为交叉熵-yui×pui-(1-yui)×(1-pui),yui表示用户是否点击过物品,1表示点击,0表示没有点击;
14、物品与物品的标签之间的第二拟合目标qit=sigmoid(xitxt);
15、物品与物品的标签之间的第二损失函数为交叉熵-zit×lnqit-(1-zit)×ln(1-qit),zit表示物品是否与物品的标签有关联,1表示有关联,0表示没有关联。
16、本专利技术的实施方式公开了一种物品召回方法,所述方法包括:基于物品的标签和上述的图神经网络得到所述物品的向量表征;接收用户请求,基于所述用户的向量表征以及所述物品的向量表征进行召回。
17、本专利技术的实施方式公开了一种图神经网络训练系统,其特征在于:
18、打标签模块,对新发布的物品设置多个物品的标签;
19、推理模块,基于物品的标签通过图神经网络得到物品的向量表征;
20、召回模块,基于用户的向量表征和物品的向量表征召回向量内积最大的物品。
21、本专利技术的实施方式公开了一种电子设备,其特征在于,所述设备包括处理器和存储有计算机可执行指令的存储器,所述处理器被配置为执行所述指令以实施上述的图神经网络训练方法。
22、本专利技术的实施方式公开了一种计算机可读存储介质,其特征在于,其特征在于,所述计算机可读存储介质中存储有至少一条计算机指令,所述至少一条指令由处理器加载并执行,以实现上述的图神经网络训练方法。
23、本专利技术的实施方式公开了一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令被执行时,实现上述的图神经网络训练方法。
24、本专利技术提供了一种图神经网络训练方法、设备、介质、程序产品和推荐系统。
25、本专利技术实施方式与现有技术相比,主要区别及其效果在于:本专利技术的图神经网络训练方法的本质是把物品物品的标签扩散到用户,得到用户表征,与用户画像方法有相似之处;但是,本专利技术做端到端的学习,显式地优化图神经网络训练的目标——用户是否点击物品,反观用户画像,它作为搜索、推荐、广告共同依赖的通用技术,不会为推荐图神经网络训练做优化,因此图神经网络训练的效果不如本专利技术。
本文档来自技高网...【技术保护点】
1.一种图神经网络训练方法,用于电子设备,其特征在于,包括:
2.根据权利要求1所述的图神经网络训练方法,其特征在于,所述图神经网络的输入向量可以为所述用户的特征向量、所述物品的特征向量和所述物品的标签的特征向量。
3.根据权利要求2所述的图神经网络训练方法,其特征在于,所述用户的特征向量为空,所述物品的特征向量由文本中提取,所述物品的标签的特征向量可以是embedding向量或由文本中提取。
4.根据权利要求1所述的图神经网络训练方法,其特征在于,所述图神经网络的输出向量为所述用户的embedding向量、所述物品的embedding向量、所述物品的标签的embedding向量,并分别记作xu、xi、xt。
5.根据权利要求1所述的图神经网络训练方法,其特征在于,设计所述图神经网络拟合的目标函数、损失函数,包括
6.一种物品召回方法,用于电子设备,其特征在于,包括:
7.一种推荐系统,用于电子设备,其特征在于,包括:
8.一种电子设备,其特征在于,所述设备包括处理器和存储有计算机可执行指令的存储
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机指令,所述至少一条指令由处理器加载并执行,以实现如权利要求1-5中任一项所述的图神经网络训练方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令被执行时,实现如权利要求1-5中任一项所述的图神经网络训练方法。
...【技术特征摘要】
1.一种图神经网络训练方法,用于电子设备,其特征在于,包括:
2.根据权利要求1所述的图神经网络训练方法,其特征在于,所述图神经网络的输入向量可以为所述用户的特征向量、所述物品的特征向量和所述物品的标签的特征向量。
3.根据权利要求2所述的图神经网络训练方法,其特征在于,所述用户的特征向量为空,所述物品的特征向量由文本中提取,所述物品的标签的特征向量可以是embedding向量或由文本中提取。
4.根据权利要求1所述的图神经网络训练方法,其特征在于,所述图神经网络的输出向量为所述用户的embedding向量、所述物品的embedding向量、所述物品的标签的embedding向量,并分别记作xu、xi、xt。
5.根据权利要求1所述的图神经网络训练方法,其特征在于,设...
【专利技术属性】
技术研发人员:王树森,
申请(专利权)人:行吟信息科技武汉有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。