本申请提供一种模型训练、伪负例的处理方法、装置、设备及存储介质,涉及数据处理技术领域。该方法包括:根据多个历史行为序列,构建对象节点转移图;其中,每个所述历史行为序列中包括:一个用户针对多个对象的历史行为数据;所述对象节点转移图包括:多个对象节点以及所述对象节点之间的关联关系,每个所述对象节点对应一个对象;根据所述对象节点转移图以及预设节点模板图,确定各所述历史行为序列的特征信息;根据所述多个历史行为序列的特征信息和所述多个历史行为序列,进行模型训练,得到伪负例判别器。相对于现有技术,避免了将伪负例作为负例使用,对模型的效果带来影响的问题。对模型的效果带来影响的问题。对模型的效果带来影响的问题。
【技术实现步骤摘要】
模型训练、伪负例的处理方法、装置、设备及存储介质
[0001]本申请涉及数据处理
,具体而言,涉及一种模型训练、伪负例的处理方法、装置、设备及存储介质。
技术介绍
[0002]序列推荐是一种基于用户历史行为序列的推荐技术,旨在为用户提供个性化的推荐列表。具体而言,对于某个用户序列,我们期望能够基于该用户序列预测出接下来该用户的兴趣,兴趣可能是某个商品、某个话题,或者某个操作。序列推荐技术通过对用户历史行为序列的分析和建模,可以更准确地预测用户的兴趣演化趋势,从而提高推荐准确度和用户体验。该技术在电商、视频、音乐等领域得到广泛应用,成为了推荐系统领域的研究热点。
[0003]序列推荐的过程中常用到对比学习模型,对比学习模型一般通过序列
‑
序列对比学习的方式来确定各序列为正样本序列还是负样本序列,一般对比学习的过程中对于整个批内的某个正样本,会匹配少量正样本对,或是利用数据增强的方式构造少量正样本对,负样本则会选取整个批内其它的所有数据作为负样本。
[0004]但是这样的数据构建策略,被选作负样本的样例中,往往存在部分伪负例,即它们其实为正例,若将其作为负例使用,会对模型的效果带来影响。
技术实现思路
[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种模型训练、伪负例的处理方法、装置、设备及存储介质,以解决现有技术中将伪负例作为负例使用,对模型的效果带来影响的问题。
[0006]为实现上述目的,本申请实施例采用的技术方案如下:
[0007]第一方面,本申请一实施例提供了一种模型处理方法,所述方法包括:
[0008]根据多个历史行为序列,构建对象节点转移图;其中,每个所述历史行为序列中包括:一个用户针对多个对象的历史行为数据;所述对象节点转移图包括:多个对象节点以及所述对象节点之间的关联关系,每个所述对象节点对应一个对象;
[0009]根据所述对象节点转移图以及预设节点模板图,确定各所述历史行为序列的特征信息;
[0010]根据所述多个历史行为序列的特征信息和所述多个历史行为序列,进行模型训练,得到伪负例判别器。
[0011]第二方面,本申请实施例提供了一种伪负例的处理方法,所述方法包括:
[0012]获取针对预设目标对象的待对比行为序列,所述待对比行为序列包括:正例行为序列和至少一个待判别负例行为序列;
[0013]根据所述正例行为序列,采用预设伪负例判别器,判断所述待判别负例行为序列是否为伪负例行为序列;其中,所述伪负例判别器为经过上述第一方面所述的模型训练方法训练后得到的;
[0014]若是,则将所述伪负例行为序列从所述待对比行为序列中剔除。
[0015]第三方面,本申请另一实施例提供了一种模型训练装置,所述装置包括:构建模块、确定模块和训练模块,其中:
[0016]所述构建模块,用于根据多个历史行为序列,构建对象节点转移图;其中,每个所述历史行为序列中包括:一个用户针对多个对象的历史行为数据;所述对象节点转移图包括:多个对象节点以及所述对象节点之间的关联关系,每个所述对象节点对应一个对象;
[0017]所述确定模块,用于根据所述对象节点转移图以及预设节点模板图,确定各所述历史行为序列的特征信息;
[0018]所述训练模块,用于根据所述多个历史行为序列的特征信息和所述多个历史行为序列,进行模型训练,得到伪负例判别器。
[0019]第四方面,本申请另一实施例提供了一种伪负例的处理装置,所述装置包括:获取模块、判断模块和剔除模块,其中:
[0020]所述获取模块,用于获取针对预设目标对象的待对比行为序列,所述待对比行为序列包括:正例行为序列和至少一个待判别负例行为序列;
[0021]所述判断模块,用于根据所述正例行为序列,采用预设伪负例判别器,判断所述待判别负例行为序列是否为伪负例行为序列;其中,所述伪负例判别器为经过上述第一方面所述的模型训练方法训练后得到的;
[0022]所述剔除模块,用于若是,则将所述伪负例行为序列从所述待对比行为序列中剔除。
[0023]第五方面,本申请另一实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面或第二方面任一所述方法的步骤。
[0024]第六方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面或第二方面任一所述方法的步骤。
[0025]本申请的有益效果是:采用本申请提供的模型训练方法,根据多个历史行为序列构建对象节点转移图的,建立的对象节点转移图中包括多个对象节点,以及对象节点之间建立关联关系,随后通过预设节点模板图和对象节点转移图确定历史行为序列的特征信息,并通过历史行为序列和历史行为序列的特征信息进行训练的,得到伪负例判别器,由于本申请中的对象节点转移图中包括对象节点之间的关联关系,则通过这样的对象节点转移图和预设节点模板得到的特征信息可以更好地体现各序列之间的关系,通过具有上述特征信息的多个序列训练得到的伪负例判别器在接收到一个正例行为序列和待判别负例行为序列后,可以确定待判别负例行为序列相对于正例行为序列是否为伪负例行为序列,从而解决伪负例行为序列的存在,导致影响后续模型应用的问题。
附图说明
[0026]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0027]图1为本申请一实施例提供的模型训练方法的流程示意图;
[0028]图2为本申请另一实施例提供的模型训练方法的流程示意图;
[0029]图3为本申请另一实施例提供的模型训练方法的流程示意图;
[0030]图4为本申请另一实施例提供的伪负例的处理方法的流程示意图;
[0031]图5为本申请一实施例提供的模型训练装置的结构示意图;
[0032]图6为本申请另一实施例提供的模型训练装置的结构示意图;
[0033]图7为本申请一实施例提供的伪负例的处理装置的结构示意图;
[0034]图8为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
[0035]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
[0036]通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:根据多个历史行为序列,构建对象节点转移图;其中,每个所述历史行为序列中包括:一个用户针对多个对象的历史行为数据;所述对象节点转移图包括:多个对象节点以及所述对象节点之间的关联关系,每个所述对象节点对应一个对象;根据所述对象节点转移图以及预设节点模板图,确定各所述历史行为序列的特征信息;根据所述多个历史行为序列的特征信息和所述多个历史行为序列,进行模型训练,得到伪负例判别器。2.如权利要求1所述的方法,其特征在于,所述根据所述多个历史行为序列的特征信息和所述多个历史行为序列,进行模型训练,得到伪负例判别器,包括:在所述对象节点转移图上确定预设的正例行为序列对应的预设个数的待判别负例行为序列;根据所述预设个数的待判别负例行为的特征信息,对所述预设个数的待判别负例行为进行拼接,得到样本行为序列;以所述正例行为序列为参照,根据所述样本行为序列,进行模型训练,得到所述伪负例判别器。3.如权利要求1所述的方法,其特征在于,所述根据所述对象节点转移图以及预设节点模板图,确定各所述历史行为序列的特征信息,包括:确定所述对象节点转移图中的各所述历史行为序列与所述预设节点模板的重合特征;根据所述重合特征,确定各所述历史行为序列的特征信息。4.如权利要求3所述的方法,其特征在于,所述确定所述对象节点转移图中的各所述历史行为序列与所述预设节点模板的重合特征,包括:确定所述对象节点转移图中的各所述历史行为序列中目标对象节点与所述预设节点模板的同构数向量;所述根据所述重合特征,确定各所述历史行为序列的特征信息,包括:根据所述历史行为序列中每个所述目标对象节点与所述预设节点模板的同构数向量,确定各所述历史行为序列的特征信息。5.如权利要求4所述的方法,其特征在于,所述根据所述历史行为序列中每个所述目标对象节点与所述预设节点模板的同构数向量,确定各所述历史行为序列的特征信息,包括:将所述历史行为序列中每个所述目标对象节点的同构数向量进行归一化;根据所述历史行为序列中每个所述目标对象节点的归一化后的同构数向量,确定各所述历史行为序列的特征信息。6.如权利要求1所述的方法,其特征在于,所述根据多个历史行为序列,构建对象节点转移图,包括:基于所述多个历史行为序列中目标用户的历史行为数据,确定对象节点之间的行为距离;根据所述对象节点之间的行为距离,在所述对象节点之间构建连边;基于多个历史行为序列和多个历史行为序列对应的连边构建结果,构建所述对象...
【专利技术属性】
技术研发人员:范璐,浦嘉澍,张荣升,吕唐杰,范长杰,胡志鹏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。