信息处理方法、装置、电子设备及介质制造方法及图纸

技术编号:23051089 阅读:18 留言:0更新日期:2020-01-07 14:56
本公开提供了一种信息处理方法,包括:获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;获取目标用户的用户信息及目标物品的第一物品信息;将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及根据操作信息及预测置信度,优化特征提取模型。其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、图像信息和文本信息,p为大于1的自然数。本公开还提供了一种信息处理装置、一种电子设备及一种计算机可读存储介质。

Information processing methods, devices, electronic equipment and media

【技术实现步骤摘要】
信息处理方法、装置、电子设备及介质
本公开涉及计算机
,更具体地,涉及一种信息处理方法、装置、电子设备及介质。
技术介绍
近年来,随着电子商务的迅速发展和用户交互信息的爆炸式增长,从多类型、多维度的信息中提取用户特征成为影响推荐系统效果的重要因素。在实现本公开构思的过程中,专利技术人发现现有技术中至少存在以下问题:现有的特征提取方法包括基于传统机器学习算法进行提取和基于时间序列深度学习算法进行提取。其中,基于传统机器学习算法进行提取(如协同过滤)仅能利用用户的交互信息,无法处理文本和图像等非结构化信息,从而存在大量数据浪费,特征提取效果较差的缺陷。基于时间序列深度学习算法需要人为在时间维度进行特征处理,处理方式相对固定,需要非常强的专家先验知识,并不能很好的处理时间序列类特征。
技术实现思路
有鉴于此,本公开提供了一种能够融合多种不同类型数据进行特征提取的信息处理方法、装置、电子设备及介质。本公开的一个方面提供了一种信息处理方法,包括:获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;获取目标用户的用户信息及目标物品的第一物品信息;将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及根据操作信息及预测置信度,优化特征提取模型,其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,p为大于1的自然数。根据本公开的实施例,上述特征提取模型包括针对至少两种类型的信息的至少两个提取子模型,以分别提取得到至少两种类型的信息的特征子向量,特征向量根据至少两种类型的信息的特征子向量得到。根据本公开的实施例,上述用户信息包括:用户特征信息及在第一时刻之前的交互记录信息,该交互记录信息包括n个预定操作所针对物品的n个第二物品信息及n个预定操作所针对的n个第一时间信息;物品信息包括物品特征信息,n为大于1的自然数。上述提取得到特征向量包括:将第一物品信息包括的第一物品特征信息及用户特征信息分别输入第一转换模型,得到针对第一物品特征信息的第一特征子向量以及针对用户特征信息的第二特征子向量;将n个第二物品信息包括的n个第二物品特征信息及n个第一时间信息配对组合,得到n个第一输入信息;以及根据n个第一时间信息表征的n个第二时刻的先后顺序,将n个第一输入信息依次输入第一循环神经网络模型,得到第三特征子向量。其中,特征向量根据第一特征子向量、第二特征子向量以及第三特征子向量得到;针对特征信息的提取子模型包括第一转换模型和第一循环神经网络模型。根据本公开的实施例,上述物品信息还包括物品图像信息;上述提取得到特征向量还包括:将n个第二物品信息包括的n个第二物品图像信息依次输入卷积神经网络模型,得到针对n个第二物品图像信息的n个第一向量;将n个第一向量及n个第一时间信息配对组合,得到n个第二输入信息;根据n个第一时间信息表征的n个第二时刻的先后顺序,将n个第二输入信息依次输入第二循环神经网络模型,得到第四特征子向量;以及将第一物品信息包括的第一物品图像信息输入卷积神经网络模型中,得到第五特征子向量。其中,特征向量还根据第四特征子向量和第五特征子向量得到;针对图像信息的提取子模型包括卷积神经网络模型和第二循环神经网络模型。根据本公开的实施例,上述用户信息还包括在第一时刻之前输入的m个输入文本信息及输入m个输入文本信息的m个第二时间信息,上述物品信息还包括物品文本信息;上述提取得到特征向量还包括:将m个输入文本信息依次输入第二转换模型,得到针对m个输入文本信息的m个第二向量;将m个第二向量及m个第二时间信息配对组合,得到m个第三输入信息;根据m个第二时间信息表征的m个第三时刻的先后顺序,将m个第三输入信息依次输入第三循环神经网络模型,得到第六特征子向量;以及将物品文本信息输入第二转换模型,得到针对物品文本信息的第七特征子向量,其中,特征向量还根据第六特征子向量及第七特征子向量得到;针对文本信息的提取子模型包括第二转换模型和第三循环神经网络模型。根据本公开的实施例,上述第一循环神经网络模型、第二循环神经网络模型和/或第三循环神经网络模型中的任一循环神经网络模型采用以下公式计算得到第i次循环的输出信息ai:ai=g1(W1xdi+ai-1W2+b1);上述任一循环神经网络模型通过以下公式计算得到输出的特征子向量:xend=g2(anW3+b2);其中,1≤i≤n,W1、W2、W3、b1和b2为任一循环神经网络模型的参数,xdi为任一循环神经网络模型的第i次循环的输入信息,g1()为非线性函数,g2()为激活函数。根据本公开的实施例,上述第一循环神经网络模型、第二循环神经网络模型和/或第三循环神经网络模型中的任一循环神经网络模型采用以下公式计算得到第i次循环的输出信息ai:ai=g1[f(ti)W1xdi+ai-1W2+b1];其中,1≤i≤n,W1、W2和b1为任一循环神经网络模型的参数,xdi为任一循环神经网络模型的第i次循环的输入信息,g1()为非线性函数,ti为n个第一时间信息中第i个第一时间信息表征的第二时刻;f(ti)为时间衰减因子,通过以下公式计算得到:其中,t0为第一时刻,γ为大于0的超参。根据本公开的实施例,上述根据操作信息及预测置信度,优化特征提取模型包括:采用交替子空间梯度下降算法,根据操作信息及置信度,交替优化至少两个提取子模型中的每个提取子模型。根据本公开的实施例,上述操作信息包括针对p种预定操作中每种预定操作的实际置信度;优化每个提取子模型包括:根据针对每种预定操作的预测置信度与针对每种预定操作的实际置信度,采用损失函数计算得到特征提取模型针对每种预定操作的损失值;根据针对每种预定操作的损失值,优化每个提取子模型。根据本公开的实施例,上述针对每种预定操作的预测置信度包括根据q个样本数据得到的q个预测置信度;针对每种预定操作的损失值为q个;上述优化每个提取子模型还包括:整合针对p种预定操作的p*q个损失值,得到特征提取模型针对q个样本数据的总损失值;以及根据总损失值,优化每个提取子模型。其中,q为大于1的自然数。本公开的另一方面提供了一种信息处理装置,该装置包括:样本获取模块,用于获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;信息获取模块,用于获取目标用户的用户信息及目标物品的第一物品信息;特征提取模块,用于将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;置信度预测模块,用于采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及模型优化模块,用于根据操作信息及预测置信度,优化特征提取模型。其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、图像信息和文本信息本文档来自技高网...

【技术保护点】
1.一种信息处理方法,包括循环执行的以下操作,以对特征提取模型进行优化:/n获取样本数据,所述样本数据表征目标用户、目标物品及所述目标用户在第一时刻对所述目标物品执行p种预定操作的操作信息;/n获取所述目标用户的用户信息及所述目标物品的第一物品信息;/n将所述用户信息及所述第一物品信息输入特征提取模型,提取得到特征向量;/n采用预测模型处理所述特征向量,得到所述目标用户对所述目标物品执行p种预定操作中每种预定操作的预测置信度;以及/n根据所述操作信息及所述预测置信度,优化所述特征提取模型,/n其中,所述用户信息和/或所述第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,所述p为大于1的自然数。/n

【技术特征摘要】
1.一种信息处理方法,包括循环执行的以下操作,以对特征提取模型进行优化:
获取样本数据,所述样本数据表征目标用户、目标物品及所述目标用户在第一时刻对所述目标物品执行p种预定操作的操作信息;
获取所述目标用户的用户信息及所述目标物品的第一物品信息;
将所述用户信息及所述第一物品信息输入特征提取模型,提取得到特征向量;
采用预测模型处理所述特征向量,得到所述目标用户对所述目标物品执行p种预定操作中每种预定操作的预测置信度;以及
根据所述操作信息及所述预测置信度,优化所述特征提取模型,
其中,所述用户信息和/或所述第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,所述p为大于1的自然数。


2.根据权利要求1所述的方法,其中,所述特征提取模型包括针对所述至少两个类型的信息的至少两个提取子模型,以分别提取得到所述至少两种类型的信息的特征子向量,所述特征向量根据所述至少两种类型的信息的特征子向量得到。


3.根据权利要求2所述的方法,其中:
所述用户信息包括:用户特征信息及在所述第一时刻之前的交互记录信息,所述交互记录信息包括n个预定操作所针对物品的n个第二物品信息及所述n个预定操作所针对的n个第一时间信息;物品信息包括物品特征信息,n为大于1的自然数;
所述提取得到特征向量包括:
将所述第一物品信息包括的第一物品特征信息及所述用户特征信息分别输入第一转换模型,得到针对所述第一物品特征信息的第一特征子向量以及针对所述用户特征信息的第二特征子向量;
将所述n个第二物品信息包括的n个第二物品特征信息及所述n个第一时间信息配对组合,得到n个第一输入信息;以及
根据所述n个第一时间信息表征的n个第二时刻的先后顺序,将所述n个第一输入信息依次输入第一循环神经网络模型,得到第三特征子向量,
其中,所述特征向量根据所述第一特征子向量、所述第二特征子向量以及所述第三特征子向量得到;针对所述特征信息的提取子模型包括所述第一转换模型和所述第一循环神经网络模型。


4.根据权利要求3所述的方法,其中,所述物品信息还包括物品图像信息;所述提取得到特征向量还包括:
将所述n个第二物品信息包括的n个第二物品图像信息依次输入卷积神经网络模型,得到针对所述n个第二物品图像信息的n个第一向量;
将所述n个第一向量及所述n个第一时间信息配对组合,得到n个第二输入信息;
根据所述n个第一时间信息表征的n个第二时刻的先后顺序,将所述n个第二输入信息依次输入第二循环神经网络模型,得到第四特征子向量;以及
将所述第一物品信息包括的第一物品图像信息输入所述卷积神经网络模型中,得到第五特征子向量,
其中,所述特征向量还根据所述第四特征子向量和所述第五特征子向量得到;针对所述图像信息的提取子模型包括所述卷积神经网络模型和所述第二循环神经网络模型。


5.根据权利要求3或4所述的方法,其中,所述用户信息还包括在所述第一时刻之前输入的m个输入文本信息及输入所述m个输入文本信息的m个第二时间信息,所述物品信息还包括物品文本信息;所述提取得到特征向量还包括:
将所述m个输入文本信息依次输入第二转换模型,得到针对所述m个输入文本信息的m个第二向量;
将所述m个第二向量及所述m个第二时间信息配对组合,得到m个第三输入信息;
根据所述m个第二时间信息表征的m个第三时刻的先后顺序,将所述m个第三输入信息依次输入第三循环神经网络模型,得到第六特征子向量;以及
将所述物品文本信息输入所述第二转换模型,得到针对所述物品文本信息的第七特征子向量,
其中,所述特征向量还根据所述第六特征子向量及所述第七特征子向量得到;针对所述文本信息的提取子模型包括所述第二转换模型和所述第三循环神经...

【专利技术属性】
技术研发人员:何天琪程建波彭南博
申请(专利权)人:京东数字科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1