【技术实现步骤摘要】
信息处理方法、装置、电子设备及介质
本公开涉及计算机
,更具体地,涉及一种信息处理方法、装置、电子设备及介质。
技术介绍
近年来,随着电子商务的迅速发展和用户交互信息的爆炸式增长,从多类型、多维度的信息中提取用户特征成为影响推荐系统效果的重要因素。在实现本公开构思的过程中,专利技术人发现现有技术中至少存在以下问题:现有的特征提取方法包括基于传统机器学习算法进行提取和基于时间序列深度学习算法进行提取。其中,基于传统机器学习算法进行提取(如协同过滤)仅能利用用户的交互信息,无法处理文本和图像等非结构化信息,从而存在大量数据浪费,特征提取效果较差的缺陷。基于时间序列深度学习算法需要人为在时间维度进行特征处理,处理方式相对固定,需要非常强的专家先验知识,并不能很好的处理时间序列类特征。
技术实现思路
有鉴于此,本公开提供了一种能够融合多种不同类型数据进行特征提取的信息处理方法、装置、电子设备及介质。本公开的一个方面提供了一种信息处理方法,包括:获取样本数据,该样本数据表征目标用户、目标物品及目标用户在第一时刻对目标物品执行p种预定操作的操作信息;获取目标用户的用户信息及目标物品的第一物品信息;将用户信息及第一物品信息输入特征提取模型,提取得到特征向量;采用预测模型处理特征向量,得到目标用户对目标物品执行p种预定操作中每种预定操作的预测置信度;以及根据操作信息及预测置信度,优化特征提取模型,其中,用户信息和/或第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文 ...
【技术保护点】
1.一种信息处理方法,包括循环执行的以下操作,以对特征提取模型进行优化:/n获取样本数据,所述样本数据表征目标用户、目标物品及所述目标用户在第一时刻对所述目标物品执行p种预定操作的操作信息;/n获取所述目标用户的用户信息及所述目标物品的第一物品信息;/n将所述用户信息及所述第一物品信息输入特征提取模型,提取得到特征向量;/n采用预测模型处理所述特征向量,得到所述目标用户对所述目标物品执行p种预定操作中每种预定操作的预测置信度;以及/n根据所述操作信息及所述预测置信度,优化所述特征提取模型,/n其中,所述用户信息和/或所述第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,所述p为大于1的自然数。/n
【技术特征摘要】
1.一种信息处理方法,包括循环执行的以下操作,以对特征提取模型进行优化:
获取样本数据,所述样本数据表征目标用户、目标物品及所述目标用户在第一时刻对所述目标物品执行p种预定操作的操作信息;
获取所述目标用户的用户信息及所述目标物品的第一物品信息;
将所述用户信息及所述第一物品信息输入特征提取模型,提取得到特征向量;
采用预测模型处理所述特征向量,得到所述目标用户对所述目标物品执行p种预定操作中每种预定操作的预测置信度;以及
根据所述操作信息及所述预测置信度,优化所述特征提取模型,
其中,所述用户信息和/或所述第一物品信息包括以下至少两种类型的信息:特征信息、交互记录信息、图像信息和文本信息,所述p为大于1的自然数。
2.根据权利要求1所述的方法,其中,所述特征提取模型包括针对所述至少两个类型的信息的至少两个提取子模型,以分别提取得到所述至少两种类型的信息的特征子向量,所述特征向量根据所述至少两种类型的信息的特征子向量得到。
3.根据权利要求2所述的方法,其中:
所述用户信息包括:用户特征信息及在所述第一时刻之前的交互记录信息,所述交互记录信息包括n个预定操作所针对物品的n个第二物品信息及所述n个预定操作所针对的n个第一时间信息;物品信息包括物品特征信息,n为大于1的自然数;
所述提取得到特征向量包括:
将所述第一物品信息包括的第一物品特征信息及所述用户特征信息分别输入第一转换模型,得到针对所述第一物品特征信息的第一特征子向量以及针对所述用户特征信息的第二特征子向量;
将所述n个第二物品信息包括的n个第二物品特征信息及所述n个第一时间信息配对组合,得到n个第一输入信息;以及
根据所述n个第一时间信息表征的n个第二时刻的先后顺序,将所述n个第一输入信息依次输入第一循环神经网络模型,得到第三特征子向量,
其中,所述特征向量根据所述第一特征子向量、所述第二特征子向量以及所述第三特征子向量得到;针对所述特征信息的提取子模型包括所述第一转换模型和所述第一循环神经网络模型。
4.根据权利要求3所述的方法,其中,所述物品信息还包括物品图像信息;所述提取得到特征向量还包括:
将所述n个第二物品信息包括的n个第二物品图像信息依次输入卷积神经网络模型,得到针对所述n个第二物品图像信息的n个第一向量;
将所述n个第一向量及所述n个第一时间信息配对组合,得到n个第二输入信息;
根据所述n个第一时间信息表征的n个第二时刻的先后顺序,将所述n个第二输入信息依次输入第二循环神经网络模型,得到第四特征子向量;以及
将所述第一物品信息包括的第一物品图像信息输入所述卷积神经网络模型中,得到第五特征子向量,
其中,所述特征向量还根据所述第四特征子向量和所述第五特征子向量得到;针对所述图像信息的提取子模型包括所述卷积神经网络模型和所述第二循环神经网络模型。
5.根据权利要求3或4所述的方法,其中,所述用户信息还包括在所述第一时刻之前输入的m个输入文本信息及输入所述m个输入文本信息的m个第二时间信息,所述物品信息还包括物品文本信息;所述提取得到特征向量还包括:
将所述m个输入文本信息依次输入第二转换模型,得到针对所述m个输入文本信息的m个第二向量;
将所述m个第二向量及所述m个第二时间信息配对组合,得到m个第三输入信息;
根据所述m个第二时间信息表征的m个第三时刻的先后顺序,将所述m个第三输入信息依次输入第三循环神经网络模型,得到第六特征子向量;以及
将所述物品文本信息输入所述第二转换模型,得到针对所述物品文本信息的第七特征子向量,
其中,所述特征向量还根据所述第六特征子向量及所述第七特征子向量得到;针对所述文本信息的提取子模型包括所述第二转换模型和所述第三循环神经...
【专利技术属性】
技术研发人员:何天琪,程建波,彭南博,
申请(专利权)人:京东数字科技控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。