基于多臂老虎机算法的产品个性化组合推荐方法技术

技术编号:32643881 阅读:24 留言:0更新日期:2022-03-12 18:21
本发明专利技术公开了一种基于多臂老虎机算法的产品个性化组合推荐方法,包括以下步骤:1获取店铺所有商品的信息和图像以及当前待推荐用户的人口统计学信息和历史行为记录;2初始化商品和当前待推荐用户的特征表示,形成聚类;3构建待推荐用户与商品之间的关系,形成商品聚类集合,从商品聚类集合中形成商品组,计算对应的预估回报值,选取预估回报值最大的商品组推荐;4待推荐用户在接受到推荐后,做出真实反馈;5基于真实反馈更新预估回报模型和聚类,调整模型参数再次推荐。本发明专利技术能提高推荐多样性和准确性,从而实现个性化的组合推荐。从而实现个性化的组合推荐。从而实现个性化的组合推荐。

【技术实现步骤摘要】
基于多臂老虎机算法的产品个性化组合推荐方法


[0001]本专利技术属于产品推荐领域,具体的说是一种基于多臂老虎机算法的产品个性化组合推荐方法。

技术介绍

[0002]互联网与电子商务的快速发展,使得线上购物平台的用户量和产品量激增,信息过载的情况困扰着用户和购物平台,推荐系统有效的缓解了这一问题。
[0003]但目前的推荐算法在于一味的利用用户历史数据进行推荐,使得用户陷入信息茧房的处境,难以满足推荐多样性,以及难以完成探索用户潜在偏好的任务。如果能平衡用户行为数据的利用和用户潜在偏好的探索,可以使得推荐结果更多样、更合理,避免用户进入信息茧房。
[0004]对于探索与利用,即Exploit

Explore问题,多臂老虎机算法能够在探索和利用之间做平衡。但现有的多臂老虎机往往忽略了上下文信息,并且多数为单一推荐。传统推荐算法中的核心思想是协同过滤,利用相似的商品或相似的用户进行推荐,可以有效解决推荐冷启动问题。如何利用多臂老虎机和协同过滤思想进行组合推荐,也是一大技术问题。

技术实现思路

[0005]针对上述现有技术中存在的诸多问题,本专利技术提出一种基于多臂老虎机算法的产品个性化组合推荐方法,以期能提高推荐多样性和准确性,从而实现个性化的组合推荐。
[0006]本专利技术为解决技术问题采用如下技术方案:
[0007]本专利技术一种基于多臂老虎机算法的产品个性化组合推荐方法的特点在于,包括以下步骤:
[0008]S1、获取当前待推荐用户的基本信息以及历史行为数据,其中,所述历史行为数据包括:浏览时长、点击行为和购买行为数据;获取所有商品的信息,包括:商品标题、类别标签以及商品图像、商品背景图像;
[0009]记任意待推荐用户u∈U,U是所有待推荐用户的集合;记任意商品a∈A,A是所有商品的集合;
[0010]S2、利用卷积神经网络CNN分别对商品、用户进行特征提取,得到所有商品的特征向量和所有待推荐用户的特征向量,其中,商品a的特征向量记为x
a
,待推荐用户u的特征向量记为y
u

[0011]S3、依据所有商品的特征向量对所有商品进行初始化聚类,得到商品聚类的类别集合为A
M
={A1,A2,
···
,A
h
,
···
,A
m
},其中,A
h
表示所述商品聚类集合A
M
中的第h个商品聚类,m表示商品聚类的总数,h=1,2,
···
,m;
[0012]依据所有待推荐用户的特征向量对所有待推荐用户进行初始化聚类,得到待推荐用户聚类的类别集合为U
J
={U1,U2,
···
,U
i
,
···
,U
j
},其中,U
i
表示所述待推荐用户聚类集合U
J
中的第i个待推荐用户聚类,j表示待推荐用户聚类的总数,i=1,2,
···
,j;
[0013]S4、分别获取类别集合中每个聚类的特征向量均值作为对应聚类的特征中心,其中,第h个商品聚类A
h
的特征中心记为K(A
h
),第i个用户聚类U
i
的特征中心记为K(U
i
);
[0014]S5、定义并初始化变量t=1;
[0015]S6、在用户聚类和商品聚类之间建立连接:
[0016]S6.1、获取所有与当前t时刻待推荐用户u
t
的行为数据中商品有关的商品聚类集合,记为u
t
∈U
i
表示t时刻待推荐用户u
t
所在的聚类为第i个待推荐用户聚类U
i
,U
i

A
h
表示第h个商品聚类A
h
和第i个待推荐用户聚类U
i
之间存在的关系,且其中,表示所述商品聚类集合中第d个商品聚类,D表示商品聚类集合内商品聚类的类别总数;d=1,2,
···
,D;h=1,2,
···
,m;
[0017]S6.2、当加入新的商品或新的待推荐用户时,按照其特征向量将其归类至与其距离最近的聚类中,从而更新聚类的类别集合,其中,距离为特征向量与聚类的特征中心的欧氏距离;
[0018]S7、利用卷积神经网络CNN提取t时刻待推荐用户u
t
和t时刻商品聚类集合中第d个商品聚类中商品a
t
的特征向量除t时刻商品a
t
所在聚类外,从商品聚类集合中构建商品组,参数λ用于控制商品组中商品的个数,其中,λ≤m

1,m表示商品聚类的总数,当λ≤D

1,则随机从D

1个聚类中挑选λ个聚类选择商品;当λ>D

1,则从D

1个聚类中分别选择一个商品并从剩余的m

D个聚类中随机挑选λ

D+1个聚类中挑选商品;从而得到t时刻的q个商品组,且每个商品组中包含λ个商品;其中,t时刻的第n个商品组记为
[0019]利用卷积神经网络CNN提取t时刻待推荐用户u
t
分别和第n个商品组中每个商品的特征向量,其中,第c个商品a
c
的特征向量,记为
[0020]S8、利用式(1)计算t时刻商品组中第c个商品a
c
的预估回报
[0021][0022]式(1)中,α表示设定的探索参数,V
t
表示t时刻的特征矩阵,表示t时刻的中间参量,并有:
[0023][0024][0025]式(2)中,V
t
‑1表示t

1时刻的特征矩阵,并初始化V0为单位矩阵,b
t
‑1表示t

1时刻的特征偏置,并初始化b0为零向量;
[0026]S9、利用式(1)计算t时刻商品组中所有商品的预估回报并相加后得到t时刻商品组的预估回报从而得到t时刻q个商品组的预估回报,并选择预估回报最高的商品组推荐给t时刻待推荐用户u
t

[0027]S10、根据t时刻待推荐用户u
t
对预估回报最高的商品组中每个商品的反馈情
况,得到t时刻待推荐用户u
t
对商品组中任意第z个商品a
z
的真实奖励值且其中,为待推荐用户t时刻对商品a
z
的点击反馈,β1为点击反馈的权重;同理,为待推荐用户t时刻对商品a
z
的购买反馈,β2为购买反馈的权重;为待推荐用户t时刻对商品a
z
的注视时间反馈,β3为注视时间反馈的权本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多臂老虎机算法的产品个性化组合推荐方法,其特征在于,包括以下步骤:S1、获取当前待推荐用户的基本信息以及历史行为数据,其中,所述历史行为数据包括:浏览时长、点击行为和购买行为数据;获取所有商品的信息,包括:商品标题、类别标签以及商品图像、商品背景图像;记任意待推荐用户u∈U,U是所有待推荐用户的集合;记任意商品a∈A,A是所有商品的集合;S2、利用卷积神经网络CNN分别对商品、用户进行特征提取,得到所有商品的特征向量和所有待推荐用户的特征向量,其中,商品a的特征向量记为x
a
,待推荐用户u的特征向量记为y
u
;S3、依据所有商品的特征向量对所有商品进行初始化聚类,得到商品聚类的类别集合为A
M
={A1,A2,
···
,A
h
,
···
,A
m
},其中,A
h
表示所述商品聚类集合A
M
中的第h个商品聚类,m表示商品聚类的总数,h=1,2,
···
,m;依据所有待推荐用户的特征向量对所有待推荐用户进行初始化聚类,得到待推荐用户聚类的类别集合为U
J
={U1,U2,
···
,U
i
,
···
,U
j
},其中,U
i
表示所述待推荐用户聚类集合U
J
中的第i个待推荐用户聚类,j表示待推荐用户聚类的总数,i=1,2,
···
,j;S4、分别获取类别集合中每个聚类的特征向量均值作为对应聚类的特征中心,其中,第h个商品聚类A
h
的特征中心记为K(A
h
),第i个用户聚类U
i
的特征中心记为K(U
i
);S5、定义并初始化变量t=1;S6、在用户聚类和商品聚类之间建立连接:S6.1、获取所有与当前t时刻待推荐用户u
t
的行为数据中商品有关的商品聚类集合,记为I
ut
={A
h
|U
i

A
h
,u
t
∈U
i
},u
t
∈U
i
表示t时刻待推荐用户u
t
所在的聚类为第i个待推荐用户聚类U
i
,U
i

A
h
表示第h个商品聚类A
h
和第i个待推荐用户聚类U
i
之间存在的关系,且其中,表示所述商品聚类集合中第d个商品聚类,D表示商品聚类集合内商品聚类的类别总数;d=1,2,
···
,D;h=1,2,
···
,m;S6.2、当加入新的商品或新的待推荐用户时,按照其特征向量将其归类至与其距离最近的聚类中,从而更新聚类的类别集合,其中,距离为特征向量与聚类的特征中心的欧氏距离;S7、利用卷积神经网络CNN提取t时刻待推荐用户u
t
和t时刻商品聚类集合中第d个商品聚类中商品a
t
的特征向量除t时刻商品a<...

【专利技术属性】
技术研发人员:孙春华李鹏振孔梦刘业政姜元春孙见山
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1