本发明专利技术属于计算机技术领域,提供了一种商品推荐策略确定方法、装置、计算机设备及存储介质,其中商品推荐策略确定方法包括:确定多个优选离线商品推荐策略;对所述多个优选离线商品推荐策略进行处理确定优选在线商品推荐策略;对所述优选在线商品推荐策略进行优化生成最优在线商品推荐策略。本发明专利技术实施例提供的商品推荐策略确定方法通过预先确定出多个优选离线商品推荐策略,并进一步在线上实时对已知的优选离线商品推荐策略进行处理,一方面离线商品推荐策略的确定不会占用线上优化时间,另一方面显著降低线上处理时长,从而有效提高了商品推荐服务的时效性,同时配合后续的对商品推荐策略进行进一步优化,有效提高商品推荐服务的推荐效果。
【技术实现步骤摘要】
商品推荐策略确定方法、装置、计算机设备及存储介质
本专利技术属于计算机
,尤其涉及一种商品推荐策略确定方法、装置、计算机设备及存储介质。
技术介绍
商品推荐服务能够根据商品特征和用户特性信息推荐多个商品。一般来说,线下的商品推荐策略通常都不能直接促进线上推荐的实际效果的提升,所以通常都需要利用线上的实时计算算法对商品推荐策略进行优化,以提高用户点击率。然而,目前利用线上的实时计算算法对商品推荐策略进行优化往往需要花费大量的优化时间,而考虑到商品推荐服务的时效性,长时间的线上优化过程会影响到用户的商品推荐服务体验,而短时间的线上优化过程则往往起不到较好的策略优化效果,这同样也会影响到用户的商品推荐服务体验。可见,现有的优化商品推荐策略过程中还存在着难以同时兼顾时效性和优化效果的技术问题,影响用户的商品推荐服务体验。
技术实现思路
本专利技术实施例的目的在于提供一种商品推荐策略确定方法、装置、计算机设备及存储介质,旨在解决现有的优化商品推荐策略过程中还存在的难以同时兼顾时效性和优化效果的技术问题,影响用户的商品推荐服务体验。本专利技术实施例是这样实现的,一种商品推荐策略确定方法,包括:确定多个优选离线商品推荐策略;根据多臂赌博算法对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略;根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。本专利技术实施例的另一目的在于提供一种商品推荐策略确定装置,包括:<br>优选离线商品推荐策略确定模块,用于确定多个优选离线商品推荐策略;优选在线商品推荐策略确定模块,用于根据预设的基于多臂赌博算法建立的商品推荐模型对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略;在线商品推荐策略优化模块,用于基于零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。本专利技术实施例的另一目的在于提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述所述商品推荐策略确定方法的步骤。专利技术实施例的另一目的在于提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述所述商品推荐策略确定方法的步骤。本专利技术实施例提供的一种商品推荐策略确定方法中,通过预先确定出多个优选离线商品推荐策略,配合后续的多臂赌博算法能够在线上实时对已知的多个优选离线商品推荐策略进行处理,一方面离线商品推荐策略的确定不会占用线上优化时间,另一方面由于已经预先确定出候选商品推荐策略集合,使得多臂赌博算法的线上处理时长显著降低,即降低了商品推荐策略的线上优化时间,有效提高了商品推荐服务的时效性,同时配合后续的零阶优化算法对商品推荐策略进行进一步优化,弥补了多臂赌博算法因线上优化时间较短而导致的容易陷入局部最优化的问题,有效提高商品推荐服务的推荐效果。附图说明图1为本专利技术实施例提供的一种商品推荐策略确定方法的步骤流程图;图2为本专利技术实施例提供的另一种商品推荐策略确定方法的步骤流程图;图3为本专利技术实施例提供的又一种商品推荐策略确定方法的步骤流程图;图4为本专利技术实施例提供的一种确定优选离线商品推荐策略的步骤流程图;图5为本专利技术实施例提供的一种从多个优选离线商品推荐策略中确定优选在线商品推荐策略的步骤流程图;图6为本专利技术实施例提供的一种基于收益期望与实际在线收益确定优选在线商品推荐策略的步骤流程图;图7为本专利技术实施例提供的一种生成最优在线商品推荐策略的步骤流程图;图8为本专利技术实施例提供的一种商品推荐策略确定装置的结构示意图;图9为本专利技术实施例提供的一种可用于执行商品推荐策略确定方法的计算机设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,为本专利技术实施例提供的一种商品推荐策略确定方法的步骤流程图,具体包括以下步骤:步骤S102,确定多个优选离线商品推荐策略。在本专利技术实施例中,所述多个优选离线商品推荐策略是预先在离线状态下所确定的商品推荐策略,具体是预先通过用户特征以及商品特征等大数据所确定的商品推荐策略。然而考虑到线上商品推荐策略所用到的日常流量的数据特征和在离线状态下确定商品推荐策略所用到的高并发、超大数据量的数据特征是不同的,因此,在离线状态下确定的具有较好推荐效果的离线商品推荐策略实际运用在线上进行商品推荐时,往往不会取得较好的推荐效果,通常需要进行进一步的优化处理。在本专利技术实施例中,其中确定多个优选离线商品推荐策略具体请参阅图4及其解释说明的内容。步骤S104,根据多臂赌博算法对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略。在本专利技术实施例中,多臂赌博算法是一种基于线上实时收益计算与预期收益不断更新在线商品推荐策略的一类算法,具体可以参阅图5及其解释说明部分。在商品推荐领域,收益可以简单理解为用户点击了商品推荐,商品推荐策略的收益属于本领域技术人员所能晓得的常规技术手段,在此不再赘述。具体的,对于每个商品推荐策略都可以预先计算出预期收益,然后进行若干轮的线上测试,并根据用户的商品推荐点击信息确定每个商品推荐策略下的实时收益,其中,预期收益和实时收益差距越小表明商品推荐策略的效果越好,通过上述算法能够快速筛选出推荐效果较佳的在线商品推荐策略。步骤S106,根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。在本专利技术实施例中,多臂赌博算法仅仅只是对多个优选离线商品推荐策略进行多轮线上测试,并筛选出其中在线推荐效果最佳的商品推荐策略。其中,多臂赌博算法的处理量越多也就是优选离线商品推荐策略越多、线上测试的轮数越多,则筛选出的商品推荐策略的推荐效果也越理想,但会导致线上优化时间变长,考虑到线上商品推荐服务的时效性,需要降低多臂赌博算法的处理量,因此在一定程度会影响到多臂赌博算法所筛选出的商品推荐策略的推荐效果,此时确定的优选在线商品推荐策略并非是全局意义上最优的在线商品推荐策略,而进一步配合零阶优化算法,能够对筛选出的商品推荐策略快速进行优化,从而在保证商品推荐服务的时效性基础上,进一步提高了商品推荐服务的效果,从而提高用户的商品推荐服务体验。本专利技术实施例提供的一种商品推荐策略确定方法中,通过预先确定出多个优选离线商品推荐策略,配合后续的多臂赌博算法能够在线上实时对已知的多个优选离线商品推荐策略进行处理,一方面离线商品推荐策略的确定不会占用线上优化时间,另一方面由于已经预先确定出候选商品推荐策略集合,使得多臂赌博算法的线上处理时长显著降低,即降低了商品推荐策略的线上优化时间,有效提高了商品推本文档来自技高网...
【技术保护点】
1.一种商品推荐策略确定方法,其特征在于,包括:/n确定多个优选离线商品推荐策略;/n根据多臂赌博算法对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略;/n根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。/n
【技术特征摘要】
1.一种商品推荐策略确定方法,其特征在于,包括:
确定多个优选离线商品推荐策略;
根据多臂赌博算法对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略;
根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。
2.根据权利要求1所述的一种商品推荐策略确定方法,其特征在于,在所述生成最优在线商品推荐策略的步骤之后,还包括:
根据所述最优在线商品推荐策略进行在线商品推荐。
3.根据权利要求1所述的一种商品推荐策略确定方法,其特征在于,在所述确定优选在线商品推荐策略的步骤之后,还包括:
判断所述优选在线商品推荐策略是否满足预设的优化条件;
所述根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略的步骤,具体包括:
当判断所述优选在线商品推荐策略不满足预设的优化条件时,根据零阶优化算法对所述优选在线商品推荐策略进行优化,生成最优在线商品推荐策略。
4.根据权利要求1所述的一种商品推荐策略确定方法,其特征在于,所述确定多个优选离线商品推荐策略的步骤,具体包括:
获取用户的特征信息以及商品的特征信息;
根据所述用户的特征信息以及商品的特征信息确定多个优选离线商品推荐策略。
5.根据权利要求1所述的一种商品推荐策略确定方法,其特征在于,所述根据多臂赌博算法对所述多个优选离线商品推荐策略进行处理,并确定优选在线商品推荐策略的步骤,具体包括:
根据预设的收益期望计算规则计算所述多个优选离线商品推荐策略的多轮收益期望;
根据所述多个优选离线商品推荐策略进行多轮在线商品推荐,并分别确定所述多个优选离线商品推荐策略的多轮实际在线收益;
根据所述多个优选离线商品推荐策略的多轮收益期望以及所述多个优选离线商品推荐策略的多轮实际在线收益确定优选在线商品推荐策略。
6.根据权利要求5所述的一种商品推荐策略确定方法,其特征在于,所述根据所述多个优...
【专利技术属性】
技术研发人员:曾峰,黎阳,
申请(专利权)人:深圳市物语智联科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。