一种基于改进型关联规则的直播间推荐方法及系统技术方案

技术编号:15522746 阅读:73 留言:0更新日期:2017-06-04 11:41
本发明专利技术公开了一种基于改进型关联规则的直播间推荐方法及系统,涉及互联网视频的直播推荐技术领域。该方法包括:获取指定时间段内所有用户的观看历史信息;设定最小支持度阈值和置信度阈值;以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。本发明专利技术不但能考虑到用户个性化的需求,利用关联规则挖掘出隐藏在用户行为中的隐蔽特征;而且能避免生成无效的规则,提高了推荐的有效性、可靠性,用户体验佳。

A method and system for recommending live broadcast based on Improved Association Rules

The invention discloses a method and a system for recommending a live broadcast based on an improved association rule, which relates to the live recommendation technology field of the Internet video. The method comprises: acquiring all users within a specified period of time viewing history information; set the minimum support and confidence threshold threshold; in the viewing history information based on Apriori algorithm to generate some meet the minimum support threshold and confidence threshold according to association rules; some association rules generated in watch correlation < association rules 1 delete, screened all valid rules; when the user enters the live site, with all the effective rules of the current on the basis of referring users to live. The invention can not only take into account the needs of individual users, the use of mining association rules hidden in the user behavior of the hidden features; and can avoid generating invalid rules, improve the efficiency and reliability of the user experience.

【技术实现步骤摘要】
一种基于改进型关联规则的直播间推荐方法及系统
本专利技术涉及互联网视频的直播推荐
,具体来讲是一种基于改进型关联规则的直播间推荐方法及系统。
技术介绍
随着智能终端的多屏化发展,人们对“即时”与“互动”的需求越来越高。中国社交视频的直播社区的活跃用户正在不断发展壮大中。巨大的市场同时也面临着激烈的同行竞争,如何发掘用户兴趣点、给用户精准推荐直播间来提高用户粘性、促进用户的付费转化,将是直播行业很长一段时间将要面临的一道难题。目前,各大网站在进行直播间的推荐时,普遍采用的是一种热播榜TOPN的推荐方式,也就是推荐直播网站里一段时间内最火的N位主播。这种方法的缺点是没有考虑到观众的个性化需求,TOPN对新用户往往是有效的,而对于老观众而言,他们开始有自己的偏好来挑选直播间,TOPN对其可能就没多大吸引力了。为了解决上述问题,现有技术中提出了一种基于关联规则的直播间推荐方式。该方式是通过筛选在用户的观看历史记录中,频繁同时出现的直播间,将其作为关联直播间进行推荐。例如,用户A看了直播间M、N、O、P;用户B看了直播间M、N、O;用户C看了M、N直播间。不难发现,在A,B,C用户中,都观看了M,N直播间,如果M和N在用户观看数据中频繁的一起出现,那么对于观看了M直播间的用户,可以给他推荐N直播间,即房间N与房间M相关联,M=>N。关联规则在直播推荐场景的定义为:假设集合I={I1,I2,···,In}是用户(用户ID)对某一个有观看的直播间(直播间ID)的键值对(用户ID:直播间ID)的集合。给定一个用户观看直播间记录的数据库D,D中每个事务(事务即用户观看直播间的记录,例如用户A看了n,m,k三个直播间,即事务(n,m,k)是I的非空子集)。另外,关联规则在D中的支持度(support)表示D中事务同时包含X、Y的概率;而置信度(confidence)表示D中事务在已经包含X的情况下,包含Y的百分比,即条件概率。例如:X、Y同时被观看即(X,Y)事务发生了100次,这样的情况下(X,Y,Z)发生了50次,那么,(X,Y,Z)的置信度就是50/100=0.5。现有的关联规则推荐方式中,基础算法多采用Apriori算法,在该算法中,一旦认为满足最小支持度阈值和最小置信度阈值,则认为该关联规则是效的。但是,实际操作中,Apriori算法难免会出现生成无效的规则的情况。例如,在直播间推荐场景中,A、B直播间很火,现在有1000条用户观看直播记录,其中有750个用户观看了A直播间,600个用户观看了B直播间,其中有400用户同时观看了A、B直播间。假设现在支持度阈值定为0.3,置信度为0.5,显然在Apriori算法中,规则A=>B被认为是一条有效规则。但是这里面存在一个问题:用户看A直播间的概率为750/1000=0.75,看B直播间的概率为600/1000=0.6,看了A还会看B的概率P(A=>B)=(400/1000)/0.75=0.53。显然单独观看B的概率为0.6,在看了A的情况下再看B的概率只有0.53,比单独看B的概率还要低,这样看来规则A=>B并不是一个有效规则。因此,为了避免生成无效的关联规则,提高直播间推荐的有效性和可靠性,本领域技术人员亟需对传统的关联规则做出改进,提出一种更好的基于关联规则的直播间推荐方案。
技术实现思路
本专利技术的目的是为了克服上述
技术介绍
的不足,提供一种基于改进型关联规则的直播间推荐方法及系统,不但能考虑到用户个性化的需求,利用关联规则挖掘出隐藏在用户行为中的隐蔽特征;而且能避免生成无效的规则,提高了推荐的有效性、可靠性,用户体验佳。为达到以上目的,本专利技术提供一种基于改进型关联规则的直播间推荐方法,包括以下步骤:A、获取指定时间段内所有用户的观看历史信息;B、设定最小支持度阈值和置信度阈值;C、以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;D、当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。本专利技术同时还提供一种基于改进型关联规则的直播间推荐系统,该系统包括观看历史信息获取模块、阈值设置模块、有效规则生成模块和直播间推荐模块。所述观看历史信息获取模块用于:获取指定时间段内所有用户的观看历史信息;所述阈值设置模块用于:设定最小支持度阈值和置信度阈值;所述有效规则生成模块用于:以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则,将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;所述直播间推荐模块用于:当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。本专利技术的有益效果在于:(1)与现有的热播榜TOPN的推荐方式相比,本专利技术能考虑到用户个性化的需求,利用关联规则挖掘出隐藏在用户行为中的隐蔽特征(例如:看了A、B直播间,就有很大可能会看C直播间的房间关联性特征),通过该隐蔽特征从而为用户推荐符合其观看习惯及个人喜好的直播间,满足了用户的个性化需求,用户体验佳。(2)本专利技术相较于传统的关联规则做出了改进,在原有的Apriori算法基础上,增加了观看相关度的判断,从而有效避免生成无效的关联规则,进而提高了直播间推荐的有效性、可靠性。并且,随着行为数据越丰富,该效果越明显,房间推荐质量高。附图说明图1为本专利技术实施例中基于改进型关联规则的直播间推荐方法的流程图;图2为本专利技术实施例中基于改进型关联规则的直播间推荐系统的结构框图。具体实施方式下面结合附图及具体实施例对本专利技术作进一步的详细描述。参见图1所示,本专利技术实施例提供一种基于改进型关联规则的直播间推荐方法,包括以下步骤:步骤S1、获取观看历史信息:获取指定时间段内所有用户的观看历史信息,该观看历史信息包括用户唯一标识UID以及该用户对应的观看过的直播间唯一标识ROOM_ID。可以理解的是,实际操作时,所述指定时间段可根据实际需要进行自行设置。本实施例中,获取的是近一个月内的所有用户的观看历史信息。步骤S2、信息清理及阈值设置:将所述观看历史信息中UID或ROOM_ID为空的数据删除;并设定最小支持度阈值和置信度阈值。可以理解的是,实际操作时,该最小支持度阈值和置信度阈值可根据实际需要进行自行设置。一般来说,最小支持度阈值可设置为0.01~0.5范围内;置信度阈值可设置为0.5~1范围内。本实施例中,优选最小支持度阈值为0.01;置信度阈值为0.5。步骤S3、关联规则的生成:以N为2阶开始,从当前的观看历史信息中挑选出N-1个观看过的且满足最小支持度阈值的直播间,记为(room_id1,room_id2,···,room_idN-1),即生成频繁N项集;以挑选出的直播间为基础,按照Apriori算法生成若干满足置信度阈值的关联规则,记为(room_id1,room_id2,···room_idN-1)=>room_idM,其中room_idM为推荐的直播间,即为关联的直播间。步骤S4、有效规则的筛选:将生成的若干关联规则中观看相关度<1的关联规则删除,并将筛选出本文档来自技高网
...
一种基于改进型关联规则的直播间推荐方法及系统

【技术保护点】
一种基于改进型关联规则的直播间推荐方法,其特征在于,该方法包括以下步骤:A、获取指定时间段内所有用户的观看历史信息;B、设定最小支持度阈值和置信度阈值;C、以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;D、当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。

【技术特征摘要】
1.一种基于改进型关联规则的直播间推荐方法,其特征在于,该方法包括以下步骤:A、获取指定时间段内所有用户的观看历史信息;B、设定最小支持度阈值和置信度阈值;C、以所述观看历史信息为基础,按照Apriori算法生成若干满足最小支持度阈值和置信度阈值的关联规则;将生成的若干关联规则中观看相关度<1的关联规则删除,筛选出所有有效规则;D、当用户进入直播网站时,以当前的所有有效规则为依据,向用户推荐直播间。2.如权利要求1所述的基于改进型关联规则的直播间推荐方法,其特征在于:步骤A中,所述观看历史信息包括用户唯一标识以及该用户对应的观看过的直播间唯一标识;在此基础上,步骤B中还包括以下操作:将所述观看历史信息中用户唯一标识或直播间唯一标识为空的数据删除。3.如权利要求1所述的基于改进型关联规则的直播间推荐方法,其特征在于,步骤C具体包括以下操作:C1:以N为2阶开始,从当前的观看历史信息中挑选出N-1个观看过的且满足最小支持度阈值的直播间;以挑选出的直播间为基础,按照Apriori算法生成若干满足置信度阈值的关联规则;C2:将生成的若干关联规则中观看相关度<1的关联规则删除,并将筛选出的关联规则作为有效规则;C3:重复步骤C1~C2,依次生成更高一阶的有效规则,直到没有新的有效规则产生为止。4.如权利要求1至3中任一项所述的基于改进型关联规则的直播间推荐方法,其特征在于:步骤C中,所述观看相关度的计算公式为:rel=P(AB)/P(A)/P(B),其中,rel表示观看相关度,P(AB)表示A、B同时发生的概率,P(A)表示A发生的概率,P(B)表示B发生的概率。5.如权利要求1至3中任一项所述的基于改进型关联规则的直播间推荐方法,其特征在于:步骤D中,向用户推荐直播间时,是以当前生成的所有有效规则为依据,按照优先推荐置信度高的直播间的原则,向用户推荐直播间。6.一种基于改进型关联规则的直播间推荐系统,其特征在于:该系统包括观看历史信息...

【专利技术属性】
技术研发人员:龚灿
申请(专利权)人:武汉斗鱼网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1