一种节目推荐方法技术

技术编号:8415193 阅读:192 留言:0更新日期:2013-03-14 23:19
本发明专利技术涉及一种节目推荐方法,其包括:步骤一,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目。本发明专利技术的节目推荐方法通过提取节目的多个属性,从各个节目所包含的各个属性被观看的次数来确定此节目的推荐概率和不推荐概率,推荐的准确率明显提高。

【技术实现步骤摘要】
一种节目推荐方法
本专利技术涉及一种节目推荐方法。
技术介绍
在日常生活中,个人行为习惯的个性化是普遍存在的。例如:读什么样的新闻、平时喜欢上那些网站、喜欢用那个博客、喜欢关注那些微博等都是个人行为习惯的体现。随着网络的不断发展,在线群体人数的增多、信息量的扩大,为了更好地针对不同用户提供更好的用户体验,依据用户信息为用户提供“量身定制”的节目推荐变得至关重要。然而,现有的技术为各个用户推荐节目仅仅是从用户喜爱的节目类型角度进行推荐,给用户推荐同类型的节目,比如某个用户喜爱看武打,就给该用户推荐各个武打剧,实际上,并非所有的武打剧用户都喜爱,所以存在推荐的准确率低的问题。
技术实现思路
本专利技术实施例的目的在于提供一种节目推荐方法,旨在解决现有技术推荐的准确率低的技术问题。本专利技术实施例是这样实现的,一种节目推荐方法,所述方法包括:步骤一,提取每个节目的或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目,推荐给相应的用户。相较于现有技术,本专利技术的节目推荐方法通过提取节目的多个属性或/和人工标签,从各个节目所包含的各个属性或/和人工标签被观看的次数来确定此节目的推荐概率和不推荐概率,然后将推荐概率大于不推荐概率的节目推荐给用户,推荐的准确率明显提高,而且从人工标签中也很容易发现用户的观看趋势变化。附图说明图1是本专利技术提供的节目推荐方法较佳实施例的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。如图1所示为本专利技术提供的节目推荐方法较佳实施例的流程图,为了便于说明,仅示出了与本专利技术实施例相关的部分。步骤S101,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表。在本专利技术实施例中,首先提取每一个节目的所有属性或/和人工标签,所述属性包括多种:如节目的性质(如影视剧、娱乐节目、新闻等)、节目的内容(如歌曲、自然、言情、动作、风景、科技等)、节目的演职人员(如成龙、李连杰等)、节目的播放形式(如周播、日播等),所述人工标签为人工添加的分类,如淘宝体、宅男、腐女等,每个节目包括若干属性或/和人工标签。为了便于理解,下面的表1即为一个示例性的初始标记点表。a1言情a2西部牛仔a3自然a4摄影爱好者a5军事a6成龙a7动作a8运动a9职业a10动物a11风景a12科技表1步骤S102,对初始标记点表中的标记点进行筛选,利用筛选出的标记点建立一个更新标记点表。对初始标记点表中的标记点进行筛选的方法如下:由所有用户观看初始标记表中的各个标记点的次数除以所有用户观看所有节目的总次数,分别计算出各个标记点的支持度。将各个标记点的支持度与预设值或预设范围相比较,筛选出标记点的支持度大于预设值,或标记点的支持度在预设范围内的若干标记点,并由这些标记点建立一更新标记点表。若用下述公式计算标记点支持度,则:di=niN其中,di表示标记点支持度,ni为所有用户在一段时期内(如3个月等)观看该标记点的次数,N为所有用户在上述一段时期内(如3个月等)观看所有节目的总次数。对于从众人群(即大众化的人群)而言,只要标记点的支持度大于预设值,则表示包括该标记点的节目为大多数人都观看,则该标记点被列入更新标记点表。预设值由从众人群比例(即观看节目的从众人员比例),经验系数、初始标记点表中的标记点的个数来确定。预设值的公式如下:T=(N×p×e)/(Na×N)=(p×e)Na,其中,T表示预设值,p表示从众人群比例,取值可以为0.73,e表示经验系数,N表示上述一段时期内所有用户观看所有节目的总次数,Na表示初始标记点表中的标记点的个数。e∈(0,1],优选0.2~0.3之间。经验系数的值越大,筛选出的标记点个数越多,经验系数的值越小,筛选出的标记点个数越少。对于非从众人群(即非大众化的人群,比较特别的群体)而言,从支持度较低的区间选取一个适当的预设范围,支持度在该预设范围内的标记点也列入更新标记点表中。预设范围由非从众人群比例、最大经验系数、最小经验系数及初始标记点表中的标记点的个数确定。预设范围的计算公式如下:T'Min=((1-p)×eMin)/Na,T'Max=((1-p)×eMax)/Na,其中,T’Min表示预设范围的最小值,T’Max表示预设范围的最大值,(1-p)表示非从众人群比例,经统计调查,取值可以为0.27,eMin∈[0.1,1)表示最小经验系数,eMax∈(eMin,1]表示最大经验系数,Na表示初始标记点表中的标记点的个数。针对非从众人群,eMin优选取0.1,eMax优选取0.2。为了便于理解,下面的表2即为一个示例性的更新标记点表。b1言情b2军事b3成龙b4运动b5动作b6科技表2步骤S103,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,计算每个节目的推荐概率和不推荐概率。具体为,通过跟踪所有用户一段时间内观看节目的信息,根据每个用户观看更新标记表中的各个标记点的次数及每个用户观看所有节目的总次数,确定给每个用户推荐每个标记点的推荐概率和不给每个用户推荐每个标记点的不推荐概率。然后,针对每个用户,将各个节目所包括的各个标记点的推荐概率加一个权值计算出总和作为各个筛选后节目的推荐概率;将各个节目所包括的各个标记点的不推荐概率加一个权值计算出总和作为各个节目的不推荐概率。下面以用户u进行说明:根据用户u观看标记点bi的次数计算出给用户u推荐标记点bi的推荐概率的公式如下:其中,表示用户u观看标记点bi的次数,Su表示用户u观看节目的总次数,表示用户u观看标记点bi的概率,表示给用户u推荐标记点bi的概率,表示不给用户u推荐标记点bi的概率。计算给用户u推荐节目I的概率和不给用户u推荐某节目I的概率的公式如下:其中,表示用户u观看标记点bi的次数,表示用户u观看节目I所包括的所有标记点的总次数,例如,节目I包括了三个标记点:b1、b2和b4。用户u观看标记点b1的次数为3、观看标记点b2的次数为4、观看标记点b4的次数为5,则表示给用户u推荐标记点bi的推荐概率的权值,表示给用户u推荐节目I的推荐概率,表示不给用户u推荐节目I的不推荐概率。在步骤S103中,为了更好地获知用户观看各标记点的情况,还可将每一天分为几个时段,统计每个用户在每一天的每个时段观看的各个标记点bi的次数,针对每个时段分别计算各个节目的推荐概率和不推荐概率,如此做法,可以进一步提高推荐的准确率。其中,时段由开发人员预先定义,可以是“等时长的时段”或者“非等时长的时段”,例如早上和下午每两个小时为一个时段,晚上每一个小时为一个时段。步骤S104,筛选出推荐概率大于不推荐概率的节目,并将节目按照推荐概率从高到低的顺序推荐给相应用户。具体为,如果给用户u推荐节目I的推荐概率>不给用户u推荐节目I的不推荐概率则给用户本文档来自技高网...
一种节目推荐方法

【技术保护点】
一种节目推荐方法,其特征在于,所述方法包括:步骤一,提取每个节目的或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目,推荐给相应的用户。

【技术特征摘要】
1.一种节目推荐方法,其特征在于,所述方法包括:步骤一,提取每个节目的多个属性或/和人工标签,将多个属性或/和人工标签对应设为多个标记点,并建立初始标记点表;对初始标记点表中的标记点进行筛选,利用筛选出的标记点建立一个更新标记点表;步骤二,分别针对每个用户综合每个节目包括的各个标记点被观看的次数,确定每个节目的推荐概率和不推荐概率;步骤三,筛选出推荐概率大于不推荐概率的节目,推荐给相应的用户;所述对初始标记点表中的标记点进行筛选包括:由所有用户观看初始标记表中的各个标记点的次数除以所有用户观看所有节目的总次数,分别计算出各个标记点的支持度,所述标记点的支持度的计算公式如下:di=ni/N,其中,di表示标记点支持度,ni为所有用户在一段时期内观看该标记点的次数,N为所有用户在上述一段时期内观看所有节目的总次数;预设值的公式如下:T=(p×e)/Na,其中,T表示预设值,p为0.73,e∈(0,1],Na表示初始标记点表中的标记点的个数;预设范围的计算公式如下:T'Min=((1-p)×eMin)/Na,T'Max=((1-p)×eMax)/Na,其中,T’Min表示预设范围的最小值,T’Max表示预设范围的最大值,(1-p)为0.27,eMin∈[0.1,1),eMax∈(eMin,1],Na表示初始标记点表中的标记点的个数;将所述各个标记点的支持度与预设值或预设范围相比较;筛选出标记点的支持度大于所述预设值,或标记点的支持度在所述预设范围内的若干标记点,并由所述若干标记点建立一更新标记点表。2.如权利要求1所述的方法,其特征在于,所述步骤三中将节目按照推荐概率从高到低的顺序推荐给相应用户。3.如权利要求2所述的方法,其特征在于,所述建立更新标记点表之后还包括以下步骤:筛选出包含更新标记点表中的标记点的节目,此节目后续称为筛选后节目;相应...

【专利技术属性】
技术研发人员:董延平汪灏泓
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1