本发明专利技术公开了一种用户兴趣度的评价方法和系统,通过建立兴趣标签库,兴趣标签库包括节目标签,以及节目标签下的各个节目参数;基于节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个节目标签下的节目指标参数不相对于全部用户的相对值,得到各个节目指标参数对应的归一化值;加权计算当前用户对应的每个节目标签下的各个节目指标参数对应的归一化值,得到当前用户对每个节目标签对应的节目的兴趣度。通过上述公开方法,对于兴趣度的计算是基于预先建立的节目标签上的节目指标参数得到,过程简洁。因此,通过本发明专利技术公开的用户兴趣度的评价方法能够快速且准确的得到用户对各个节目标签的兴趣度。
【技术实现步骤摘要】
用户兴趣度的评价方法和系统
本专利技术涉及新媒体
,更具体地说涉及一种用户兴趣度的评价方法和系统。
技术介绍
随着新媒体行业的快速发展,针对不同的用户画像做不同的推送已经成为其重要的业务之一。其中,用户的收视偏好又是其进行用户画像过程中重要组成部分。用户的收视偏好主要通过用户兴趣度进行衡量。用户兴趣度则指用户对各兴趣标签感兴趣的程度。对于用户兴趣度的计算,现有技术中,主要基于主题模型对不同用户在不同时段收视兴趣偏好的概率值进行计算。该主题模型主要通过训练的方式实现对用户兴趣度的计算。但是,主题模型在计算用户兴趣度时,复杂度高,通用性差,且主题模型训练出的主题较为抽象,解释性不强,且不同主题模型之间也存在一定的差异。因此,基于现有技术获得用户兴趣度不仅过程复杂,且不准确。
技术实现思路
有鉴于此,本申请提供了一种用户兴趣度的评价方法和系统,以实现快速得到准确的用户兴趣度的目的。为了实现上述目的,现提出的方案如下:本专利技术第一方面公开了一种用户兴趣度的评价方法,包括:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。优选的,所述节目参数至少包括:节目名称和节目自身的时长;所述节目所属类别至少包括:按照内容划分的类别和/或按照节目题材划分的类别,所述按照内容划分的类别包括:剧情、喜剧或真人秀,所述按照节目题材划分的类别包括:电视剧、电影或综艺。优选的,所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数。优选的,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:确定每一节目标签;获取所述用户收看每一所述节目标签下的节目的时长其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i。优选的,若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:确定每一节目标签;获取所述用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。优选的,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个所述用户对应的节目指标参数;确定当前所述用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值;基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前所述用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。优选的,若所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数;则所述加权计算当前所述用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度,包括:获取当前所述用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前所述用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。本专利技术第二方面公开了一种用户兴趣度的评价系统,包括:预处理单元,用于建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;指标计算单元,用于基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理单元,用于归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;兴趣度计算单元,用于加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。本专利技术第三方面公开了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本专利技术第一方面公开的用户兴趣度的评价方法。本专利技术第四方面公开了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如本专利技术第一方面公开的用户兴趣度的评价方法。经由上述技术方案可知,本专利技术公开一种用户兴趣度的评价方法和系统,通过建立兴趣标签库,兴趣标签库包括节目标签,以及节目标签下的各个节目参数,节目标签包括节目所属类别;基于节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个节目标签下的节目指标参数不相对于全部用户的相对值,得到各个节目指标参数对应的归一化值;加权计算当前用户对应的每个节目标签下的各个节目指标参数对应的归一化值,得到当前用户对每个节目标签对应的节目的兴趣度。通过上述公开的用户兴趣度的评价方法,得到的兴趣度在用户数上近似服从高斯分布,且得到的兴趣度的大小可以真实的反映用户对该节目标签下的节目的兴趣度,且上述计算基于预先建立的节目标签上的节目指标参数得到,过程简洁。因此,通过本专利技术公开的用户兴趣度的评价方法能够快速且准确的得到用户对各个节目标签的兴趣度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例公开的一种用户兴趣度的评价方法的流程示意图;图2为本专利技术实施例公开的归一化处理的流程示意图;图3为本专利技术实施例公开的一种用户兴趣度的评价系统的结构示意图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。由
技术介绍
可知,现有技术中,主要基于主题模型对不同用户在不同时段收视兴趣偏好的概率值进行计算。但是,主题模型在计算用户兴趣度时,复杂度高,通用性差,且主题模型训练出的主题较为抽象,解释性不强,不同主题模型之间也存在一定的差异,导致获得用户本文档来自技高网...
【技术保护点】
1.一种用户兴趣度的评价方法,其特征在于,包括:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
【技术特征摘要】
1.一种用户兴趣度的评价方法,其特征在于,包括:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。2.根据权利要求1所述的方法,其特征在于,所述节目参数至少包括:节目名称和节目自身的时长;所述节目所属类别至少包括:按照内容划分的类别和/或按照节目题材划分的类别,所述按照内容划分的类别包括:剧情、喜剧或真人秀,所述按照节目题材划分的类别包括:电视剧、电影或综艺。3.根据权利要求1所述的方法,其特征在于,所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数。4.根据权利要求1所述的方法,其特征在于,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:确定每一节目标签;获取所述用户收看每一所述节目标签下的节目的时长其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i。5.根据权利要求1中任意一项所述的方法,其特征在于,若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:确定每一节目标签;获取所述用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率其中,ti表示所述用户每次收看当前节目标签下的节目的时长,,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。6.根据权利要求1-5中任意一项所述的方法,其特征在于,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个所述用户对应的节目指标参数;确...
【专利技术属性】
技术研发人员:卢金金,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。