本发明专利技术公开了一种识别电视端用户集合的方法,包括如下步骤:步骤S1:收集电视用户海量观看记录,对电视用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5);步骤S2:计算得到用户类型集合Mi到影片分类标签Tag的映射MAP2和MAP1;步骤S3:计算得到客户端用户集合的最终的分类结果FUserset(Li)。本发明专利技术能够很好的适用于电视端用户集合的识别分类,从而为电视端用户提供更精准的互联网服务。
【技术实现步骤摘要】
本专利技术涉及电视互联网视频用户数据分析
,具体来说,涉及一种识别电视端用户集合的方法。
技术介绍
随着互联网的普及,越来越多的人依赖于通过互联网获取服务,而互联网公司也从以产品为中心逐渐转移到以用户为中心的运营思路上。往往对细分市场的用户特征越了解越能提供更优质的服务,表现出更突出的竞争力。当前,电视逐渐成为互联网服务占比越来越高的一种终端。而传统电视端用户已经形成了特有的使用习惯和特点,如何向电视端用户提供更精准的互联网服务成为关键。用户分类是一种常用的用户精细化运营的手段,当前互联网视频聚合应用常用的用户分类法大多是默认一个设备只有一个用户,这也确实是大多数应用特别是移动端应用的使用场景。然而电视用户往往并不是一个人,而是以家庭为单位的多个个体组成的用户集合。在“一个设备只有一个用户”这样假设基础上建立的用户分类法并不能很好的适用于电视端视频聚合应用。
技术实现思路
本专利技术的目的是提供一种识别电视端用户集合的方法,以克服目前现有技术存在的上述不足。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种识别电视端用户集合的方法,包括如下步骤:步骤S1:收集电视用户海量观看记录,对电视用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5);步骤S2:计算得到用户类型集合Mi到影片分类标签Tag的映射MAP2和MAP1;步骤S3:计算得到客户端用户集合的最终的分类结果FUserset(Li)。进一步的,所述的步骤S2进一步包括:步骤S2.1:对海量数据进行分析,得到类型参数与影片Tag分类标签的映射关系MAP1(Mi,Tag Mi(t1,t2, …)),其中i=1,2……5;步骤S2.2:根据得到的观看记录生产视频相似度矩阵;步骤S2.3:计算得到该用户合集UserSet与影片Tag之间的映射关系MAP2(UserSet,Tag UserSet(t1,t2,…))。进一步的,所述的步骤S2.1:步骤S2.1.1:收集已知真实身份的用户集合Fknown以及影片分类标签集合Tagknown(ti)的映射列表MAPknown(Fknown, Tagknown(ti));步骤S2.1.2:使用人工神经网络算法,采用不少于1000条样本数据进行训练,得到用户集合与影片分类标签之间的模型F2T(F);步骤S2.1.3:将5个一维向量F(Mi)(I = 1,2,3,4,5)分别做为F2T(F)的输入参数,可得到类型参数Mi与影片分类标签(Tag)的映射关系列表MAP1(Mi,Tag Mi(t1,t2, …))。进一步的,步骤S2.3进一步包括:步骤S2.3.1:采用协同过滤算法找到与每个影片最相似的K个影片;步骤S2.3.2:考察所有M×K个影片,计算得到该M×K个影片对应的分类标签集合Tag;步骤S2.3.3:则该用户集合与影片分类标签之间的映射列表可表示为MAP2(UserSet,Tag UserSet(t1,t2,…))。进一步的,在步骤S3中,计算MAP2到MAP1中每一行的距离参数Li,得到该客户端用户集合的最终的分类结果FUserset(Li)。本专利技术具有如下的有益效果:该专利技术基于海量电视用户数据,提出一种更符合实际电视端应用场景的用户分类方法,能为基于用户模型的视频推荐、广告精准投放等应用提供更精准的用户描述模型;本专利技术能够很好的适用于电视端用户集合的识别分类,从而为电视端用户提供更精准的互联网服务。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术实施例的一种识别电视端用户集合的方法的流程框图;图2是本专利技术实施例得到映射关系MAP1的流程框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其它实施例,都属于本专利技术保护的范围。如图1-2所示,本专利技术实施例所述的一种识别电视端用户集合的方法,包括如下步骤:步骤S1:收集电视用户海量观看记录,对电视用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5);步骤S2:计算得到用户类型集合Mi到影片分类标签Tag的映射MAP2和MAP1;步骤S3:计算得到客户端用户集合的最终的分类结果FUserset(Li)。其中,所述的步骤S2进一步包括:步骤S2.1:对海量数据进行分析,得到类型参数与影片Tag分类标签的映射关系MAP1(Mi,Tag Mi(t1,t2, …)),其中i=1,2……5;步骤S2.2:根据得到的观看记录生产视频相似度矩阵;步骤S2.3:计算得到该用户合集UserSet与影片Tag之间的映射关系MAP2(UserSet,Tag UserSet(t1,t2,…))。在一具体实施例中,所述的步骤S2.1:步骤S2.1.1:收集已知真实身份的用户集合Fknown以及影片分类标签集合Tagknown(ti)的映射列表MAPknown(Fknown, Tagknown(ti));步骤S2.1.2:使用人工神经网络算法,采用不少于1000条样本数据进行训练,得到用户集合与影片分类标签之间的模型F2T(F);步骤S2.1.3:将5个一维向量F(Mi)(I = 1,2,3,4,5)分别做为F2T(F)的输入参数,可得到类型参数Mi与影片分类标签(Tag)的映射关系列表MAP1(Mi,Tag Mi(t1,t2, …))。在一具体实施例中,步骤S2.3进一步包括:步骤S2.3.1:采用协同过滤算法找到与每个影片最相似的K个影片;步骤S2.3.2:考察所有M×K个影片,计算得到该M×K个影片对应的分类标签集合Tag;步骤S2.3.3:则该用户集合与影片分类标签之间的映射列表可表示为MAP2(UserSet,Tag UserSet(t1,t2,…))。在一具体实施例中,在步骤S3中,计算MAP2到MAP1中每一行的距离参数Li,得到该客户端用户集合的最终的分类结果FUserset(Li)。本专利技术通过将电视联网视频聚合应用的用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5),其中M1表示婴幼儿系数、M2表示儿童系数、M3表示青少年系数、M4表示中青年系数、M5表示老年系数。每个系数表示该用户集合拥有该年龄段成员的可能性,其取值区间为[0,1]。首先:通过海量数据分析得到类型参数与影片分类标签(Tag)的映射关系MAP1(Mi,Tag Mi(t1,t2, …)),例如,代表儿童系数M2的一种可能表述为M2:TagM2(动画片,00后,科教,…),以此类推。然后:收集客户端的用户合集(UserSet)观影记录,分别选出用户看过的每个影片的最相似的K个影片,计算得到该用户集合与影片Tag之间的映射MAP2(UserSet,Tag UserSet(t1,t2,…)),例如,FUserset = Taguserset (动画片,90后,本文档来自技高网...
【技术保护点】
一种识别电视端用户集合的方法,其特征在于,包括如下步骤:步骤S1:收集电视用户海量观看记录,对电视用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5);步骤S2:计算得到用户类型集合Mi到影片分类标签Tag的映射MAP2和MAP1;步骤S3:计算得到客户端用户集合的最终的分类结果FUserset(Li)。
【技术特征摘要】
1.一种识别电视端用户集合的方法,其特征在于,包括如下步骤:步骤S1:收集电视用户海量观看记录,对电视用户建模成一个包括5个类型参数的用户集合F(M1,M2,M3,M4,M5);步骤S2:计算得到用户类型集合Mi到影片分类标签Tag的映射MAP2和MAP1;步骤S3:计算得到客户端用户集合的最终的分类结果FUserset(Li)。2.根据权利要求1所述的一种识别电视端用户集合的方法,其特征在于,所述的步骤S2进一步包括:步骤S2.1:对海量数据进行分析,得到类型参数与影片Tag分类标签的映射关系MAP1(Mi,TagMi(t1,t2, …)),其中i=1,2……5;步骤S2.2:根据得到的观看记录生产视频相似度矩阵;步骤S2.3:计算得到该用户合集UserSet与影片Tag之间的映射关系MAP2(UserSet,Tag UserSet(t1,t2,…))。3.根据权利要求2所述的一种识别电视端用户集合的方法,其特征在于,所述的步骤S2.1:步骤S2.1.1:收集已知真实身份的用户集合Fknown以及影片分类标签集合Tagknown(ti)的映射列表MAPk...
【专利技术属性】
技术研发人员:童奥,梁炬,
申请(专利权)人:徐汕,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。