内容推荐方法、内容推荐装置和电子设备制造方法及图纸

技术编号:22783800 阅读:20 留言:0更新日期:2019-12-11 04:14
本申请涉及一种内容推荐方法、内容推荐装置和电子设备。该内容推荐方法包括:获取用户对于具有相同类型和不同子类型的第一内容和第二内容的行为数据;确定第一内容的至少一个第一标签和第二内容的至少一个第二标签;以隐含狄利克雷分配模型获得至少一个第一标签和至少一个第二标签中的每个标签与隐含主题的主题相似度;基于主题相似度获得第一标签与第二标签之间的标签相似度;以及基于标签相似度向用户提供内容。这样,可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。

Content recommendation method, content recommendation device and electronic equipment

The application relates to a content recommendation method, content recommendation device and electronic equipment. The content recommendation method includes: obtaining the user's behavior data for the first content and the second content with the same type and different subtypes; determining at least one first tag of the first content and at least one second tag of the second content; obtaining each tag and the hidden topic's behavior data in at least one first tag and at least one second tag with the implicit Dirichlet assignment model Topic similarity; obtaining the tag similarity between the first tag and the second tag based on the topic similarity; and providing content to users based on the tag similarity. In this way, we can use user's heterogeneous data to migrate user's portrait, improve the accuracy of user's interest prediction, and optimize user experience.

【技术实现步骤摘要】
内容推荐方法、内容推荐装置和电子设备
本申请总的来说涉及数据处理领域,且更为具体地,涉及一种内容推荐方法、内容推荐装置和电子设备。
技术介绍
随着文化产业的发展,越来越多的内容被生产出来,以满足人们日益增长的需求。并且,随着内容表现形式的丰富,越来越多的内容被以诸如多媒体的形式表现出来。当用户需要获取自己所需的内容时,针对网络上的海量内容,用户需要花费大量的时间才能找到自己想要的内容。如果用户需要浏览大量无关的内容,这个过程显然会使得用户感到不便。尤其是,即使对于相同类型的内容,例如视频,随着其类型的进一步细分,也出现了更精细的子类型。例如,许多平台将视频分类为UGC(用户生产内容)、PGC(专业生产内容)和OGC(品牌生产内容)。因此,需要根据用户的兴趣特点,向用户推荐用户可能感兴趣的内容。特别是,当仅掌握用户对于某一子类型的内容的兴趣特点时,也需要据此向用户推荐其它子类型的内容。因此,需要改进的内容推荐方案。
技术实现思路
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种内容推荐方法、内容推荐装置和电子设备,其可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。根据本申请的一方面,提供了一种内容推荐方法,包括:获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;以隐含狄利克雷分配模型获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度;基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度;以及,基于所述标签相似度向用户提供内容。在上述内容推荐方法中,获取用户对于第一内容和第二内容的行为数据包括:获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。在上述内容推荐方法中,所述隐含狄利克雷分配模型的训练过程如下:生成所述预定时段的所述第一内容和第二内容的内容序列以及所述至少一个第一标签和至少一个第二标签的标签序列;输入所述内容序列以及所述标签序列作为隐含狄利克雷分配模型训练数据,所述第一内容和第二内容作为训练样本,且所述至少一个第一标签和所述至少一个第二标签作为模型的基本单元;设置一个或多个用于训练的隐含主题;以及,获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与每个隐含主题的主题相似度。在上述内容推荐方法中,基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度包括:将所述至少一个第一标签中的每个第一标签与每个隐含主题的主题相似度乘以所述至少一个第二标签中的每个第二标签与所述隐含主题的主题相似度;以及,对所述第一标签与所述第二标签针对同一隐含主题的乘积求和以获得所述第一标签与所述第二标签之间的标签相似度。在上述内容推荐方法中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。根据本申请的另一方面,提供了一种内容推荐装置,包括:数据获取单元,用于获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;标签确定单元,用于确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;模型计算单元,用于以隐含狄利克雷分配模型获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度;相似度计算单元,用于基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度;以及,内容提供单元,用于基于所述标签相似度向用户提供内容。在上述内容推荐装置中,所述数据获取单元用于获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。在上述内容推荐装置中,所述隐含狄利克雷分配模型的训练过程如下:生成所述预定时段的所述第一内容和第二内容的内容序列以及所述至少一个第一标签和至少一个第二标签的标签序列;输入所述内容序列以及所述标签序列作为隐含狄利克雷分配模型训练数据,所述第一内容和第二内容作为训练样本,且所述至少一个第一标签和所述至少一个第二标签作为模型的基本单元;设置一个或多个用于训练的隐含主题;以及,获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与每个隐含主题的主题相似度。在上述内容推荐装置中,所述相似度计算单元用于:将所述至少一个第一标签中的每个第一标签与每个隐含主题的主题相似度乘以所述至少一个第二标签中的每个第二标签与所述隐含主题的主题相似度;以及,对所述第一标签与所述第二标签针对同一隐含主题的乘积求和以获得所述第一标签与所述第二标签之间的标签相似度。在上述内容推荐装置中,所述第一内容和所述第二内容是视频内容;所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及,所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。根据本申请的又一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的内容推荐方法。本申请提供的内容推荐方法、内容推荐装置和电子设备可以利用用户的异构数据进行用户的画像迁移,提高用户兴趣预测的准确度,优化用户体验。附图说明通过阅读下文优选的具体实施方式中的详细描述,本申请各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。显而易见地,下面描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。而且在整个附图中,用相同的附图标记表示相同的部件。图1图示了根据本申请实施例的内容推荐方法的流程图;图2图示了根据本申请实施例的内容推荐方法中LDA模型训练的流程图;图3图示了根据本申请实施例的内容推荐装置的框图;图4图示了根据本申请实施例的内容推荐装置中的模型训练单元的框图;图5图示了根据本申请实施例的电子设备的框图。具体实施方式下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。申请概述如上所述,随着内容形式的不断丰富,即使对于某一类型的内容,比如视频,各个视频平台在视频内容上也会出现不同的视频子类型(比如,UGC视频、PGC视频或者OGC视频)。并且,在视频平台上,既会向用户推荐UGC视频,也会给用户推荐PGC视频,从而满足本文档来自技高网...

【技术保护点】
1.一种内容推荐方法,包括:/n获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;/n确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;/n以隐含狄利克雷分配模型获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度;/n基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度;以及/n基于所述标签相似度向用户提供内容。/n

【技术特征摘要】
1.一种内容推荐方法,包括:
获取用户对于第一内容和第二内容的行为数据,所述第一内容和所述第二内容具有相同类型和不同子类型;
确定所述第一内容的至少一个第一标签和所述第二内容的至少一个第二标签;
以隐含狄利克雷分配模型获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度;
基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度;以及
基于所述标签相似度向用户提供内容。


2.根据权利要求1所述的内容推荐方法,其中,获取用户对于第一内容和第二内容的行为数据包括:
获取用户在预定时段内对于所述第一内容和所述第二内容的行为数据。


3.根据权利要求2所述的内容推荐方法,其中,所述隐含狄利克雷分配模型的训练过程如下:
生成多个预定时段的所述第一内容和第二内容的内容序列以及所述至少一个第一标签和至少一个第二标签的标签序列;
输入所述内容序列以及所述标签序列作为隐含狄利克雷分配模型训练数据,所述第一内容和第二内容作为训练样本,且所述至少一个第一标签和所述至少一个第二标签作为模型的基本单元;
设置一个或多个用于训练的隐含主题;以及
获得所述至少一个第一标签和所述至少一个第二标签中的每个标签与每个隐含主题的主题相似度。


4.根据权利要求3所述的内容推荐方法,其中,基于所述至少一个第一标签和所述至少一个第二标签中的每个标签与隐含主题的主题相似度获得所述第一标签与所述第二标签之间的标签相似度包括:
将所述至少一个第一标签中的每个第一标签与每个隐含主题的主题相似度乘以所述至少一个第二标签中的每个第二标签与所述隐含主题的主题相似度;以及
对所述第一标签与所述第二标签针对同一隐含主题的乘积求和以获得所述第一标签与所述第二标签之间的标签相似度。


5.根据权利要求1到4中任意一项所述的内容推荐方法,其中,
所述第一内容和所述第二内容是视频内容;
所述第一内容是用户生产内容、专业生产内容和品牌生产内容中的一个;以及
所述第二内容是用户生产内容、专业生产内容和品牌生产内容中的另一个。


6.一种内容推荐装置,包括:
数据获取单元,用于获取用户对于第一内...

【专利技术属性】
技术研发人员:刘荣
申请(专利权)人:优酷网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1