基于历史信息的视频推荐方法和装置制造方法及图纸

技术编号:12081084 阅读:61 留言:0更新日期:2015-09-19 18:39
本发明专利技术公开了一种基于历史信息的视频推荐方法和装置,其中所述装置包括信息获取模块;特征需求强度获取模块;以及视频推荐模块;其中,所述特征需求强度获取模块包括特征组确定子模块,用于根据该类型视频中各视频的特征,确定该类型视频中的各特征组;以及特征分组子模块,用于将该类型视频中的各视频根据其特征分入各特征组中。根据本发明专利技术的实施例,可以简单有效地提供多类型和多特征的视频推荐结果,满足了用户复杂的视频推荐需求。

【技术实现步骤摘要】
本专利技术专利申请是申请日为2012年10月24日、申请号为201210408686.9、名称为“基于历史信息的视频推荐方法和装置”的中国发明专利申请的分案申请。
本专利技术涉及在线视频技术,尤其涉及一种基于历史信息的视频推荐方法和装置。
技术介绍
在线视频推荐是视频网站帮助用户查找并观看某个特定领域视频的方法和工具。相对于传统的视频目录浏览方式或者视频搜索方式,视频推荐能够在用户不确定合适的搜索词的情况下,通过分析用户历史行为,发现用户需求的特定领域,在该领域内进行推荐,避免了搜索词的输入和层次目录的多次点击过程,使得查找并观看某个特定类型的视频更加简单容易。现有的视频推荐技术,主要包括两种方法—基于视频协同过滤推荐和基于用户协同过滤推荐。前者通过计算视频和视频的相似度,将与观影记录视频最相似的视频推荐给用户。而后者则是基于观影记录,计算用户相似度,将相似的用户最近看过的视频推荐给用户。这两种方式默认都是基于用户的全部观影记录进行分析,返回的结果是与所有历史视频均相似的视频,对于喜好比较单一的用户,推荐结果较好。例如用户看了一部或多部动作片,推出最近最热的动作片,用户感受会比较好。图1示出了现有技术(CN102306178A,“视频推荐方法及装置”)的视频推荐方法的流程图。如图1所示,在现有技术中,(1)从用户日志数据库提取每一个COOKIE观看的VIDEO(视频)作为训练样本。(2)计算所述训练样本中所有COOKIE与VIDEO之间的转移概率对,得到COOKIE到VIDEO的转移概率矩阵和VIDEO到COOKIE的转移概率矩阵。(3)根据所述COOKIE到VIDEO的转移概率矩阵和VIDEO到COOKIE矩阵,得到VIDEO之间的转移概率矩阵。(4)根据VIDEO之间的转移概率矩阵得到推荐模型,并嵌入所述用户视频搜索系统以向用户返回推荐结果。现有技术方案可以满足视频类型和特征有单一喜好的用户需求。但是随着互联网视频网站的发展和用户上网观看视频的行为增多,用户对观看视频类型和特征的需求更为多样,满足全部类型和特征的视频将不存在或者质量较差,很可能是包含较多特征但是没有一个优秀特征的视频。在现有技术方案中,多类型的视频推荐无法得到满足:视频类型是视频资源的一个强特征,不同类型的视频推荐用户感受往往比较差。对一个准备周末花好几个小时来看爱情韩剧的用户,推荐一个只有1.5小时的爱情电影,用户感受不太好,同样给喜欢看体育短视频的用户推荐1.5小时以上的体育电影显然也不满足用户需求。另外,多特征的视频推荐也无法得到满足:相似或相同特征的视频是适合联合推荐的,不同特征的视频则不适合一起推荐。如“无间道1”、“无间道2”适合一起推荐,推荐“无间道3”、“窃听风云”比较好;而“笔仙”、“桃姐”则不合适一起推荐。
技术实现思路
鉴于上述问题,提出了本专利技术,以便提供一种克服上述问题或者至少部分地解决上述问题的基于历史信息的视频推荐方法和装置。依据本专利技术的一个方面,提供了一种基于历史信息的视频推荐方法,包括以下步骤:获取用户的视频观看记录信息;根据所述视频观看记录信息,计算用户观看过的各类型视频的类型需求强度;对于每一类型视频,根据视频特征进行分组,并且获取各特征组的特征需求强度;以及基于所述类型需求强度和/或所述特征需求强度,向用户推荐视频。根据本专利技术的实施例,所述根据所述视频观看记录信息计算用户观看过的各类型视频的类型需求强度的步骤包括:统计用户观看过的视频的类型;对于每一类型视频,根据该类型视频数量和所有视频总数量,计算该类型视频的内容需求强度;根据该类型视频的观看时间在所有视频的观看时间中所处的时间先后位置,计算该类型视频的时间需求强度;以及基于所述内容需求强度和所述时间需求强度,计算该类型视频的类型需求强度。根据本专利技术的实施例,在所述基于所述内容需求强度和所述时间需求强度、计算该类型视频的类型需求强度的步骤中,基于以下公式计算所述类型需求强度:类型需求强度=a×内容需求强度+(1-a)×时间需求强度,其中a是预先定义的常数。根据本专利技术的实施例,所述对于每一类型视频、根据视频特征进行分组的步骤包括:根据该类型视频中各视频的特征,确定该类型视频中的各特征组;以及将该类型视频中的各视频根据其特征分入各特征组中。根据本专利技术的实施例,所述根据该类型视频中各视频的特征、确定该类型视频中的各特征组的步骤是利用Canopy聚类算法执行的,包括以下步骤:设置第一距离阈值和第二距离阈值,其中所述第一距离阈值小于所述第二距离阈值;将特征差异小于所述第一距离阈值的视频分入相同的特征组中;将与一特征组的特征差异小于所述第二距离阈值、但大于所述第一距离阈值的视频分入该特征组,并且另外分入单独的特征组中;以及根据特征组中的视频,计算各特征组的中心特征。根据本专利技术的实施例,所述将该类型视频中的各视频根据其特征分入各特征组中的步骤是利用K-Means聚类算法执行的,包括以下步骤:计算所述各视频与各特征组的中心特征的差异;将所述各视频分入与其差异最小的特征组中;根据特征组中的视频,重新计算各特征组的中心特征;以及重复执行上述步骤,直到所述各特征组的中心特征与前一次计算的各特征组的中心特征之间的差异小于预先定义的阈值为止。根据本专利技术的实施例,特征组的特征需求强度是根据该特征组中的视频的观看时间在所有特征组的视频的观看时间中所处的时间先后位置确定的。根据本专利技术的实施例,特征组的特征需求强度是根据该特征组中最新观看的视频的观看时间在各特征组中最新观看的视频的观看时间中所处的时间先后位置确定的。根据本专利技术的实施例,所述基于所述类型需求强度和/或所述特征需求强度、向用户推荐视频的步骤包括:按照类型需求强度从高到低的顺序,向用户推荐各类型的视频;以及对于每一类型视频,按照特征需求强度从高到低的顺序,向用户推荐各特征组的视频。根据本专利技术的实施例,所述基于所述类型需求强度和/或所述特征需求强度、向用户推荐视频的步骤还包括:响应于用户更换视频类型的请求,切换向用户推荐的视频类型;和/或响应于用户更换视频特征组的请求,切换向用户推荐的视频特征组。根据本专利技术的实施例,所述视频观看记录信息包含在用户的Cookie文件中。依据本发本文档来自技高网
...

【技术保护点】
一种基于历史信息的视频推荐方法(100),包括以下步骤:获取用户的视频观看记录信息(S101);根据所述视频观看记录信息,计算用户观看过的各类型视频的类型需求强度(S103);对于每一类型视频,根据视频特征进行分组,并且获取各特征组的特征需求强度(S105);以及基于所述类型需求强度和/或所述特征需求强度,向用户推荐视频(S107)。

【技术特征摘要】
1.一种基于历史信息的视频推荐方法(100),包括以下步骤:
获取用户的视频观看记录信息(S101);
根据所述视频观看记录信息,计算用户观看过的各类型视频的类型需
求强度(S103);
对于每一类型视频,根据视频特征进行分组,并且获取各特征组的特
征需求强度(S105);以及
基于所述类型需求强度和/或所述特征需求强度,向用户推荐视频
(S107)。
2.如权利要求1所述的方法,其中所述根据所述视频观看记录信息计
算用户观看过的各类型视频的类型需求强度(S103)的步骤包括:
统计用户观看过的视频的类型(S103a);
对于每一类型视频,根据该类型视频数量和所有视频总数量,计算该
类型视频的内容需求强度(S103b);
根据该类型视频的观看时间在所有视频的观看时间中所处的时间先
后位置,计算该类型视频的时间需求强度(S103c);以及
基于所述内容需求强度和所述时间需求强度,计算该类型视频的类型
需求强度(S103d)。
3.如权利要求2所述的方法,其中在所述基于所述内容需求强度和所
述时间需求强度、计算该类型视频的类型需求强度(S103d)的步骤中,
基于以下公式计算所述类型需求强度:
类型需求强度=a×内容需求强度+(1-a)×时间需求强度,其中a是预
先定义的常数。
4.如权利要求1所述的方法,其中所述对于每一类型视频、根据视频
特征进行分组的步骤包括:
根据该类型视频中各视频的特征,确定该类型视频中的各特征组
(S105a);以及
将该类型视频中的各视频根据其特征分入各特征组中(S105b)。
5.如权利要求4所述的方法,其中所述根据该类型视频中各视频的特

\t征、确定该类型视频中的各特征组(S105a)的步骤是利用Canopy聚类算
法执行的,包括以下步骤:
设置第一距离阈值和第二距离阈值,其中所述第一距离阈值小于所述
第二距离阈值;
将特征差异小于所述第一距离阈值的视频分入相同的特征组中;

【专利技术属性】
技术研发人员:杨浩吴凯
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1