当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于用户关注时间的网络视频排序方法技术

技术编号:2917532 阅读:302 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于用户关注时间的网络视频排序方法,利用用户关注时间对网络视频搜索引擎得到的搜索结果进行个性化改进,使网络视频的搜索排序结果更加符合用户需求。本发明专利技术包括以下步骤:1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间;2)对获得的每个用户关注时间进行校正;3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间;4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间;5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序。本发明专利技术有效地将用户的喜好结合在网络视频搜索过程中,使得最终的网络视频排序结果更加接近用户期待的理想排序。

【技术实现步骤摘要】

本专利技术涉及计算机网络搜索领域,尤其涉及一种基于用户关注时间的网络视频排序方法
技术介绍
现有的个性化引擎依靠的是用户的反馈,它可以分为显式反馈和隐式反馈。我们从这两种反馈中都可以得到用户的喜好特征。但是用户一般都不愿意去提供显式的反馈,所以现在的研究越来越多的研究都转向隐式反馈。研究表明,隐式反馈可以很好的反映用户的搜索意图,并且从大量的隐式反馈中得到的用户喜好往往比显式反馈更加可靠。查询历史:现代研究中,用得最多的隐式反馈就是用户的查询历史。Google的个性化搜索(http://www.google.com/psearch)就是基于用户的查询历史的。总的来说,基于查询历史的算法又可以分为以下两类:一类是基于整个查询历史的算法,另一类是基于某个查询会话(指的是一连串相关的查询)。对于前者来说,通常算法会产生一个该用户的概要文档用来描述用户的搜索喜好。点击数据:点击数据是另一种非常重要的隐式反馈。在一个搜索结果页面上,我们假设用户点击过的链接比用户没有点过的链接对于此用户来说更加重要。研究者们用了很多中方法从用户的点击行为中获取用户的喜好特征。举例来说,有些研究者用一种叫Ranking SVM的算法通过用户的点击信息来获得对该用户来说最好的网页排序。在2005年Radlinski与Joachims的研究中,不但从用户的单次查询中提取用户喜好,同时也从用户对同一信息的一连串查询中提取用户的喜好,这些喜好特征然后通过Ranking SVM的改进算法来进行训练。Sun等人于2005年提出了一种基于Singluar Value Decomposition的算法,它通过分析用户的点击数据来提高搜索引擎的建议系统的准确率。关注时间:相对来说,关注时间是一个新型的隐式用户反馈。虽然它在近期的研究中越来越多被提到,但是关于它是否真的能够反映用户意图仍然有争辩。Kelly和Belkin建议说,在文档的关注时间和它对用户的有用度之间并没有非常可靠的相互关系。但是不同的是,在他们的研究当中,关注时间是通过测量一组用户阅读不同主题的文章而得到的平均关注时间。Halabi等人认为对于一个的用户在同一个搜索行为中关注时间,它可以很好的反映出用户的喜-->好。我们认为以上两个研究并不矛盾,因为他们所计算的关注时间并不相同。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供一种基于用户关注时间的网络视频排序方法。基于用户关注时间的网络视频排序方法,包括以下步骤:1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间;2)对获得的每个用户关注时间进行校正;3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间;4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间;5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序;所述的利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间步骤:(a)使用一个自定义的网页浏览器,在网络视频搜索引擎获得的搜索结果页面中,追踪鼠标的移动位置,记录用户鼠标在各个搜索结果项的文本概要及缩略图上的停留时间,即为用户对网络视频概要的阅读时间;(b)在用户通过搜索结果页面打开的视频中,记录用户在该视频中播放过的视频片段时间和,即为用户对网络视频的播放时间;(c)网络视频的用户关注时间为用户对视频概要的阅读时间与对视频的播放时间之和;所述的对获得的每个用户关注时间进行校正步骤:(d)对获取到的用户关注时间样本通过公式:tattinf(u,v)=max(tattraw(u,v)-tbasic(u),0)]]>进行校正,其中为从步骤1)中获得的用户关注时间,tbasic(v)为用户判断此视频是否值得观看所花费的时间,为校正后的该视频的用户关注时间;tbasic(u)通常预设为2~10秒;所述的基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间步骤:(e)对该未知视频,使用视频关键帧提取算法,提取出该视频关键帧;设提取出了m关键帧图像I1,I2...Im;-->(f)对每个用户播放过的视频vi,使用视频关键帧提取算法,在被用户播放过的视频片段中提取出关键帧图像;设提取出了m(i)个关键帧图像Ii,1,Ii,2...Ii,m(i);(g)对经步骤(e)提取出的未知视频中的每个关键帧图像Ij(j=1,2...m),计算该视频与经步骤(f)提取出的每个关键帧图像Ii,k(k=1,2...m(i)),利用图像相似度计算方法,计算出Ij与Ii,k间的相似度,记为Sim(Ij,Ii,k),Sim(Ij,Ii,k)取值为0~1间的实数;(h)在每个用户播放过的视频vi的m(i)个关键帧图像中,找到使Sim(Ij,Ii,k)取值最大的n个关键帧图像;设这样的n个关键帧图像为Ii,1(j),Ii,2(j)...Ii,n(j);n通常预设为min(m(i),10);(i)预测未知视频中每个关键帧图像Ij(j=1,2...m)的用户关注时间:tatt(u,Ij)=Σi=1m(i)Σk=1ntattinf(u,Ii,n(j))Sim(Ij,Ii,n(j))δ(Ij,Ii,n(j))Σi=1m(i)Σk=1nSim(Ij,Ii,n(j))δ(Ij,Ii,n(j))+ϵ]]>其中,(u,Ii,n(j))为用户在关键帧图像为Ii,1(j)所代表的视频片段上的关注时间;ε为一个很小的正实数用来防止分母为0,预设为10-10;若Sim(di,dx)的值小于0.01,δ(di,dx)的取值为1,否则取值为0;所述的对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间步骤:(j)对该未知视频v,通过公式:tatt(u,v)=Σj=1mtatt(u,Ij)]]>计算该视频的用户关注时间tatt(u,v);其中tatt(u,Ij)为在步骤(i)中预测得到的关键帧图像Ij的用户关注时间;所述的利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序步骤:(k)当用户提交一个网络视频搜索请求时,首先将查询重定向至现有的网络视频搜索引擎,搜索获得的前10~50个网络视频,对于其中的每个网络视频,使用如步骤(j)所述的方法预测该网络视频的用户关注时间;(1)计算用户关注时间偏差;记第i个网络视频的用户关注时间偏差为计算公式为:tattoffset(i)=2exp(-κ·rand(i))1+exp(-κ·rank(i))]]>-->其中rank(i)表示第i个网络视频在由现有网络视频搜索引擎得到的搜索结果中的排名名次;参数κ用来控制用户关注时间随排名下降的速度,κ的值预设为0.2;(m)对第i个网络视频,根据该视频用户关注时间tatt(i)和用户关注时间偏差计算该视频全局关注时间计算公式为:tattoverall(i)=κoveralltatt(i)+tattoffset(i)]]>其中κoverall为用户自定义参数,用来控本文档来自技高网
...

【技术保护点】
一种基于用户关注时间的网络视频排序方法,其特征在于包括以下步骤: 1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间; 2)对获得的每个用户关注时间进行校正; 3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间; 4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间; 5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序。

【技术特征摘要】
1.一种基于用户关注时间的网络视频排序方法,其特征在于包括以下步骤:1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间;2)对获得的每个用户关注时间进行校正;3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间;4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间;5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序。2.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间步骤:(a)使用一个自定义的网页浏览器,在网络视频搜索引擎获得的搜索结果页面中,追踪鼠标的移动位置,记录用户鼠标在各个搜索结果项的文本概要及缩略图上的停留时间,即为用户对网络视频概要的阅读时间;(b)在用户通过搜索结果页面打开的视频中,记录用户在该视频中播放过的视频片段时间和,即为用户对网络视频的播放时间;(c)网络视频的用户关注时间为用户对视频概要的阅读时间与对视频的播放时间之和。3.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的对获得的每个用户关注时间进行校正步骤:(d)对获取到的用户关注时间样本通过公式:tattinf(u,v)=max(tattraw(u,v)-tbasic(u),0)]]>进行校正,其中为从步骤1)中获得的用户关注时间,tbasic(v)为用户判断此视频是否值得观看所花费的时间,为校正后的该视频的用户关注时间;tbasic(u)通常预设为2~10秒。4.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间步骤:(e)对该未知视频,使用视频关键帧提取算法,提取出该视频关键帧;设提取出了m关键帧图1像I1,I2...Im;(f)对每个用户播放过的视频vi,使用视频关键帧提取算法,在被用户播放过的视频片段中提取出关键帧图像;设提取出了m(i)个关键帧图像Ii,1,Ii,2...Ii,m(i);(g)对经步骤(e)提取出的未知视频中的每个关键帧图像Ij(j=1,2...m),计算该视频与经步骤(f)提取出的每个关键帧图像Ii,k(k=1,2...m(i)),利用图像相似度计算方法,计算出Ij与Ii,k间的相似度,记为Sim(Ij,Ii,k),Sim(Ij,Ii,k)取值为0~1间的实数;(h)在每个用户播放过的视频vi的m(i)个关键帧图像中,找到使Sim(Ij,Ii,k)取值最大的n个关键帧图像;设这样的n个关键帧图像为Ii,1(j)...

【专利技术属性】
技术研发人员:徐颂华江浩刘智满潘云鹤
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1