【技术实现步骤摘要】
本专利技术涉及计算机网络搜索领域,尤其涉及一种基于用户关注时间的网络视频排序方法。
技术介绍
现有的个性化引擎依靠的是用户的反馈,它可以分为显式反馈和隐式反馈。我们从这两种反馈中都可以得到用户的喜好特征。但是用户一般都不愿意去提供显式的反馈,所以现在的研究越来越多的研究都转向隐式反馈。研究表明,隐式反馈可以很好的反映用户的搜索意图,并且从大量的隐式反馈中得到的用户喜好往往比显式反馈更加可靠。查询历史:现代研究中,用得最多的隐式反馈就是用户的查询历史。Google的个性化搜索(http://www.google.com/psearch)就是基于用户的查询历史的。总的来说,基于查询历史的算法又可以分为以下两类:一类是基于整个查询历史的算法,另一类是基于某个查询会话(指的是一连串相关的查询)。对于前者来说,通常算法会产生一个该用户的概要文档用来描述用户的搜索喜好。点击数据:点击数据是另一种非常重要的隐式反馈。在一个搜索结果页面上,我们假设用户点击过的链接比用户没有点过的链接对于此用户来说更加重要。研究者们用了很多中方法从用户的点击行为中获取用户的喜好特征。举例来说,有些研究者用一种叫Ranking SVM的算法通过用户的点击信息来获得对该用户来说最好的网页排序。在2005年Radlinski与Joachims的研究中,不但从用户的单次查询中提取用户喜好,同时也从用户对同一信息的一连串查询中提取用户的喜好,这些喜好特征然后通过Ranking SVM的改进算法来进行训练。Sun等人于2005年提出了一种基于Singluar Value Decomposition的 ...
【技术保护点】
一种基于用户关注时间的网络视频排序方法,其特征在于包括以下步骤: 1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间; 2)对获得的每个用户关注时间进行校正; 3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间; 4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间; 5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序。
【技术特征摘要】
1.一种基于用户关注时间的网络视频排序方法,其特征在于包括以下步骤:1)利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间;2)对获得的每个用户关注时间进行校正;3)基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间;4)对未知网络视频,通过该视频各关键帧的用户关注时间,计算该视频的用户关注时间;5)利用获得或预测得的用户关注时间分别对网络视频搜索引擎得到的网络视频进行重新排序。2.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的利用自定义网页浏览器,获得用户对网络视频搜索结果中各个网络视频的关注时间步骤:(a)使用一个自定义的网页浏览器,在网络视频搜索引擎获得的搜索结果页面中,追踪鼠标的移动位置,记录用户鼠标在各个搜索结果项的文本概要及缩略图上的停留时间,即为用户对网络视频概要的阅读时间;(b)在用户通过搜索结果页面打开的视频中,记录用户在该视频中播放过的视频片段时间和,即为用户对网络视频的播放时间;(c)网络视频的用户关注时间为用户对视频概要的阅读时间与对视频的播放时间之和。3.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的对获得的每个用户关注时间进行校正步骤:(d)对获取到的用户关注时间样本通过公式:tattinf(u,v)=max(tattraw(u,v)-tbasic(u),0)]]>进行校正,其中为从步骤1)中获得的用户关注时间,tbasic(v)为用户判断此视频是否值得观看所花费的时间,为校正后的该视频的用户关注时间;tbasic(u)通常预设为2~10秒。4.根据权利要求1所述的一种基于用户关注时间的网络视频排序方法,其特征在于所述的基于图像相似度来预测未知网络视频中各个关键帧的用户关注时间步骤:(e)对该未知视频,使用视频关键帧提取算法,提取出该视频关键帧;设提取出了m关键帧图1像I1,I2...Im;(f)对每个用户播放过的视频vi,使用视频关键帧提取算法,在被用户播放过的视频片段中提取出关键帧图像;设提取出了m(i)个关键帧图像Ii,1,Ii,2...Ii,m(i);(g)对经步骤(e)提取出的未知视频中的每个关键帧图像Ij(j=1,2...m),计算该视频与经步骤(f)提取出的每个关键帧图像Ii,k(k=1,2...m(i)),利用图像相似度计算方法,计算出Ij与Ii,k间的相似度,记为Sim(Ij,Ii,k),Sim(Ij,Ii,k)取值为0~1间的实数;(h)在每个用户播放过的视频vi的m(i)个关键帧图像中,找到使Sim(Ij,Ii,k)取值最大的n个关键帧图像;设这样的n个关键帧图像为Ii,1(j)...
【专利技术属性】
技术研发人员:徐颂华,江浩,刘智满,潘云鹤,
申请(专利权)人:浙江大学,
类型:发明
国别省市:86[中国|杭州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。