本发明专利技术涉及视频向量化方法及装置。该方法包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一视频列表;提取所述第一视频列表中的各个视频的前后视频的特征向量;根据所述各个视频的前后视频的特征向量建立第一视频向量模型;采集视频样本,并通过所述视频样本训练所述第一视频向量模型,得到第二视频向量模型;通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。根据本发明专利技术的视频向量化方法及装置无需对视频逐帧进行向量化,而是对视频的整体进行向量化,大大降低了视频向量化的数据量及噪声,提高了视频向量化的处理速度,且结合用户行为数据建立视频向量模型,从而使视频向量能够更准备地反映视频信息。
【技术实现步骤摘要】
本专利技术涉及信息
,尤其涉及一种视频向量化方法及装置。
技术介绍
互联网时代是信息爆炸的时代,信息的数量以指数级增长。在视频领域,视频的数量以井喷式增长。目前,YouTube网站每分钟大约有60个小时的视频被上传,YouTube网站总的视频数量达到了数亿。如何对如此庞大数量的视频进行快速有效的分析和量化成为目前研究的重点。目前,对视频进行向量化处理主要基于卷积神经网络的视频特征提取方法。该方法将视频进行逐帧分析,提取视频的每一帧图像分别进行向量化,具体来说,通过卷积神经网络对每张图像进行多维度的特征提取,再进行向量映射。由于对视频中的每帧图像分别进行向量化,导致视频向量化得到的数据量较大,且图像对应的向量的信息表示不明确,噪声较大。
技术实现思路
技术问题有鉴于此,本专利技术要解决的技术问题是,现有的视频向量化技术得到的数据量较大,且图像对应的向量的信息表示不明确,噪声较大。解决方案为了解决上述技术问题,根据本专利技术的一实施例,提供了一种视频向量化方法,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一视频列表;提取所述第一视频列表中的各个视频的前后视频的特征向量;根据所述各个视频的前后视频的特征向量建立第一视频向量模型;采集视频样本,并通过所述视频样本训练所述第一视频向量模型,得到第二视频向量模型;通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。对于上述方法,在一种可能的实现方式中,采集目标用户的用户行为数据,根据所述用户行为数据生成第一视频列表,包括:采集指定时间段内的所述目标用户的所有用户行为数据;从所采集的用户行为数据中筛选出有效的用户行为数据;按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一视频列表。对于上述方法,在一种可能的实现方式中,提取所述第一视频列表中的各个视频的前后视频的特征向量,具体用于:采用式1提取所述第一视频列表中的第j个视频vj的前后视频的特征向量f(vj+k);其中,vj+k表示所述第一视频列表中的第j+k个视频,K表示用于计算所述第j个视频vj对应的特征向量f(vj+k)的前后视频的个数,H(vj+k)表示所述第j+k个视频的初始向量;根据式2计算;对于上述方法,在一种可能的实现方式中,根据所述各个视频的前后视频的特征向量建立第一视频向量模型,具体用于:根据式3建立所述第一视频向量模型;E(vj)=logp(vj|vj+k) 式3;其中,-K<k<K,k≠0,p(vj|vj+k)根据式4确定;p(vj|vj+k)=cosin[H(vj),f(vj+k)] 式4;其中,cosin[H(vj),f(vj+k)]表示H(vj)与f(vj+k)之间的余弦距离。对于上述方法,在一种可能的实现方式中,采集视频样本,包括:从区间(0,1)中产生一个随机数;若所述随机数落在区间Ii上,则将所述第一视频列表中的第i-1个视频作为所述视频样本;其中,Ii=(li-1,li),i=1,2...N,l0=0,i表示观看次数区间,N表示所述观看次数区间的总个数,counter(vj)表示所述第一视频列表中的第j个视频被所有用户观看的总次数,表示所述第一视频列表中的所有视频被所有用户观看的总次数。为了解决上述技术问题,根据本专利技术的另一实施例,提供了一种视频向量化装置,包括:第一视频列表生成模块,用于采集目标用户的用户行为数据,并根据所述用户行为数据生成第一视频列表;前后视频特征向量提取模块,用于提取所述第一视频列表中的各个视频的前后视频的特征向量;第一视频向量模型建立模块,用于根据所述各个视频的前后视频的特征向量建立第一视频向量模型;视频向量模型训练模块,用于采集视频样本,并通过所述视频样本训练所述第一视频向量模型,得到第二视频向量模型;向量化模块,用于通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。对于上述装置,在一种可能的实现方式中,所述第一视频列表生成模块包括:用户行为数据采集子模块,用于采集指定时间段内的所述目标用户的所有用户行为数据;用户行为数据筛选子模块,用于从所采集的用户行为数据中筛选出有效的用户行为数据;第一视频列表生成子模块,用于按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一视频列表。对于上述装置,在一种可能的实现方式中,所述前后视频特征向量提取模块具体用于:采用式1提取所述第一视频列表中的第j个视频vj的前后视频的特征向量f(vj+k);其中,vj+k表示所述第一视频列表中的第j+k个视频,K表示用于计算所述第j个视频vj对应的特征向量f(vj+k)的前后视频的个数,H(vj+k)表示所述第j+k个视频的初始向量;根据式2计算;对于上述装置,在一种可能的实现方式中,所述第一视频向量模型建立模块具体用于:根据式3建立所述第一视频向量模型;E(vj)=logp(vj|vj+k) 式3;其中,-K<k<K,k≠0,p(vj|vj+k)根据式4确定;p(vj|vj+k)=cosin[H(vj),f(vj+k)] 式4;其中,cosin[H(vj),f(vj+k)]表示H(vj)与f(vj+k)之间的余弦距离。对于上述装置,在一种可能的实现方式中,所述视频向量模型训练模块包括:随机数产生子模块,用于从区间(0,1)中产生一个随机数;视频样本采集子模块,用于若所述随机数落在区间Ii上,则将所述第一视频列表中的第i-1个视频作为所述视频样本;其中,Ii=(li-1,li),i=1,2...N,i表示观看次数区间,N表示所述观看次数区间的总个数,counter(vj)表示所述第一视频列表中的第j个视频被所有用户观看的总次数,表示所述第一视频列表中的所有视频被所有用户观看的总次数。有益效果通过采集目标用户的用户行为数据并生成第一视频列表,提取第一视频列表中各个视频的前后视频的特征向量以建立第一视频向量模型,采集视频样本训练第一视频向量模型得到第二视频向量模型,并根据第二视频向量模型对视频进行向量化,根据本专利技术实施例的视频向量化方法及装置无需对视频逐帧进行向量化,而是对视频的整体进行向量化,大大降低了视频向量化的数据量及噪声,提高了视频向量化的处理速度,且结合用户行为数据建立视频向量模型,从而使视频向量能够更准备地反映视频信息。根据下面参考附图对示例性实施例的详细说明,本专利技术的其它特征及方面将变得清楚。附图说明包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本专利技术的示例性实施例、特征和方面,并且用于解释本专利技术的原理。图1示出根据本专利技术一实施例的视频向量化方法的实现流程图;图2示出根据本专利技术一实施例的视频向量化方法步骤S101的一示例性的具体实现流程图;图3示出根据本专利技术另一实施例的视频向量化装置的结构框图;图4示出根据本专利技术另一实施例的视频向量化装置的一示例性的结构框图;图5示出了本专利技术的另一个实施例的一种视频向量化设备的结构框图。具体实施方式以下将参考附图详细说明本专利技术的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子本文档来自技高网...
【技术保护点】
一种视频向量化方法,其特征在于,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一视频列表;提取所述第一视频列表中的各个视频的前后视频的特征向量;根据所述各个视频的前后视频的特征向量建立第一视频向量模型;采集视频样本,并通过所述视频样本训练所述第一视频向量模型,得到第二视频向量模型;通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。
【技术特征摘要】
1.一种视频向量化方法,其特征在于,包括:采集目标用户的用户行为数据,并根据所述用户行为数据生成第一视频列表;提取所述第一视频列表中的各个视频的前后视频的特征向量;根据所述各个视频的前后视频的特征向量建立第一视频向量模型;采集视频样本,并通过所述视频样本训练所述第一视频向量模型,得到第二视频向量模型;通过所述第二视频向量模型对所述第一视频列表中的视频进行向量化。2.根据权利要求1所述的方法,其特征在于,采集目标用户的用户行为数据,根据所述用户行为数据生成第一视频列表,包括:采集指定时间段内的所述目标用户的所有用户行为数据;从所采集的用户行为数据中筛选出有效的用户行为数据;按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一视频列表。3.根据权利要求1所述的方法,其特征在于,提取所述第一视频列表中的各个视频的前后视频的特征向量,具体用于:采用式1提取所述第一视频列表中的第j个视频vj的前后视频的特征向量f(vj+k);其中,vj+k表示所述第一视频列表中的第j+k个视频,K表示用于计算所述第j个视频vj对应的特征向量f(vj+k)的前后视频的个数,H(vj+k)表示所述第j+k个视频的初始向量;根据式2计算;4.根据权利要求3所述的方法,其特征在于,根据所述各个视频的前后视频的特征向量建立第一视频向量模型,具体用于:根据式3建立所述第一视频向量模型;E(vj)=logp(vj|vj+k) 式3;其中,-K<k<K,k≠0,p(vj|vj+k)根据式4确定;p(vj|vj+k)=cosin[H(vj),f(vj+k)] 式4;其中,cosin[H(vj),f(vj+k)]表示H(vj)与f(vj+k)之间的余弦距离。5.根据权利要求1所述的方法,其特征在于,采集视频样本,包括:从区间(0,1)中产生一个随机数;若所述随机数落在区间Ii上,则将所述第一视频列表中的第i-1个视频作为所述视频样本;其中,Ii=(li-1,li),i=1,2...N,l0=0,i表示观看次数区间,N表示所述观看次数区间的总个数,counter(vj)表示所述第一视频列表中的第j个视频被所有用户观看的总次数,表示所述第一视频列表中的所有视频被所有用户观看的总次数。6.一种视频向量化装置,其特征在于,包括:第一视频列表生成模块,用于采集目标用户的用户...
【专利技术属性】
技术研发人员:刘荣,吴强,赵磊,单明辉,尹玉宗,姚键,潘柏宇,王冀,
申请(专利权)人:合一网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。