内容项投放方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26798217 阅读:25 留言:0更新日期:2020-12-22 17:15
本公开关于一种内容项投放方法、装置、计算机设备及存储介质。通过获取待过滤视频数据和内容项数据;确定相同视频类别的待过滤视频数据和内容项数据之间的相似度;将相似度小于目标阈值的视频数据从待过滤视频数据中滤除,获得过滤后的视频数据;基于过滤后的视频数据对应的用户行为数据,进行内容项投放。本公开的实施例通过基于待过滤视频数据与内容项数据之间的相似程度,来确定待过滤视频数据中噪声数据,并将确定出的噪声数据过滤,减少了噪声数据对用户行为数据分析过程中的负面影响,有效地解决了目标内容项数据的稀疏性问题,从而实现了内容项的精准投放。

【技术实现步骤摘要】
内容项投放方法、装置、计算机设备及存储介质
本公开涉及定向投放
,尤其涉及一种内容项投放方法、装置、计算机设备及存储介质。
技术介绍
随着互联网技术与业务的发展,为了实现例如广告等内容项的精准定向投放,需要采集用户对于内容项的用户行为数据,基于该行为数据确定出用户偏好,并投放与用户偏好相对应的内容项,然而,在该用户行为数据中,通常会存在大量的数值缺失或者数值为零的情况,导致数据稀疏性较大,基于这种稀疏性较大的数据所分析出的用户偏好通常是不准确的,最终会导致向用户推送了用户不感兴趣的内容项,造成资源浪费。目前,为了解决上述问题,通常会在分析用户偏好的过程中引入其它领域的用户行为数据,以达到降低用户行为数据的稀疏性。但是,如果将其它领域内的用户行为数据全量引入,虽然解决了用户行为数据稀疏的问题,但所引入的用户行为数据并不一定全部具备分析价值,也就导致了引入大量行为噪声,反而影响用户偏好挖掘的准确性,从而影响了内容项投放的准确性。
技术实现思路
本公开提供一种内容项投放方法、装置、计算机设备及存储介质,以至少解决相关技术中目标领域中引入了大量行为噪声而导致影响用户偏好挖掘的准确性以及影响了内容项投放的准确性的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种内容项投放方法,包括获取待过滤视频数据和内容项数据;确定相同视频类别的待过滤视频数据和内容项数据之间的相似度;将相似度小于目标阈值的视频数据从待过滤视频数据中滤除,获得过滤后的视频数据;基于过滤后的视频数据对应的用户行为数据,进行内容项投放。在一种可能的实现方式中,上述确定相同视频类别的待过滤视频数据和内容项数据之间的数据相似度包括:对于一个视频类别,获取视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度;其中,待过滤视频特征向量为待过滤视频数据的特征向量;内容项特征向量为内容项数据的特征向量。在一种可能的实现方式中,上述获取视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度,包括:对待过滤视频特征向量和内容项特征向量进行点积运算,得到待过滤视频特征向量与内容项特征向量的余弦值;基于余弦值确定为相似度。在一种可能的实现方式中,上述确定相同视频类别的待过滤视频数据和内容项数据之间的相似度之前,包括:基于各个待过滤视频数据中的图像帧进行特征提取,得到各个待过滤视频数据的特征向量;基于各个待过滤视频数据的特征向量,对各个待过滤视频数据的特征向量进行分类,得到多个待过滤视频特征向量以及各个待过滤视频特征向量对应的视频类别;以及基于各个内容项数据中的图像帧进行特征提取,得到各个内容项数据的特征向量;基于各个内容项数据的特征向量,对各个内容项数据的特征向量进行分类,得到多个内容项特征向量以及各个内容项特征向量对应的视频类别。在一种可能的实现方式中,上述基于过滤后的视频数据对应的用户行为数据,进行内容项投放,包括:结合过滤后的视频数据对应的用户行为数据和内容项数据对应的用户行为数据,确定出用户偏好;基于用户偏好,进行内容项投放。在一种可能的实现方式中,上述结合过滤后的视频数据对应的用户行为数据和内容项数据对应的用户行为数据,确定出用户偏好,包括:将过滤后的视频数据对应的用户行为数据映射为内容项数据的用户行为数据;基于映射后的用户行为数据和内容项数据对应的用户行为数据,确定出用户偏好。在一种可能的实现方式中,上述基于用户偏好,进行内容项投放,包括:获得用户偏好权重表,用户偏好权重表包括多个用户偏好所对应的权重取值;基于用户偏好权重表,确定出用户偏好权重;基于用户偏好权重,投放与用户行为偏好权重相对应的内容项。根据本公开实施例的第二方面,提供一种内容项投放装置,包括:获取单元,被配置为获取待过滤视频数据和内容项数据;确定单元,被配置为确定相同视频类别的待过滤视频数据和内容项数据之间的数据相似度;过滤单元,被配置为将相似度小于目标阈值的视频数据从待过滤视频数据中滤除,获得过滤后的视频数据;投放单元,被配置为基于过滤后的视频数据以及对应的用户行为数据,进行内容项投放。在一种可能的实现方式中,上述确定单元具体被配置为:对于一个视频类别,获取视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度;其中,待过滤视频特征向量为待过滤视频数据的特征向量;内容项特征向量为内容项数据的特征向量。在一种可能的实现方式中,上述确定单元具体被配置为:对待过滤视频特征向量和内容项特征向量进行点积运算,得到待过滤视频特征向量与内容项特征向量的余弦值;基于余弦值确定为相似度。在一种可能的实现方式中,上述装置还包括:特征提取单元,被配置为基于各个待过滤视频数据中的图像帧进行特征提取,得到各个待过滤视频数据的特征向量;基于各个待过滤视频数据的特征向量,对各个待过滤视频数据的特征向量进行分类,得到多个待过滤视频特征向量以及各个待过滤视频特征向量对应的视频类别;以及基于各个内容项数据中的图像帧进行特征提取,得到各个内容项数据的特征向量;基于各个内容项数据的特征向量,对各个内容项数据的特征向量进行分类,得到多个内容项特征向量以及各个内容项特征向量对应的视频类别。在一种可能的实现方式中,上述投放单元被配置为:结合过滤后的视频数据对应的用户行为数据和内容项数据对应的用户行为数据,确定出用户偏好;基于用户偏好,进行内容项投放。在一种可能的实现方式中,上述投放单元被配置为:将过滤后的视频数据对应的用户行为数据映射为内容项数据的用户行为数据;基于映射后的用户行为数据和内容项数据对应的用户行为数据,确定出用户偏好。在一种可能的实现方式中,上述投放单元被配置为:获得用户偏好权重表,用户偏好权重表包括多个用户偏好所对应的权重取值;基于用户偏好权重表,确定出用户偏好权重;基于用户偏好权重,投放与用户行为偏好权重相对应的内容项。根据本公开实施例的第三方面,提供一种计算机设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现如上述任一项的内容项投放方法。根据本公开实施例的第四方面,提供一种存储介质,当存储介质中的指令由计算机设备的处理器执行时,使得计算机设备能够执行如上述任一项的内容项投放方法。根据本公开实施例的第五方面,提供一种计算机程序产品,包括可执行指令,当计算机程序产品中的指令由计算机设备的处理器执行时,使得计算机设备能够执行如上述任一项的内容项投放方法。本公开的实施例提供的技术方案至少带来以下有益效果:通过基于待过滤视频数据与目标内容项数据之间的相似程度,来确定出待过滤视频数据中噪声数据,并将确定出的噪声数据过滤,减少了噪本文档来自技高网...

【技术保护点】
1.一种内容项投放方法,其特征在于,包括:/n获取待过滤视频数据和内容项数据;/n确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度;/n将所述相似度小于目标阈值的视频数据从所述待过滤视频数据中滤除,获得过滤后的视频数据;/n基于所述过滤后的视频数据对应的用户行为数据,进行内容项投放。/n

【技术特征摘要】
1.一种内容项投放方法,其特征在于,包括:
获取待过滤视频数据和内容项数据;
确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度;
将所述相似度小于目标阈值的视频数据从所述待过滤视频数据中滤除,获得过滤后的视频数据;
基于所述过滤后的视频数据对应的用户行为数据,进行内容项投放。


2.根据权利要求1所述的方法,其特征在于,所述确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度包括:
对于一个视频类别,获取所述视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度;其中,所述待过滤视频特征向量为待过滤视频数据的特征向量;所述内容项特征向量为内容项数据的特征向量。


3.根据权利要求2所述的方法,其特征在于,所述获取所述视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度,包括:
对所述待过滤视频特征向量和所述内容项特征向量进行点积运算,得到所述待过滤视频特征向量与所述内容项特征向量的余弦值;
基于所述余弦值确定为所述相似度。


4.根据权利要求2所述的方法,其特征在于,所述确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度之前,包括:
基于各个待过滤视频数据中的图像帧进行特征提取,得到所述各个待过滤视频数据的特征向量;
基于所述各个待过滤视频数据的特征向量,对所述各个待过滤视频数据的特征向量进行分类,得到多个待过滤视频特征向量以及各个待过滤视频特征向量对应的视频类别;以及
基于各个内容项数据中的图像帧进行特征提取,得到所述各个内容项数据的特征向量;
基于所述各个内容项数据的特征向量,对所述各个内容项数据的特征向量进行分类,得到多个内容项特征向量以及各个内容项特征向量对应的视频类别。


5.根据权利要求1所述的方法,其特征在于,所述基于...

【专利技术属性】
技术研发人员:姚舰航高小平王利
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1