内容项投放方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：26798217 阅读：25 留言：0更新日期：2020-12-22 17:15

本公开关于一种内容项投放方法、装置、计算机设备及存储介质。通过获取待过滤视频数据和内容项数据；确定相同视频类别的待过滤视频数据和内容项数据之间的相似度；将相似度小于目标阈值的视频数据从待过滤视频数据中滤除，获得过滤后的视频数据；基于过滤后的视频数据对应的用户行为数据，进行内容项投放。本公开的实施例通过基于待过滤视频数据与内容项数据之间的相似程度，来确定待过滤视频数据中噪声数据，并将确定出的噪声数据过滤，减少了噪声数据对用户行为数据分析过程中的负面影响，有效地解决了目标内容项数据的稀疏性问题，从而实现了内容项的精准投放。

全部详细技术资料下载

【技术实现步骤摘要】
内容项投放方法、装置、计算机设备及存储介质
本公开涉及定向投放
，尤其涉及一种内容项投放方法、装置、计算机设备及存储介质。
技术介绍
随着互联网技术与业务的发展，为了实现例如广告等内容项的精准定向投放，需要采集用户对于内容项的用户行为数据，基于该行为数据确定出用户偏好，并投放与用户偏好相对应的内容项，然而，在该用户行为数据中，通常会存在大量的数值缺失或者数值为零的情况，导致数据稀疏性较大，基于这种稀疏性较大的数据所分析出的用户偏好通常是不准确的，最终会导致向用户推送了用户不感兴趣的内容项，造成资源浪费。目前，为了解决上述问题，通常会在分析用户偏好的过程中引入其它领域的用户行为数据，以达到降低用户行为数据的稀疏性。但是，如果将其它领域内的用户行为数据全量引入，虽然解决了用户行为数据稀疏的问题，但所引入的用户行为数据并不一定全部具备分析价值，也就导致了引入大量行为噪声，反而影响用户偏好挖掘的准确性，从而影响了内容项投放的准确性。
技术实现思路
本公开提供一种内容项投放方法、装置、计算机设备及存储介质，以至少解决相关技术中目标领域中引入了大量行为噪声而导致影响用户偏好挖掘的准确性以及影响了内容项投放的准确性的问题。本公开的技术方案如下：根据本公开实施例的第一方面，提供一种内容项投放方法，包括获取待过滤视频数据和内容项数据；确定相同视频类别的待过滤视频数据和内容项数据之间的相似度；将相似度小于目标阈值的视频数据从待过滤视频数据中滤除，获得过滤后的视频数...

【技术保护点】
1.一种内容项投放方法，其特征在于，包括：/n获取待过滤视频数据和内容项数据；/n确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度；/n将所述相似度小于目标阈值的视频数据从所述待过滤视频数据中滤除，获得过滤后的视频数据；/n基于所述过滤后的视频数据对应的用户行为数据，进行内容项投放。/n

【技术特征摘要】
1.一种内容项投放方法，其特征在于，包括：
获取待过滤视频数据和内容项数据；
确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度；
将所述相似度小于目标阈值的视频数据从所述待过滤视频数据中滤除，获得过滤后的视频数据；
基于所述过滤后的视频数据对应的用户行为数据，进行内容项投放。

2.根据权利要求1所述的方法，其特征在于，所述确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度包括：
对于一个视频类别，获取所述视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度；其中，所述待过滤视频特征向量为待过滤视频数据的特征向量；所述内容项特征向量为内容项数据的特征向量。

3.根据权利要求2所述的方法，其特征在于，所述获取所述视频类别对应的待过滤视频特征向量和内容项特征向量之间的相似度，包括：
对所述待过滤视频特征向量和所述内容项特征向量进行点积运算，得到所述待过滤视频特征向量与所述内容项特征向量的余弦值；
基于所述余弦值确定为所述相似度。

4.根据权利要求2所述的方法，其特征在于，所述确定相同视频类别的所述待过滤视频数据和所述内容项数据之间的相似度之前，包括：
基于各个待过滤视频数据中的图像帧进行特征提取，得到所述各个待过滤视频数据的特征向量；
基于所述各个待过滤视频数据的特征向量，对所述各个待过滤视频数据的特征向量进行分类，得到多个待过滤视频特征向量以及各个待过滤视频特征向量对应的视频类别；以及
基于各个内容项数据中的图像帧进行特征提取，得到所述各个内容项数据的特征向量；
基于所述各个内容项数据的特征向量，对所述各个内容项数据的特征向量进行分类，得到多个内容项特征向量以及各个内容项特征向量对应的视频类别。

5.根据权利要求1所述的方法，其特征在于，所述基于...

【专利技术属性】
技术研发人员：姚舰航，高小平，王利，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人