一种基于大数据的视频筛选方法和装置制造方法及图纸

技术编号:29703414 阅读:12 留言:0更新日期:2021-08-17 14:31
本发明专利技术涉及一种基于大数据的视频筛选方法和装置,根据用户信息,获取与用户信息相关的初始视频集,对于初始视频集中的任意一个初始视频,根据筛选模型获取初始视频的第一特征向量,根据损失预测模型获取第一特征向量的第一损失预测结果,根据各初始视频对应的第一损失预测结果,从初始视频集中筛选出第一中间视频,结合第一中间视频和用户特征数据,从第一中间视频中筛选出第二中间视频,因此,对初始视频集按照不同的筛选规则进行两层筛选,相较于现有的视频筛选方法,准确度得到很大的提升。

【技术实现步骤摘要】
一种基于大数据的视频筛选方法和装置
本专利技术涉及一种基于大数据的视频筛选方法和装置。
技术介绍
随着大数据的应用逐渐成熟,在通过视频APP播放视频时,后台服务器会根据用户的相关数据对后台服务器中存储的大量视频进行筛选,从中筛选出用户可能感兴趣的视频,并向用户推荐。然而,目前的视频筛选方法通常是根据用户在注册时填写的关注视频领域或者根据用户已播放的历史记录进行筛选,准确度较低,可能会筛选出一些无关的视频,或者将密切相关的视频漏掉。
技术实现思路
为了解决现有的视频筛选方法的准确度较低的问题,本专利技术提供一种基于大数据的视频筛选方法和装置。一种基于大数据的视频筛选方法,包括:根据用户信息,获取与所述用户信息相关的初始视频集,所述初始视频集包括至少两个初始视频;对于所述初始视频集中的任意一个初始视频,根据预设的筛选模型,获取所述初始视频的第一特征向量;根据预设的损失预测模型,获取所述第一特征向量的第一损失预测结果;根据各初始视频对应的第一损失预测结果,从所述初始视频集中筛选出第一中间视频;根据所述用户信息,获取所述用户的用户特征数据;结合所述第一中间视频和所述用户特征数据,从所述第一中间视频中筛选出第二中间视频。进一步地,所述用户信息包括所述用户的历史视频播放记录;所述根据用户信息,获取与所述用户信息相关的初始视频集,具体为:根据所述历史视频播放记录,获取与所述历史视频播放记录中记录的各个视频相同领域和相关领域的视频,获取到的视频构成所述初始视频集。进一步地,所述筛选模型包括至少两个卷积层,每一个卷积层均能够输出一个第一特征向量;所述根据预设的筛选模型,获取所述初始视频的第一特征向量,具体为:根据所述筛选模型中的卷积层,获得所述初始视频的第一特征向量;所述损失预测模型包括至少两个损失预测子模型和分类器,各损失预测子模型与各卷积层一一对应,每一个损失预测子模型的输入为对应的卷积层所输出的第一特征向量;所述根据预设的损失预测模型,获取所述第一特征向量的第一损失预测结果,具体为:对于任意一个第一特征向量,将该第一特征向量输入至该第一特征向量对应的损失预测子模型中,获得该损失预测子模型针对该第一特征向量所输出的第一向量;对得到的各个第一向量进行整合处理,得到第二向量;根据所述第二向量和所述分类器,获得所述第一损失预测结果。进一步地,各初始视频对应的第一损失预测结果包括各初始视频对应的预测损失值;所述根据各初始视频对应的第一损失预测结果,从所述初始视频集中筛选出第一中间视频,具体为:比较各初始视频对应的预测损失值与预设损失门限值,根据比较结果获取大于或者等于所述预设损失门限值的预测损失值对应的初始视频,得到所述第一中间视频。进一步地,所述根据所述用户信息,获取所述用户的用户特征数据,具体为:根据所述用户信息,获取所述用户的可能感兴趣视频领域,所述可能感兴趣视频领域包括所述用户已关注的视频领域,以及与所述用户已关注的视频领域相关联的关联视频领域;所述结合所述第一中间视频和所述用户特征数据,从所述第一中间视频中筛选出第二中间视频,具体为:根据所述可能感兴趣视频领域,获取所述第一中间视频中处于所述可能感兴趣视频领域的视频,得到所述第二中间视频。进一步地,所述关联视频领域的获取过程,具体为:根据预设的视频领域知识图谱,获取所述用户已关注的视频领域与所述视频领域知识图谱中的其他各视频领域的关联度;比较各关联度与预设关联度门限值,根据比较结果获取大于或者等于所述预设关联度门限值的目标关联度,并获取与所述目标关联度相对应的视频领域,得到所述关联视频领域。一种基于大数据的视频筛选装置,包括存储器和处理器,以及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的基于大数据的视频筛选方法。本专利技术的有益效果为:先根据用户信息,获取与用户信息相关的初始视频集,然后根据预设的筛选模型和损失预测模型,进行特征向量的获取以及损失预测结果的获取,根据初始视频集中的各初始视频对应的第一损失预测结果,从初始视频集中筛选出第一中间视频,然后,根据用户信息获取用户的用户特征数据,最后结合第一中间视频和用户特征数据,从第一中间视频中筛选出第二中间视频。因此,本专利技术提供的基于大数据的视频筛选方法先获取初始视频集,然后结合预设的筛选模型和损失预测模型,从初始视频集中筛选出第一中间视频,接着根据用户特征数据从第一中间视频筛选出第二中间视频,对初始视频集按照不同的筛选规则先后进行两层筛选,相较于现有的视频筛选方法,准确度得到很大的提升,而且不会漏掉一些密切相关的视频。附图说明图1是一种基于大数据的视频筛选方法的流程图。具体实施方式本实施例提供一种基于大数据的视频筛选方法,该视频筛选方法可以用于计算机或者智能终端设备。如图1所示,该视频筛选方法包括如下步骤:步骤S1:根据用户信息,获取与所述用户信息相关的初始视频集,所述初始视频集包括至少两个初始视频:根据用户信息,获取与用户信息相关的初始视频集,初始视频集包括至少两个初始视频。应当理解,初始视频集中通常包括大量待筛选的初始视频。初始视频集可以从对应的后台服务器中获取。用户信息由实际需要进行具体设置,本实施例中,用户信息包括用户的历史视频播放记录,还可以包括用户的个人信息,比如用户在注册时填写的关注视频领域。应当理解,在用户登陆对应账号之后,每播放一个视频,后台就会记录该视频的播放记录,构成历史视频播放记录。而且,历史视频播放记录对应的时间段长度由实际需要进行设置,比如:半年或者一年。那么,根据历史视频播放记录,获取与历史视频播放记录中记录的各个视频相同领域和相关领域的视频,获取到的视频构成初始视频集。具体地:根据历史视频播放记录,获取历史视频播放记录中记录的各个视频的领域,然后获取与各个视频领域相关的领域,相关的领域可以根据后台服务器中预先设置的领域关系数据库获取得到,领域关系数据库包括目前已知的所有视频领域中各个领域之间的关系。那么,只要与历史视频播放记录中记录的各个视频领域有关的领域均为相关的领域。然后,从后台服务器中获取到与历史视频播放记录中记录的各个视频相同领域和相关领域的视频,获取到的视频构成初始视频集。作为其他的实施方式,初始视频集可以直接包括后台服务器中存储的所有视频。步骤S2:对于所述初始视频集中的任意一个初始视频,根据预设的筛选模型,获取所述初始视频的第一特征向量:预设有一个筛选模型,该筛选模型用于根据初始视频得到对应的第一特征向量,因此,筛选模型为用于提取视频特征向量的网络模型,可以根据实际需要进行构建,也可以直接使用现有的具有特征向量提取功能的网络模型。筛选模型的具体类型由实际需要进行设置,比如卷积神经网络模型。筛选模型可以本文档来自技高网...

【技术保护点】
1.一种基于大数据的视频筛选方法,其特征在于,包括:/n根据用户信息,获取与所述用户信息相关的初始视频集,所述初始视频集包括至少两个初始视频;/n对于所述初始视频集中的任意一个初始视频,根据预设的筛选模型,获取所述初始视频的第一特征向量;/n根据预设的损失预测模型,获取所述第一特征向量的第一损失预测结果;/n根据各初始视频对应的第一损失预测结果,从所述初始视频集中筛选出第一中间视频;/n根据所述用户信息,获取所述用户的用户特征数据;/n结合所述第一中间视频和所述用户特征数据,从所述第一中间视频中筛选出第二中间视频。/n

【技术特征摘要】
1.一种基于大数据的视频筛选方法,其特征在于,包括:
根据用户信息,获取与所述用户信息相关的初始视频集,所述初始视频集包括至少两个初始视频;
对于所述初始视频集中的任意一个初始视频,根据预设的筛选模型,获取所述初始视频的第一特征向量;
根据预设的损失预测模型,获取所述第一特征向量的第一损失预测结果;
根据各初始视频对应的第一损失预测结果,从所述初始视频集中筛选出第一中间视频;
根据所述用户信息,获取所述用户的用户特征数据;
结合所述第一中间视频和所述用户特征数据,从所述第一中间视频中筛选出第二中间视频。


2.根据权利要求1所述的基于大数据的视频筛选方法,其特征在于,所述用户信息包括所述用户的历史视频播放记录;
所述根据用户信息,获取与所述用户信息相关的初始视频集,具体为:
根据所述历史视频播放记录,获取与所述历史视频播放记录中记录的各个视频相同领域和相关领域的视频,获取到的视频构成所述初始视频集。


3.根据权利要求1所述的基于大数据的视频筛选方法,其特征在于,所述筛选模型包括至少两个卷积层,每一个卷积层均能够输出一个第一特征向量;
所述根据预设的筛选模型,获取所述初始视频的第一特征向量,具体为:
根据所述筛选模型中的卷积层,获得所述初始视频的第一特征向量;
所述损失预测模型包括至少两个损失预测子模型和分类器,各损失预测子模型与各卷积层一一对应,每一个损失预测子模型的输入为对应的卷积层所输出的第一特征向量;
所述根据预设的损失预测模型,获取所述第一特征向量的第一损失预测结果,具体为:
对于任意一个第一特征向量,将该第一特征向量输入至该第一特征向量对应的损失预测子模型中,获得该损失预测子模型针对该第一特征向量所输出的第一向量;
对得到的各个第一向量进行整合处理,得到第二向...

【专利技术属性】
技术研发人员:干少明张怀
申请(专利权)人:洛阳墨潇网络科技有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1