原版视频识别方法及装置制造方法及图纸

技术编号：25950930 阅读：16 留言：0更新日期：2020-10-17 03:43

本申请实施例公开了一种原版视频识别方法及装置，方法包括：获取待处理的多个视频的特征信息，所述特征信息包括标题和封面；对所述多个视频的特征信息进行聚类得到多个视频封面类簇；获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度；根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频。采用本申请，能实现从大量短视频中准确识别出原版短视频，以此保障原版视频识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
原版视频识别方法及装置
本申请涉及计算机
，尤其涉及一种原版视频识别方法及装置。
技术介绍
随着短视频生态的发展，同一个短视频往往会在不同的平台由不同的用户上传或者转载。这里的转载有些是对原版短视频来源logo做一些变化处理，或者将封面图进行较小范围的重新编辑后，重新上传。而有些则是原版视频相关内容的进一步发酵、模仿甚至使用原版的BGM却套上了原版短视频标题关键词等。如下以近期流行的“黑人抬棺”短视频为例说明：在搜索或者推荐等信息分发场景下，当用户想看原版“黑人抬棺”时如何从不同数据源中找到最初引起广泛传播的原版短视频就显得尤为重要。目前，针对大量相关的短视频，用户想要获取最原始被广泛传播的原版视频时，更多的是通过判断视频标题中是否“原版”等关键词来识别该视频是否为原版短视频。但在视频传播的过程中，视频标题经过篡改和进一步的模仿、加工。很多非原版视频的标题中可能也具有“原版”标记。因此用户仅通过视频标题中的“原版”标记，来识别该视频是否为原版视频，识别的准确度很低，识别出的结果也并不可靠。
技术实现思路
本申请实施例提供了一种原版视频识别方法及装置，能实现从大量短视频中准确识别出原版短视频，以此保障原版视频识别的的准确度。第一方面，本申请实施例提供了一种原版视频识别方法，所述方法包括：获取待处理的多个视频的特征信息，所述特征信息包括标题和封面；对所述多个视频的特征信息进行聚类得到多个视频封面类簇；获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封...

【技术保护点】
1.一种原版视频识别方法，其特征在于，所述方法包括：/n获取待处理的多个视频的特征信息，所述特征信息包括标题和封面；/n对所述多个视频的特征信息进行聚类得到多个视频封面类簇；/n获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度；/n根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频。/n

【技术特征摘要】
1.一种原版视频识别方法，其特征在于，所述方法包括：
获取待处理的多个视频的特征信息，所述特征信息包括标题和封面；
对所述多个视频的特征信息进行聚类得到多个视频封面类簇；
获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度；
根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频。

2.根据权利要求1所述的方法，其特征在于，所述多个视频封面类簇中每个视频封面类簇包括的视频的数量达到第一数量阈值，所述根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频，包括：
针对所述每个视频封面类簇，获取所述相似度达到相似度阈值的视频在所述每个视频封面类簇中的数量占比；
确定所述每个视频封面类簇中对应的数量占比最高的多个候选视频；
根据发布时间从所述多个候选视频中确定出原版视频。

3.根据权利要求2所述的方法，其特征在于，所述根据发布时间从所述多个候选视频中确定出原版视频，包括：
比较所述每个视频封面类簇中对应的数量占比最高的多个候选视频的发布时间；
将发布时间最早的候选视频作为原版视频。

4.根据权利要求1所述的方法，其特征在于，所述对所述多个视频的特征信息进行聚类得到多个视频封面类簇，包括：
对所述多个视频的标题进行文本聚类得到多个视频标题类簇；
根据所述多个视频标题类簇确定目标视频集合；
对所述目标视频集合中的视频的封面进行图像聚类得到多个视频封面类簇。

5.根据权利要求4所述的方法，其特征在于，所述对所述多个视频的标题进行文本聚类得到多个视频标题类簇，包括：
对所述多个视频中的每个视频的标题进行向量化处理，得到与所述多个视频的标题对应的多个标题向量；
对所述多个标题向量进行文本聚类得到多个视频标题类簇。

<...

【专利技术属性】
技术研发人员：康战辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人