一种视频内容相似度的比较方法及装置制造方法及图纸

技术编号：31170570 阅读：24 留言：0更新日期：2021-12-04 13:32

本发明专利技术是视频内容相似度的比较方法及装置，装置包括视频预处理模块和对比模块，方法包括：步骤1：视频预处理；步骤2：分别提取文字信息作为视频内容分析的基础信息；步骤3：实体词提取；步骤4：词频表向量化；步骤5：余弦相似度计算；步骤6：相似度判断。本发明专利技术的优点：通过人工智能技术将视频内容进行结构化信息提取作为视频相似度对比的基础信息，可节省人力资源编目成本。还可提取出更为广泛的词用于视频内容相似度对比，应用领域广泛；将视频关键词词频字典列表转化为词频向量存入数据库作为视频的特征进行对比，相对视频抽帧方式即节约了存储资源，在对比效率上文字处理显而拥有巨大速度优势，且可实时比对，在应用层的用户体验较好。验较好。验较好。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频内容相似度的比较方法及装置

[0001]本专利技术涉及的是一种视频内容相似度的比较方法及装置，属于视频内容分析

技术介绍

[0002]现有技术中，视频内容相似度的匹配，通常是通过人工对视频进行关键词、简介等内容编目后，进行简单的关键词对比，会消耗非常多的人力资源，且基于过少的编目信息进行的相似度匹配准确性较低；随着互联网视频领域的迅速发展，视频媒体资源存储越来越庞大，而在视频推荐领域、视频分类领域、相似视频检索领域等都对视频相似度匹配方法有很高的应用性，而除了人工编目匹配外，视频关键帧对比方式的相似度对比需要消耗大量的计算资源，且在大量视频对比情况下，对比也非常耗时，无法满足即时要求。
[0003]现有技术中，对于上述视频内容相似度匹配方法所带来的不方便的问题，目前尚未提出有效解决方案。

技术实现思路

[0004]本专利技术提出的是一种视频内容相似度的比较方法及装置，其目的旨在克服现有技术存在的上述不足，有效实现视频内容相似度的判定。
[0005]本专利技术的技术解决方案：一种视频内容相似度的比较装置，其结构包括视频预处理模块和对比模块，
[0006]所述的视频预处理模块用于：
[0007]a)设置需要提取的视频内容，可控制是否选择音频信息提取、字幕信息提取；
[0008]b)对于设置字幕信息提取的，设置抽帧频率；
[0009]c)根据上述设置，对两个视频进行视频内容文字信息提取，并结构化；
[0010]所述的对比模块用于：r/>[0011]a)从视频预处理模块中得到的结构化文本信息中提取重要实体词；
[0012]b)将上述重要实体词进行词频向量化；
[0013]c)利用余弦相似度算法对两个视频内容进行比较。
[0014]一种视频内容相似度的比较方法，包括：
[0015]步骤1：视频预处理：对视频A、视频B两个视频分别都进行视频抽帧和音频提取，对视频抽帧得到的抽帧画面进行文字提取，对音频提取得到的音频文件进行文字提取；
[0016]步骤2：提取视频标题、文字识别、语音识别三个维度的文字信息，得到标题文本、字幕文本和语音识别文本，作为视频内容分析的基础信息；
[0017]步骤3：从多维度基础信息中抽取重要且合法的实体词，包括人物、时间、地点、组织机构、自定义短语词表，并统计这些实体词对应的出现次数，将实体词和出现次数组成关键词词频字典表；
[0018]步骤4：进行词频表向量化，将分别代表两组视频内容的两组待比较的关键词词频
字典表的关键词集合并成一个关键词集合，并分别计算两组关键词的词频向量，得到向量A、向量B，也就是关键词集合对应两组词集中每个关键词出现的次数；
[0019]步骤5：利用余弦相似度算法计算两个向量A、向量B之间夹角的余弦值，得出两组待比较的关键词词频字典相似度，即两组视频内容相似度；
[0020]步骤6：根据所述余弦值判断视频A、视频B的相似度，余弦值越大，两组视频内容相似度越高。
[0021]优选的，所述的步骤1中，使用视频处理工具ffmpeg进行视频抽帧和音频提取，对视频抽帧得到的抽帧画面通过OCR文字识别进行文字提取，对音频提取得到的音频文件通过ASR自动语音识别进行文字提取。
[0022]优选的，所述的步骤1中，对视频A、视频B两个视频的预处理在转码过程中进行，转码视频入库的同时，提取出关键词集合。
[0023]优选的，所述的步骤3中，使用分词工具jieba分词器从多维度基础信息中抽取重要且合法的实体词。
[0024]本专利技术的优点：1)通过人工智能技术将视频内容进行结构化信息提取，包括人名、地点、时间、组织等重要实体信息，作为视频相似度对比的基础信息，可节省人力资源编目成本。还可提取出更为广泛的词用于视频内容相似度对比，例如自定义事件、诗词、动植物等重要的实体词，在新闻、娱乐、体育、访谈、纪录片等视频推荐领域可广泛应用；
[0025]2)将视频关键词词频字典列表转化为词频向量存入数据库，这些向量作为视频的特征进行对比，相对视频抽帧方式的对比，即节约了存储资源，在对比效率上文字处理显而拥有巨大的速度优势，而且可以实时比对，在应用层的用户体验比较好。
附图说明
[0026]图1是本专利技术视频内容相似度的比较装置的结构框图。
[0027]图2是本专利技术视频内容相似度的比较方法的工作流程图。
具体实施方式
[0028]为了清楚了解本专利技术的技术方案，将在下面的描述中提出其详细的结构。显然，本专利技术实施例的具体施行并不足限于本领域的技术人员所熟习的特殊细节。本专利技术的优选实施例详细描述如下，除详细描述的这些实施例外，还可以具有其他实施方式。
[0029]下面结合附图和实施例对本专利技术作进一步详细说明。
[0030]如图1所示，一种视频内容相似度的比较装置，其结构包括视频预处理模块和对比模块，
[0031]所述的视频预处理模块用于：
[0032]a)设置需要提取的视频内容(可控制是否选择音频信息提取、字幕信息提取)；
[0033]b)对于设置字幕信息提取的，设置抽帧频率；
[0034]c)根据上述设置对两个视频进行视频内容文字信息提取，并结构化；
[0035]所述的对比模块用于：
[0036]a)从视频预处理模块中得到的结构化文本信息中提取重要实体词；
[0037]b)将上述重要实体词进行词频向量化；
[0038]c)利用余弦相似度算法对两个视频内容进行比较。
[0039]如图2所示，一种视频内容相似度的比较方法，其整个工作流程如下：
[0040]步骤1：视频预处理：对两个视频(视频A、视频B)使用视频处理工具ffmpeg分别都进行视频抽帧和音频提取，对视频抽帧得到的抽帧画面通过OCR文字识别进行文字提取，对音频提取得到的音频文件通过ASR 自动语音识别进行文字提取(转码过程中进行预处理，转码视频入库同时提取出关键词集合)；
[0041]步骤2：提取视频标题、文字识别、语音识别三个维度的文字信息，得到标题文本、字幕文本和语音识别文本，作为视频内容分析的基础信息；
[0042]步骤3：使用分词工具jieba分词器从多维度基础信息中抽取重要且合法的实体词，包括人物、时间、地点、组织机构、自定义短语词表，并统计这些实体词对应的出现次数，将实体词和出现次数组成关键词词频字典表；
[0043]步骤4：进行词频表向量化，将两组待比较的关键词词频字典表(分别代表两组视频内容)的关键词集合并成一个关键词集合，并分别计算两组关键词的词频向量(得到向量A、向量B)，也就是关键词集合对应两组词集中每个关键词出现的次数；
[0044]例如：
[0045]关键词集合：
[0046]{"日本队":1,"乌龙":2,"远射":1,"任意球":3,"国际足球":3,"世预赛":2,"澳大利亚队":1,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频内容相似度的比较装置，其特征包括视频预处理模块和对比模块，所述的视频预处理模块用于：a)设置需要提取的视频内容，可控制是否选择音频信息提取、字幕信息提取；b)对于设置字幕信息提取的，设置抽帧频率；c)根据上述设置，对两个视频进行视频内容文字信息提取，并结构化；所述的对比模块用于：a)从视频预处理模块中得到的结构化文本信息中提取重要实体词；b)将上述重要实体词进行词频向量化；c)利用余弦相似度算法对两个视频内容进行比较。2.一种视频内容相似度的比较方法，其特征是包括：步骤1：视频预处理：对视频A、视频B两个视频分别都进行视频抽帧和音频提取，对视频抽帧得到的抽帧画面进行文字提取，对音频提取得到的音频文件进行文字提取；步骤2：提取视频标题、文字识别、语音识别三个维度的文字信息，得到标题文本、字幕文本和语音识别文本，作为视频内容分析的基础信息；步骤3：从多维度基础信息中抽取重要且合法的实体词，包括人物、时间、地点、组织机构、自定义短语词表，并统计这些实体词对应的出现次数，将实体词和出现次数组成关键词词频字典表；步骤4：进行词频表向量化，将分别代...

【专利技术属性】
技术研发人员：韩凯，黄建杰，
申请(专利权)人：央视国际网络无锡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人