视频标题的提取方法及装置制造方法及图纸

技术编号：38433395 阅读：26 留言：0更新日期：2023-08-11 14:19

本申请提供视频标题的提取方法及装置，其中视频标题的提取方法包括：对待处理视频进行抽帧，获得至少一个视频帧，并对视频帧进行文本识别，获得视频帧包括的至少一个文本对象；根据设定文本过滤策略，从至少一个视频帧中确定候选视频帧，并确定候选视频帧包括的候选文本对象，其中，设定文本过滤策略基于待提取的目标标题设置；对不同候选视频帧包括的候选文本对象进行关联，获得候选标题集合；根据候选标题集合，确定待处理视频包括的目标标题。如此，通过待提取的目标标题对应的约束策略，可以滤除与待提取的目标标题不相关的文本内容，然后通过不同候选视频帧之间的文本对象追踪，可以滤除不同视频帧之间大量相同的冗余信息。可以滤除不同视频帧之间大量相同的冗余信息。可以滤除不同视频帧之间大量相同的冗余信息。

全部详细技术资料下载

【技术实现步骤摘要】
视频标题的提取方法及装置

[0001]本申请涉及视频处理
，特别涉及一种视频标题的提取方法。本申请同时涉及一种视频标题的提取装置，一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]随着计算机技术、网络技术和多媒体技术的快速发展，人们工作和生活中许多方面都会涉及到视频，相比于文字与图片，视频携带了更丰富、更具表现力的信息，从而越来越受到用户的关注和喜爱，各种视频层出不穷，视频化程度越来越高。在进行视频处理和分析时，往往需要对视频中的标题进行识别提取。
[0003]现有技术中，往往是基于文本框的纹理分析或压缩图像块，以定位文字区域，然后识别出文字区域的文字内容，作为最终识别出的标题信息。然而，上述方法中仅能利用现有的文字检测和文字识别方法，识别出视频包括的各个文本内容作为提取出的标题，导致提取出的标题复杂，包含多种冗余内容，准确率低，无法直接利用。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种视频标题的提取方法。本申请同时涉及一种视频标题的提取装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的提取出的标题复杂，包含多种冗余内容，准确率低，无法直接利用的技术问题。
[0005]根据本申请实施例的第一方面，提供了一种视频标题的提取方法，包括：
[0006]对待处理视频进行抽帧，获得至少一个视频帧，并对视频帧进行文本识别，获得视频帧包括的至少一个文本对象；
[0007]根据设定文本过滤策略，从至少一个视频帧中确定候选视频帧，...

【技术保护点】

【技术特征摘要】
1.一种视频标题的提取方法，其特征在于，包括：对待处理视频进行抽帧，获得至少一个视频帧，并对所述视频帧进行文本识别，获得所述视频帧包括的至少一个文本对象；根据设定文本过滤策略，从所述至少一个视频帧中确定候选视频帧，并确定所述候选视频帧包括的候选文本对象，其中，所述设定文本过滤策略基于待提取的目标标题设置；对不同候选视频帧包括的候选文本对象进行关联，获得候选标题集合；根据所述候选标题集合，确定所述待处理视频包括的目标标题。2.根据权利要求1所述的视频标题的提取方法，其特征在于，所述根据设定文本过滤策略，从所述至少一个视频帧中确定候选视频帧，并确定所述候选视频帧包括的候选文本对象，包括：根据各个视频帧包括的文本对象的数量，从所述至少一个视频帧中筛选所述候选视频帧；根据所述候选视频帧包括的文本对象的属性参数，筛选满足约束条件的候选文本对象。3.根据权利要求2所述的视频标题的提取方法，其特征在于，所述根据各个视频帧包括的文本对象的数量，从所述至少一个视频帧中筛选所述候选视频帧，包括：确定第一视频帧包括的文本对象的第一数量是否小于第一数量阈值，其中，所述第一视频帧为所述至少一个视频帧中的任一个；若是，则确定所述第一视频帧中设定区域内设定文本对象的第二数量，在所述第二数量小于第二数量阈值的情况下，将所述第一视频帧确定为所述候选视频帧，其中，所述设定文本对象为与所述目标标题的文本类型不同的文本对象。4.根据权利要求2所述的视频标题的提取方法，其特征在于，所述文本对象包括文本框和文本内容；所述根据所述候选视频帧包括的文本对象的属性参数，筛选满足约束条件的候选文本对象，包括：针对第一候选视频帧包括的各个文本对象，确定文本框满足第一过滤条件和/或文本内容满足第二过滤条件的参考文本对象；根据所述参考文本对象确定所述候选文本对象。5.根据权利要求4所述的视频标题的提取方法，其特征在于，所述根据所述参考文本对象确定所述候选文本对象，包括：针对所述第一候选视频帧的各个参考文本对象，确定文本框行高最大的目标参考文本对象；计算第一参考文本对象与所述目标参考文本对象中文本框的高度差，并确定出高度差小于差值阈值的第二参考文本对象，其中，所述第一参考文本对象为所述各个参考文本对象中除所述目标参考文本对象外的参考文本对象；从所述第二参考文本对象中确定满足位置约束的第三参考文本对象，将确定出的各个第三参考文本对象与所述目标参考文本对象合并，作为候选文本对象。6.根据权利要求1
‑
5任一项所述的视频标题的提取方法，其特征在于，所述对不同候选视频帧包括的候选文本对象进行关联，获得候选标题集合，包括：针对第二候选视频帧的第一候选文本对象，将所述第一候选文本对象与缓存中存储的
追踪文本对象组进行匹配，确定缓存中是否存在与所述第一候选文本对象匹配的第一追踪文本对象组，其中，所述第二候选视频帧为任一所述候选视频帧，所述第一候选文本对象为所述第二候选视频帧中任一候选文本对象；在确定出所述第一追踪文本对象组的情况下，将所述第一候选文本对象与所述第一追踪文本对象组合并，获得第二候选视...

【专利技术属性】
技术研发人员：冯舒扬，张婕蕾，
申请(专利权)人：上海哔哩哔哩科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人