视频标题的提取方法及装置制造方法及图纸

技术编号:38433395 阅读:19 留言:0更新日期:2023-08-11 14:19
本申请提供视频标题的提取方法及装置,其中视频标题的提取方法包括:对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象;根据设定文本过滤策略,从至少一个视频帧中确定候选视频帧,并确定候选视频帧包括的候选文本对象,其中,设定文本过滤策略基于待提取的目标标题设置;对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;根据候选标题集合,确定待处理视频包括的目标标题。如此,通过待提取的目标标题对应的约束策略,可以滤除与待提取的目标标题不相关的文本内容,然后通过不同候选视频帧之间的文本对象追踪,可以滤除不同视频帧之间大量相同的冗余信息。可以滤除不同视频帧之间大量相同的冗余信息。可以滤除不同视频帧之间大量相同的冗余信息。

【技术实现步骤摘要】
视频标题的提取方法及装置


[0001]本申请涉及视频处理
,特别涉及一种视频标题的提取方法。本申请同时涉及一种视频标题的提取装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着计算机技术、网络技术和多媒体技术的快速发展,人们工作和生活中许多方面都会涉及到视频,相比于文字与图片,视频携带了更丰富、更具表现力的信息,从而越来越受到用户的关注和喜爱,各种视频层出不穷,视频化程度越来越高。在进行视频处理和分析时,往往需要对视频中的标题进行识别提取。
[0003]现有技术中,往往是基于文本框的纹理分析或压缩图像块,以定位文字区域,然后识别出文字区域的文字内容,作为最终识别出的标题信息。然而,上述方法中仅能利用现有的文字检测和文字识别方法,识别出视频包括的各个文本内容作为提取出的标题,导致提取出的标题复杂,包含多种冗余内容,准确率低,无法直接利用。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种视频标题的提取方法。本申请同时涉及一种视频标题的提取装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的提取出的标题复杂,包含多种冗余内容,准确率低,无法直接利用的技术问题。
[0005]根据本申请实施例的第一方面,提供了一种视频标题的提取方法,包括:
[0006]对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象;
[0007]根据设定文本过滤策略,从至少一个视频帧中确定候选视频帧,并确定候选视频帧包括的候选文本对象,其中,设定文本过滤策略基于待提取的目标标题设置;
[0008]对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;
[0009]根据候选标题集合,确定待处理视频包括的目标标题。
[0010]根据本申请实施例的第二方面,提供了一种视频标题的提取装置,包括:
[0011]识别模块,被配置为对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象;
[0012]第一确定模块,被配置为根据设定文本过滤策略,从至少一个视频帧中确定候选视频帧,并确定候选视频帧包括的候选文本对象,其中,设定文本过滤策略基于待提取的目标标题设置;
[0013]关联模块,被配置为对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;
[0014]第二确定模块,被配置为根据候选标题集合,确定待处理视频包括的目标标题。
[0015]根据本申请实施例的第三方面,提供了一种计算设备,包括:
[0016]存储器和处理器;
[0017]存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,以实现上述的视频标题的提取方法的步骤。
[0018]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现任意上述的视频标题的提取方法的步骤。
[0019]本申请实施例提供的视频标题的提取方法,对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象;根据设定文本过滤策略,从至少一个视频帧中确定候选视频帧,并确定候选视频帧包括的候选文本对象,其中,设定文本过滤策略基于待提取的目标标题设置;对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;根据候选标题集合,确定待处理视频包括的目标标题。
[0020]这种情况下,先对视频进行抽帧,并对视频帧进行文本识别,获得每个视频帧包括的文本对象,然后可以基于待提取的目标标题对应的设定文本过滤策略,对视频帧进行过滤,获得候选视频帧,并确定候选视频帧包括的候选文本对象;之后,可以对不同候选视频帧包括的候选文本对象进行关联,以追踪在不同候选视频帧出现的相同文本对象,去除冗余,然后再确定待处理视频包括的目标标题。如此,通过待提取的目标标题对应的约束策略,可以滤除与待提取的目标标题不相关的文本内容,然后通过不同候选视频帧之间的文本对象追踪,可以滤除不同视频帧之间大量相同的冗余信息,节省计算量,从而可以准确、高效地提取出特定的目标标题,便于其他业务直接利用提取出的目标标题进行业务处理。
附图说明
[0021]图1是本申请一实施例提供的一种视频标题的提取方法的流程图;
[0022]图2是本申请一实施例提供的一种视频的中心标题的提取方法的处理流程图;
[0023]图3是本申请一实施例提供的一种视频标题的提取装置的结构示意图;
[0024]图4是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
[0025]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0026]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0027]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0028]首先,对本申请一个或多个实施例涉及的名词术语进行解释。
[0029]IOU:目标框之间的交集与并集之比。
[0030]在本申请中,提供了一种视频标题的提取方法,本申请同时涉及一种视频标题的提取装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0031]图1示出了根据本申请一实施例提供的一种视频标题的提取方法的流程图,具体包括以下步骤:
[0032]步骤102:对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象。
[0033]具体的,文本对象是指视频帧中文本的相关信息构成的数据组,该文本对象可以包括文本框和文本内容。
[0034]实际应用中,可以设置抽帧频率,如一秒一帧、一秒两帧等,根据该抽帧频率对待处理视频进行抽帧,可以获得抽取出的至少一个视频帧。具体实现时,可以利用视频编解码工具对视频进行抽帧,该视频编解码工具为提供录制、转换以及流化音视频的完整解决方案的工具,它包含了非常先进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频标题的提取方法,其特征在于,包括:对待处理视频进行抽帧,获得至少一个视频帧,并对所述视频帧进行文本识别,获得所述视频帧包括的至少一个文本对象;根据设定文本过滤策略,从所述至少一个视频帧中确定候选视频帧,并确定所述候选视频帧包括的候选文本对象,其中,所述设定文本过滤策略基于待提取的目标标题设置;对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;根据所述候选标题集合,确定所述待处理视频包括的目标标题。2.根据权利要求1所述的视频标题的提取方法,其特征在于,所述根据设定文本过滤策略,从所述至少一个视频帧中确定候选视频帧,并确定所述候选视频帧包括的候选文本对象,包括:根据各个视频帧包括的文本对象的数量,从所述至少一个视频帧中筛选所述候选视频帧;根据所述候选视频帧包括的文本对象的属性参数,筛选满足约束条件的候选文本对象。3.根据权利要求2所述的视频标题的提取方法,其特征在于,所述根据各个视频帧包括的文本对象的数量,从所述至少一个视频帧中筛选所述候选视频帧,包括:确定第一视频帧包括的文本对象的第一数量是否小于第一数量阈值,其中,所述第一视频帧为所述至少一个视频帧中的任一个;若是,则确定所述第一视频帧中设定区域内设定文本对象的第二数量,在所述第二数量小于第二数量阈值的情况下,将所述第一视频帧确定为所述候选视频帧,其中,所述设定文本对象为与所述目标标题的文本类型不同的文本对象。4.根据权利要求2所述的视频标题的提取方法,其特征在于,所述文本对象包括文本框和文本内容;所述根据所述候选视频帧包括的文本对象的属性参数,筛选满足约束条件的候选文本对象,包括:针对第一候选视频帧包括的各个文本对象,确定文本框满足第一过滤条件和/或文本内容满足第二过滤条件的参考文本对象;根据所述参考文本对象确定所述候选文本对象。5.根据权利要求4所述的视频标题的提取方法,其特征在于,所述根据所述参考文本对象确定所述候选文本对象,包括:针对所述第一候选视频帧的各个参考文本对象,确定文本框行高最大的目标参考文本对象;计算第一参考文本对象与所述目标参考文本对象中文本框的高度差,并确定出高度差小于差值阈值的第二参考文本对象,其中,所述第一参考文本对象为所述各个参考文本对象中除所述目标参考文本对象外的参考文本对象;从所述第二参考文本对象中确定满足位置约束的第三参考文本对象,将确定出的各个第三参考文本对象与所述目标参考文本对象合并,作为候选文本对象。6.根据权利要求1

5任一项所述的视频标题的提取方法,其特征在于,所述对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合,包括:针对第二候选视频帧的第一候选文本对象,将所述第一候选文本对象与缓存中存储的
追踪文本对象组进行匹配,确定缓存中是否存在与所述第一候选文本对象匹配的第一追踪文本对象组,其中,所述第二候选视频帧为任一所述候选视频帧,所述第一候选文本对象为所述第二候选视频帧中任一候选文本对象;在确定出所述第一追踪文本对象组的情况下,将所述第一候选文本对象与所述第一追踪文本对象组合并,获得第二候选视...

【专利技术属性】
技术研发人员:冯舒扬张婕蕾
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1