基于字幕信息的视频自动切分及标注方法及系统技术方案

技术编号:8108168 阅读:218 留言:0更新日期:2012-12-21 14:31
本发明专利技术公开了基于字幕信息的视频自动切分及标注方法及系统,其特征在于对视频中的字幕信息进行提取,并基于字幕信息对视频进行碎片化处理,其包括以下步骤:(1)利用视频字幕信息提取技术,将视频中的字幕信息提取出来,具体包括字幕的时间信息及文字信息;(2)根据字幕的出现时间和下段字幕的出现时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注,本发明专利技术结合字幕提取技术与视频切分技术,提出了基于字幕信息的视频自动切分及标注方法,实现视频内容的自动化切分及标注,可以用于视频内容的碎片化处理、视频内容的编目、检索等技术领域。

【技术实现步骤摘要】

本专利技术涉及可以用于视频内容的碎片化处理、视频内容的编目、检索等
,尤其涉及基于字幕信息的视频自动切分及标注方法及系统
技术介绍
网络时代最明显的特征就是传播的碎片化。在社区化时代到来的如今,由微博引领的信息碎片化传播已经逐步深入人心,“短小精悍”日益成为内容传播和分享的精髓。在视频行业,以分享、编目及检索为目的的技术创新正在以同样的方式,将视频传播带入碎片化时代。视频中的文字信息无疑是实现这些需求的重要线索。 传统的视频切分是由人工完成的,需要耗费大量的人力与时间。基于字幕信息的视频自动切分及标注技术可将视频内容快速、准确、自动地切分,实现视频内容的碎片化。
技术实现思路
针对上述技术缺陷,本专利技术提出一种于字幕信息的视频自动切分及标注方法及系统。为了解决上述技术问题,本专利技术的技术方案如下基于字幕信息的视频自动切分及标注方法,包括如下步骤11)分析视频格式,获得视频的帧率η ;12)每隔η帧利用文字定位技术确定视频帧中的文字区域,并将首次出现文字的视频帧的时间,定为该字幕的起始时间;13)对于步骤12)的文字区域定位结果,每隔η帧计算相同位置的文字区域之间的相似度如相似度Se大于一定阈值,则认为文字没有消失,返回执行步骤12);否则,认为文字消失,记录文字消失所在视频帧的时间点为当前字幕的消失时间,继续执行步骤14);14)对于步骤12)的文字区域定位结果,利用文字识别技术进行文字识别,若视频处理完毕,执行步骤15);否则,返回执行步骤12);15)根据字幕的起始时间和当前字幕的结束时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注。进一步的,所述文字定位技术包括如下步骤21)视频巾贞图像设为f (X,y),利用Sobel算子处理f (x, y),得到边缘图像g(x, y);22)利用最大类间方差法对所述边缘图像g(x,y) 二值化,得到二值图像Id1 (x,y);23)如果文字属于暗底亮字情况,计算二值图像Id1 (x,y)中值为I的像素的笔画强度特征,所述像素的笔画强度特征的计算公式为_7] DEJx,) ) = maxj=0 {/(x, v)-min^ {h(x,y,i,cf)}}其中,h (x,y,i,d) =max (f (x_i X dxdJ y-i X dyd),f (x+ (W+l~i) X dxdJ y+ (W+l~i) X dyd)}式中 d=0,1,2,3,dx0=-l,dy0=0,Cix1=-I, Ciy1=-I, dx2=0,dy2=_l,dx3=l,dy3=_l,表示笔画最常见的O 四个方向,W是笔画宽度的上限;24)将字符的笔画特征图像Sw(x,y)定义为本文档来自技高网...

【技术保护点】
基于字幕信息的视频自动切分及标注方法,其特征在于,包括如下步骤:11)分析视频格式,获得视频的帧率n;12)每隔n帧利用文字定位技术确定视频帧中的文字区域,并将首次出现文字的视频帧的时间,定为该字幕的起始时间;13)对于步骤12)的文字区域定位结果,每隔n帧计算相同位置的文字区域之间的相似度Se,如相似度Se大于一定阈值,则认为文字没有消失,返回执行步骤12);否则,认为文字消失,记录文字消失所在视频帧的时间点为当前字幕的消失时间,继续执行步骤14);14)对于步骤12)的文字区域定位结果,利用文字识别技术进行文字识别,若视频处理完毕,执行步骤15);否则,返回执行步骤12);15)根据字幕的起始时间和当前字幕的结束时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注。

【技术特征摘要】
1.基于字幕信息的视频自动切分及标注方法,其特征在于,包括如下步骤 11)分析视频格式,获得视频的帧率η; 12)每隔η帧利用文字定位技术确定视频帧中的文字区域,并将首次出现文字的视频帧的时间,定为该字幕的起始时间; 13)对于步骤12)的文字区域定位结果,每隔η帧计算相同位置的文字区域之间的相似度Se,如相似度Se大于一定阈值,则认为文字没有消失,返回执行步骤12);否则,认为文字消失,记录文字消失所在视频帧的时间点为当前字幕的消失时间,继续执行步骤14); 14)对于步骤12)的文字区域定位结果,利用文字识别技术进行文字识别,若视频处理完毕,执行步骤15);否则,返回执行步骤12); 15)根据字幕的起始时间和当前字幕的结束时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注。2.根据权利要求I所述的基于字幕信息的视频自动切分及标注方法,其特征在于,所述文字定位技术包括如下步骤 21)视频巾贞图像设为f(X,y),利用Sobel算子处理f (x, y),得到边缘图像g(x, y); 22)利用最大类间方差法对所述边缘图像g(x,y)二值化,得到二值图像I3l(Xj); 23)如果文字属于暗底亮字情况,计算二值图像匕“^)中值为I的像素的笔画强度特征,所述像素的笔画强度特征的计算公式为3.根据权利要求I所述的基于字幕信息的视频自动切分及标注方法,其特征在于,相同位置的文字区域之间的相似度Se的计算方法包括如...

【专利技术属性】
技术研发人员:刘杰李雷赵志峰张卫
申请(专利权)人:北京数视宇通技术有限公司华数传媒网络有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利