一种视频字幕识别方法及系统技术方案

技术编号：14938752 阅读：135 留言：0更新日期：2017-04-01 00:39

本发明专利技术公开了一种视频字幕识别方法及系统，将原始字幕文本中的字符渲染生成字幕图片，将所述字幕图片叠加至无字幕源视频中，编码生成字幕视频；从所述字幕视频中提取出测试字幕文本；比对所述测试字幕文本与原始字幕文本，并输出对应的识别率。本发明专利技术能够将提取出的一种或多种样式的字幕文本作为测试对象，测试范围广；通过识别算法进行自动测试，识别效率明显得到提升；识别之后的错误更正提升了测试字幕的正确性；对识别结果和识别率的更新，有助于比较优化前后的识别效果；并且便于准确分析视频字幕了解视频属性，进而提升后期视频个性化推荐的精准性，视频字幕搜索的准确性也得到提升，用户寻找视频更加方便和高效。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频
，尤其涉及视频字幕识别方法及系统。
技术介绍
伴随信息技术和通讯技术的不断发展，大量广播视频信息不断涌现，比如各类新闻报道、电视剧目、网络视频等，使得广播电视视频逐渐成为人们获取日常信息的一种重要媒介。根据2014年国家统计局发布的数据显示，截至2014年，我国广播电视节目综合人口覆盖率已达到98.60％，成为世界上覆盖人口最多、公众信息传送量最大，有线、无线、卫星等多种现代技术手段并用的广播电视网络。可以看出，面向三网融合的广播电视新媒体的内容管理与分发，具有巨大的社会效益和商业价值。广播视频中的字幕字符是一种高级语义信息，能够为媒体内容管理与分发提供重要的辅助信息，若能将广播电视新媒体的视频字符准确识别出来，这将对分析视频字幕了解视频属性具有重大意义。目前在视频字幕识别领域，通常是直接从视频流里面解码得到字幕信息，然后将得到的字幕直接与预设的字幕进行比对测试，测试对象单一；对提取出来的文本信息大都通过人眼比对的形式进行测试，采用人工方式进行识别率的计算，效率低下，且准确性得不到认可；对于不同字体大小、不同字体种类的识别效果的测试程序也非常麻烦；同时由于视频字幕背景复杂，识别引擎难以全部有效识别，识别率很难提升。
技术实现思路
为了解决上述技术问题，本专利技术提出了视频字幕识别方法及系统。本专利技术是以如下技术方案实现的：一种视频字幕识别方法，包括：将原始字幕文本中的字符渲染生成字幕图片，将所述字幕图片叠加至无字幕源视频中，编码生成字幕视频；从所述字幕视频中提取出新的字幕文本，所述新的字幕文本为测试字幕文本；比对所述字幕视频中的字...
一种视频字幕识别方法及系统

【技术保护点】
一种视频字幕识别方法，其特征在于，包括：将原始字幕文本中的字符渲染生成字幕图片，将所述字幕图片叠加至无字幕源视频中，编码生成字幕视频；从所述字幕视频中提取出新的字幕文本，所述新的字幕文本为测试字幕文本；比对所述测试字幕文本与原始字幕文本，并输出对应的识别率。

【技术特征摘要】
1.一种视频字幕识别方法，其特征在于，包括：将原始字幕文本中的字符渲染生成字幕图片，将所述字幕图片叠加至无字幕源视频中，编码生成字幕视频；从所述字幕视频中提取出新的字幕文本，所述新的字幕文本为测试字幕文本；比对所述测试字幕文本与原始字幕文本，并输出对应的识别率。2.根据权利要求1所述的视频字幕识别方法，其特征在于，所述字幕图片为一种样式或多种样式，所述多种样式为不同字号和/或不同字体的样式，相同的样式保存在相同的测试字幕文本中。3.根据权利要求2所述的视频字幕识别方法，其特征在于，所述比对所述测试字幕文本与原始字幕文本，并输出对应的识别率，包括：比对测试字幕文本中的字符与原始字幕文本中的字符，得到识别结果。4.根据权利要求3所述的视频字幕识别方法，其特征在于，还包括：根据识别结果的置信度定位错误字符；计算错误字符出现的概率，判断所述概率是否达到常见错误字符的概率，若是，则进一步判断所述错误字符是否存在错误典籍中，若否，则根据错误字符出现的时间，标记对应字幕在测试字幕文本中的位置，对所述错误字符进行人工更正。5.根据权利要求4所述的视频字幕识别方法，其特征在于，所述判断所述错误字符是否存在错误典籍中，包括：若存在错误典籍中，则直接调用错误典籍进行正确替换，若否，则将所述错误字符添至错误典籍。6.根据权利要求4或5所述的视频字幕识别方法，其特征在于，还包括：显示所述错误字符对应字幕的识别结果。7.根据权利要求6所述的视频字幕识别方法，其特征在于，还包括：更新所述错误字符对应字幕的识别结果，更新对应的测试字幕文本的识别率。8.一种视频字幕识别系统，其特征在于，包括：视频生成模块，用于将原始字幕...

【专利技术属性】
技术研发人员：王星星，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人