一种基于不规则动态字幕智能提取版权信息的方法技术

技术编号：44699781 阅读：15 留言：0更新日期：2025-03-19 20:50

本发明专利技术公开了一种基于不规则动态字幕智能提取版权信息的方法，包括以下步骤：S1.输入节目视频序列；S2.对输入的节目视频序列进行OCR识别；S3.提取视频序列中的版权角色以及实体；S4.构建动态字幕关系模型，并生成版权信息表。本发明专利技术通过基于动态字幕多帧画面融合的视频文本识别、角色提取、角色自动校验与补全、实体提取、实体知识增强校验和关系模型匹配等技术手段，实现了对含有不规则字幕的节目视频中导演、编剧、策划、作词、作曲、演唱等版权信息的精准自动提取。该方法无需人工干预，提高了版权信息提取的效率和准确性，为视频内容创作者的合法权益保护提供了有力支持。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频编辑，具体为一种基于不规则动态字幕智能提取版权信息的方法。

技术介绍

1、随着互联网视频技术的迅猛发展和普及，视频内容已成为人们日常生活不可或缺的一部分。然而，随着视频数量的急剧增加，内容版权保护问题日益凸显，版权纠纷频发，版权信息的准确提取与高效管理成为亟待解决的关键问题。在视频节目层面，版权信息的编目工作是版权保护体系中的基础环节，对于维护视频内容创作者的合法权益具有重要意义。然而，目前视频节目的编目工作大多依赖人工完成，这一方式不仅耗时费力，且容易出错，难以满足大规模视频内容管理的需求。虽然常规模式的ocr（光学字符识别）技术可以识别视频中的文字信息，但由于版权信息往往以不规则字幕等形式嵌入节目视频的序幕中，常规ocr技术难以准确提取和识别这些信息，仍然需要人工编目。因此，开发一种能够智能提取节目视频不规则字幕中版权信息的方法显得尤为重要。

技术实现思路

1、为了解决上述问题，本专利技术提供一种基于不规则动态字幕智能提取版权信息的方法，包括以下步骤：s1.输入节目视频序列；s2.对输入的节目视频序列进行ocr识别；s3.提取视频序列中的版权角色以及实体；s4.构建动态字幕关系模型，并生成版权信息表。

2、进一步地，所述s2步骤具体包括以下子步骤：s21.从节目视频序列中进行多帧画面选取；s22.对选取的每一帧画面进行ocr识别，并将画面中的字符转换为可读文本信息；s23.将ocr识别结构进行融合处理；s24.对融合后的结果进行校验并补全；s25.

3、进一步地，所述s21步骤中所选取的多帧画面具体为：包含字幕且相似度不低于90%的画面。

4、进一步地，所述s24步骤中具体包括以下子步骤：s241.对单帧识别中的错误进行校验；s242.对缺失或错误的字符进行补全；其中，s241步骤中校验出的错误具体包括：字符误识别、字符溢漏、字符位置错误。

5、进一步地，所述s3步骤具体包括以下子步骤：s31.构建大语言模型、版权信息角色知识库以及外部知识库；s32.分别对版权角色与实体信息进行提取；s33.将提取出的版权角色与实体信息分别与版权信息角色知识库以及外部知识库中数据信息进行校验、补全。

6、进一步地，所述s32步骤中提取版权角色具体包括以下步骤：a1.将提取到的ocr文本结果输入大语言模型；a2.设定特定的版权角色标签筛选出与这些标签最匹配的角色，并计算角色匹配置信度；a3.设定置信度阈值，并将角色匹配置信度与置信度阈值进行比对；其中，a2步骤中所述特定的版权角色标签具体包括：导演、编剧、作词、作曲、策划、演唱。

7、进一步地，所述s32步骤中提取实体信息具体包括以下步骤：b1.将提取到的ocr文本结果输入大语言模型；b2.设定特定的实体标签并依照实体标签进行筛选；b3.对识别结果进行置信度评分；b4.设定置信度阈值，并将实体置信度分值与置信度阈值进行比对；其中，所述实体标签具体包括：人名、组织名、出版时间。

8、进一步地，所述s4步骤具体包括以下子步骤：s41.构建动态字幕关系模型；s42.根据识别的版权角色信息与实体信息构建字幕中的排班格局；s43.将排班格局与动态字幕关系模型进行匹配；s44.根据匹配结果生成最终版权信息表。

9、进一步地，所述动态字幕关系模型中存储的动态字幕关系具体包括：横向左对齐、横向居中、纵向左对齐。

10、本专利技术提供了一种基于不规则动态字幕智能提取版权信息的方法，具有以下有益效果：

11、本专利技术通过基于动态字幕多帧画面融合的视频文本识别、角色提取、角色自动校验与补全、实体提取、实体知识增强校验和关系模型匹配等技术手段，实现了对含有不规则字幕的节目视频中导演、编剧、策划、作词、作曲、演唱等版权信息的精准自动提取。该方法无需人工干预，提高了版权信息提取的效率和准确性，为视频内容创作者的合法权益保护提供了有力支持。

本文档来自技高网...

【技术保护点】

1.一种基于不规则动态字幕智能提取版权信息的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S2步骤具体包括以下子步骤：

3.根据权利要求2所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S21步骤中所选取的多帧画面具体为：包含字幕且相似度不低于90%的画面。

4.根据权利要求2所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S24步骤中具体包括以下子步骤：

5.根据权利要求1所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S3步骤具体包括以下子步骤：

6.根据权利要求5所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S32步骤中提取版权角色具体包括以下步骤：

7.根据权利要求5所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S32步骤中提取实体信息具体包括以下步骤：

8.根据权利要求1所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述S4步骤具体包括以下子步骤：

9.根据权利要求8所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述动态字幕关系模型中存储的动态字幕关系具体包括：横向左对齐、横向居中、纵向左对齐。

...

【技术特征摘要】

1.一种基于不规则动态字幕智能提取版权信息的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述s2步骤具体包括以下子步骤：

3.根据权利要求2所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述s21步骤中所选取的多帧画面具体为：包含字幕且相似度不低于90%的画面。

4.根据权利要求2所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述s24步骤中具体包括以下子步骤：

5.根据权利要求1所述的基于不规则动态字幕智能提取版权信息的方法，其特征在于，所述s3步...

【专利技术属性】
技术研发人员：马萧萧，安国利，张宁，孟宪林，石慧，孙成，刘洋，
申请(专利权)人：成都东方盛行电子有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人