一种基于结构及相似度的视频提取PPT方法技术

技术编号：24036566 阅读：40 留言：0更新日期：2020-05-07 02:04

本发明专利技术涉及一种基于结构及相似度的视频提取PPT方法，首先，采集视频的第一帧图像；对帧图像进行颜色空间转换、高斯滤波、膨胀、Canny边缘检测、轮廓检测，找到其中的目标区域；然后，利用多边形拟合、透视变换对目标区域进行处理，将目标区域转化为矩形；相隔2秒在视频中再取新帧，重复上述的操作，获取第二图的PPT目标区域；最后，对两PPT图片进行相似度比较和差异度比较，接着留下第二幅PPT图，重复执行上述操作直至视频结束；对所有保存的图片进行再裁剪和时间序列筛选处理，以PDF文件形式保存。本发明专利技术提供一种从视频中简单、快速提取PPT内容图片并且以PDF文件形式保存的方法。

A video extraction ppt method based on structure and similarity

全部详细技术资料下载

【技术实现步骤摘要】
一种基于结构及相似度的视频提取PPT方法
本专利技术涉及图像处理
，特别是一种基于结构及相似度的视频提取PPT方法。
技术介绍
MicrosoftOfficePowerPoint，是微软公司的演示文稿软件，功能强大，应用广泛。在当今信息化时代中，随着应用水平的逐步提高，PPT正成为人们工作生活中的重要组成部分，在各行各业中占据着举足轻重的地位。人们可以通过传统方法，比如U盘拷贝、邮箱传递等，可以获取他们所需要的PPT内容。但是现在在大多数的会议、讲座等场合，人们手里可能只有一份关于会议、讲座现场的视频，无法通过传统方法获取所需要的PPT内容，无法高效且迅速地获取所需要的信息，使相关视频的利用率下降。因此需要一种能够从视频中提取所需要的PPT内容并合理存放，这样才能够有效的整理好讲座现场的视频，深化知识的应用。目前从视频中提取PPT存在以下几个难点问题：如何判断提取的PPT内容图片是否属于相同页，如何判断PPT区域被遮挡，不进行提取操作，若存在PPT换页动画情况下该如何进行提取操作。
技术实现思路
有鉴于此，本专利技术的目的是提供一种基于结构及相似度的视频提取PPT方法，要通过对帧图像进行预处理、多层次的比较操作，完成从视频中精确定位并提取PPT内容图片的目标，并将其以PDF文件形式保存，便于用户使用。本专利技术采用以下方案实现：一种基于结构及相似度的视频提取PPT方法，包括以下步骤：步骤S1：通过视频采集设备采集含有PPT内容的视频，并上传到PC端，直接读取视频的长、

【技术保护点】
1.一种基于结构及相似度的视频提取PPT方法，其特征在于：包括以下步骤：/n步骤S1：通过视频采集设备采集含有PPT内容的视频，并上传到PC端，直接读取视频的长、宽和总帧数，提取视频的第一帧图像，作为起始图像；/n步骤S2：对图像依次进行颜色空间转换、高斯滤波、膨胀操作去除干扰边缘和噪声点，然后利用Canny算子对膨胀操作后的图像进行边缘检测，再采用轮廓检测寻找图片中所有可能的轮廓，最后找到其中面积最大的轮廓，即目标区域；/n步骤S3：利用多边形拟合和透视变换操作对目标区域进行裁剪和视角矫正，将目标区域转化为矩形；/n步骤S4：相隔2秒再次在步骤S1的视频中取一帧视频图像，作为新帧，重复上述步骤S2到步骤S3的操作，获取第二图的PPT目标区域；/n步骤S5：对两PPT图片进行相似度比较和差异度比较操作，然后留下第二幅PPT图，重复执行上述步骤S4和步骤S5直至视频结束；/n步骤S6：将所有最终得到的PPT内容图片进行再裁剪和时间序列筛选处理，最后以PDF文件形式保存。/n

【技术特征摘要】
1.一种基于结构及相似度的视频提取PPT方法，其特征在于：包括以下步骤：
步骤S1：通过视频采集设备采集含有PPT内容的视频，并上传到PC端，直接读取视频的长、宽和总帧数，提取视频的第一帧图像，作为起始图像；
步骤S2：对图像依次进行颜色空间转换、高斯滤波、膨胀操作去除干扰边缘和噪声点，然后利用Canny算子对膨胀操作后的图像进行边缘检测，再采用轮廓检测寻找图片中所有可能的轮廓，最后找到其中面积最大的轮廓，即目标区域；
步骤S3：利用多边形拟合和透视变换操作对目标区域进行裁剪和视角矫正，将目标区域转化为矩形；
步骤S4：相隔2秒再次在步骤S1的视频中取一帧视频图像，作为新帧，重复上述步骤S2到步骤S3的操作，获取第二图的PPT目标区域；
步骤S5：对两PPT图片进行相似度比较和差异度比较操作，然后留下第二幅PPT图，重复执行上述步骤S4和步骤S5直至视频结束；
步骤S6：将所有最终得到的PPT内容图片进行再裁剪和时间序列筛选处理，最后以PDF文件形式保存。

2.根据权利要求1所述的一种基于结构及相似度的视频提取PPT方法，其特征在于：所述步骤S2具体包括以下步骤：
步骤S21：首先通过颜色空间转换将彩色图像转变为灰度图像，用以消除帧图像的背景区域存在的颜色信息干扰；接着采用高斯滤波的方式对图像冗余的轮廓信息进行滤除；然后采用形态学膨胀操作扩张图像中的高亮部分，缩小黑暗部分的面积；最后对图像进行Canny边缘检测，找到图像中物体的真实边缘；
步骤S22：利用轮廓检测对边缘检测结果进行拓扑分析，找到其中所有可能的最外层轮廓而忽略轮廓中的孔边界，最后提取所有可能轮廓中面积最大的轮廓作为PPT目标区域。

3.根据权利要求1所述的一种基于结构及相似度的视频提取PPT方法，其特征在于：所述步骤S3具体包括以下步骤：
步骤S31：通过对目标区域进行多边形拟合，用以减少目标区域轮廓点集中的点的数量；
步骤S32：对拟合结果以外的图像进行裁剪处理，只留下目标区域；将多边形拟合结果的四个顶点作为透视变换的四个原始点，变换到四个规定点上，使目标区域转化矩形。

4.根据权利要求1所述的一种基于结构及相似度的视频提取PPT方法，其特征...

【专利技术属性】
技术研发人员：郑茜颖，邱建滨，陈伊涵，王帅，曾青耀，魏海云，邱纯乾，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人