一种视频大数据分布式解码的方法技术

技术编号：11120066 阅读：151 留言：0更新日期：2015-03-07 01:39

本发明专利技术公开了一种视频大数据分布式解码的方法，即基于Spark计算框架以及HDFS的视频大数据分布式解码方法，属于计算机领域。该方法主要包括如下步骤，步骤a：将海量视频文件直接上传至HDFS中进行存储；步骤b：自定义Spark的分片模型，该分片包含视频文件的头信息以及完整的视频关键帧边界；步骤c：构造Spark的分布式数据集HadoopRDD，自定义读取分片数据的方式；步骤d：在HadoopRDD的RDD转化中完成分布式解码；步骤e：在HadoopRDD的RDD动作中对解码后视频图像文件进行保存，用于后续的智能视频分析。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种计算机视频处理领域，特别是一种视频大数据分布式解码的方法。
技术介绍
目前视频分析已然在学术以及现实生活中的一个热门领域，原因在于视频数据包含了大量的有价值的信息，但是视频文件具有容量大，无法直接对其进行分析处理，需要对视频文件进行解码，获得原始的视频图像帧后，再对图像帧进行分析，这必然涉及到传输、存储以及解码等工作。
技术实现思路
专利技术目的：本专利技术提出了一种基于Spark计算框架以及HDFS的视频大数据分布式解码的方法，解决了现有的海量视频分布式解码方法中存在的不足，有效提高了解码效率，并且解码准确率达到接近100%。为了解决上述技术问题，本专利技术公开了一种基于Spark计算框架以及HDFS的视频大数据分布式解码方法，包括如下步骤：步骤a :将海量（PB级以上）视频文件直接上传至HDFS中进行存储；步骤b :定义Spark计算框架的分片模型（InputSplit)，该分片包含视频文件的头信息以及完整的视频关键帧边界；步骤c :构造Spark的分布式数据集HadoopRDD,定义读取分片数据的方式；步骤d :在分布式数据集HadoopRDD的transformation (RDD转化）中完成分布式解码；步骤e :在HadoopRDD的action (RDD动作阶段）中对解码后视频图像文件进行保存，用于后续的智能视频分析。本专利技术分布式计算是基于Spark,分布式存储是基于HDFS(HadoopDistributed File ...
一种<a href="http://www.xjishu.com/zhuanli/62/201410748160.html" title="一种视频大数据分布式解码的方法原文来自X技术">视频大数据分布式解码的方法</a>

【技术保护点】
一种视频大数据分布式解码的方法，其特征在于，包括如下步骤：步骤a：将海量视频文件直接上传至HDFS中进行存储；步骤b：定义Spark计算框架的分片模型，该分片包含视频文件的头信息以及完整的视频关键帧边界；步骤c：构造Spark计算框架的分布式数据集HadoopRDD，定义读取分片数据的方式；步骤d：在分布式数据集HadoopRDD的RDD转化中完成分布式解码；步骤e：在分布式数据集HadoopRDD的RDD动作阶段中对解码后视频图像文件进行保存，用于后续的智能视频分析。

【技术特征摘要】
1. 一种视频大数据分布式解码的方法，其特征在于，包括如下步骤：步骤a :将海量视频文件直接上传至HDFS中进行存储；步骤b :定义Spark计算框架的分片模型，该分片包含视频文件的头信息以及完整的视频关键巾贞边界；步骤c :构造 Spark计算框架的分布式数据集HadoopRDD，定义读取分片数据的方式；步骤d :在分布式数据集HadoopRDD的RDD转化中完成分布式解码；步骤e :在分布式数据集HadoopRDD的RDD动作阶段中对解码后视频图像文件进行保存，用于后续的智能视频分析。2. 根据权利要求1所述一种视频大数据分布式解码的方法，其特征在于：所述步骤b 中，根据Spark提供的API实现InputSplit的子类，自定义InputFormat类的子类，实现 InputFormat类的子类的getSp 1 i ts方法，修改HDFS数据块的分割方法，以视频图像巾贞作为分割边界，即对于每个分割，判断该分割是否能够得到可解码的帧；InputSplit子类包含数据块在视频...

【专利技术属性】
技术研发人员：高翔，宋智军，曹博琦，
申请(专利权)人：中国电子科技集团公司第二十八研究所，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人