一种适用于分布式计算环境的大型遥感影像重构方法技术

技术编号：14826080 阅读：165 留言：0更新日期：2017-03-16 13:33

本发明专利技术公开了一种适用于分布式计算环境的大型遥感影像重构方法，包括以下步骤：从待上传至HDFS的文件中过滤出需要预处理的大型影像文件；将过滤得到的影像文件通过计算以一定的重叠度裁剪为多个影像切片；对影像切片添加描述信息及尾部空白补齐；合并包含影像切片的文件块，并在尾部追加文件整体描述信息；影像处理过程中从文件块中提取影像切片的方法以及将重构后的文件恢复为原影像文件的方法。本发明专利技术的实现过程简单、自动性高，对各种影像文件具有普适性，且不会明显地影像分布式环境本身的执行效率及稳定性。本发明专利技术有助于进一步推广分布式处理模式在数据量庞大的遥感影像处理领域的应用，并为更深层次的遥感影像分布式计算打下了一定的基础。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及地球空间信息
的大型遥感影像存储技术，具体的说是一种在Hadoop分布式系统上存储文件较大(数百兆乃至更大)的影像文件的方法，该方法使得HDFS(HadoopDistributeFileSystem)在对文件进行分块存储时依旧保持每个文件块内部像元对应的元信息的完整性，解决了使用Hadoop平台处理大型影像文件时由于被切分的文件块中元信息缺失而导致的无法识别及处理影像文件分块的问题。
技术介绍
经过数十年的高速发展，遥感技术已经在国防、农业、国土、海洋、军事、测绘、水利、气象、地质、生态环境、矿产、旅游、考古等领域有着广泛地应用，它为人类提供了从多维和宏观角度去认识世界的新方法与新手段。遥感技术本身更是迅猛发展，多样化的影像获取途径、迅速提升的遥感影像质量带来的是海量的需要存储和处理的影像文件，从最初MB级、GB级发展到现在的TB级甚至PB级。相关从业人员开始尝试使用Hadoop分布式系统来存储和处理这些遥感影像，使用HDFS分布式文件系统存储影像文件、MapReduce分布式计算框架来对存储在HDFS中的遥感影像做并行计算。然而，由于HDFS在对原本完整的影像文件切割成不同的文件块存储在不同的节点上的特性，导致了大部分的节点在读取影像文件块时由于丢图像失元信息而导致无法正常识别图像。针对这一问题，目前业内常用的应对方案是人为改变Hadoop128M的默认分块阀值，将其值提升至超过单幅影像文件的大小以使得影像文件不被切割。然而随着遥感影像获取方式的越来越先进，现阶段单个高分辨率、多波段的影像文件大小动辄需要GB级别的存储空间，而一味的...
一种<a href="http://www.xjishu.com/zhuanli/55/201610893597.html" title="一种适用于分布式计算环境的大型遥感影像重构方法原文来自X技术">适用于分布式计算环境的大型遥感影像重构方法</a>

【技术保护点】
一种适用于分布式计算环境的大型遥感影像重构方法，其特征在于包括以下步骤：步骤1：首先读取Hadoop集群配置信息中的HDFS文件分块大小的值，并依据该值对比筛选出超过该大小的文件，然后根据文件后缀名提取出其中的影像文件，并将获取到的文件作为需要进行后续处理的目标影像文件；步骤2：读取目标影像文件，将单个大型影像文件以横向形式裁剪为数个大小接近但不超过一个HDFS文件分块大小的影像切片文件，最后一个切片文件只需小于HDFS分块大小即可，此外裁剪时在相邻的影像切片之间保持一定的上下重叠；步骤3：在各个影像切片文件的头部添加60个字节大小的切片文件的描述信息，并根据计算在文件尾部填充对应长度的空白内容，以确保除最后一个影像切片文件外的其它切片文件大小均等于HDFS文件分块大小；步骤4：按顺序合并各个影像切片文件并在尾部添加对重构的新文件的11个字节整体描述信息，至此完成大型影像文件的重构并得到适用于分布式处理环境的新文件。

【技术特征摘要】
1.一种适用于分布式计算环境的大型遥感影像重构方法，其特征在于包括以下步骤：步骤1：首先读取Hadoop集群配置信息中的HDFS文件分块大小的值，并依据该值对比筛选出超过该大小的文件，然后根据文件后缀名提取出其中的影像文件，并将获取到的文件作为需要进行后续处理的目标影像文件；步骤2：读取目标影像文件，将单个大型影像文件以横向形式裁剪为数个大小接近但不超过一个HDFS文件分块大小的影像切片文件，最后一个切片文件只需小于HDFS分块大小即可，此外裁剪时在相邻的影像切片之间保持一定的上下重叠；步骤3：在各个影像切片文件的头部添加60个字节大小的切片文件的描述信息，并根据计算在文件尾部填充对应长度的空白内容，以确保除最后一个影像切片文件外的其它切片文件大小均等于HDFS文件分块大小；步骤4：按顺序合并各个影像切片文件并在尾部添加对重构的新文件的11个字节整体描述信息，至此完成大型影像文件的重构并得到适用于分布式处理环境的新文件。2.根据权利要求1所述的方法，其特征在于所述步骤2中，读取目标影像文件的同时提取影像基本信息，包括图像的像素宽度、像素高度、像元数据类型、波段数，以及遥感影像空间信息，如左上角起始坐标、分辨率、空间投影，并写入至对应的影像切片文件在中；通过改变切片的裁剪高度h来控制得到的切片文件大小，控制影像切片大小的公式为：(h+overPixel)×w×datatypeSize×bandsCount+imgMetaSize+splitMetaSize=splitSize;n=1,n=N(h+overPixel×2)×w×datatypeSize×bandsCount+imgMetaSize+splitMetaSize=splitSize;1<n<N]]>且splitSize<＝blockSize；其中w为影像切片宽度，等于原影像短边，h为影像切片高度，小于原影像长边H，overPixel为重叠影像切片间的重叠宽度，datatypeSize为每个影像的像元数据类型，bandsCount为影像的波段数，imgMetaSize为影像文件的元信息需要占用的存储空间，sp...

【专利技术属性】
技术研发人员：李智文，朱良峰，侯韬，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人