The invention discloses a method for implementation of Hadoop file system based on the data of disaster recovery, which belongs to the technical field of data security, has the feature of time stable using performance data of the PM system, suitable for incremental data backup, and performance data are stored in Hadoop distributed file system features, using the mechanism of Hadoop data import / distributed file system derived from the data in the file from the Hadoop system is derived, and then the file encryption is transmitted to the remote disaster recovery system, finally realizes data synchronization backup disaster recovery system of Hadoop file into the disaster recovery system. The invention solves the performance data of remote backup of the current PM system, using conventional methods can not be completed within the time limit, and backup of data backup efficiency is very high, improving the data security.
【技术实现步骤摘要】
本专利技术属于数据安全
,具体的说是一种基于Hadoop文件系统实现数据异地容灾的方法。
技术介绍
PM系统(performance management system,性能管理系统)一般用于电信运营商网络的性能监控,通过对EMS(Element Management System,网元管理系统)系统和NE(Network element,网元设备)网元的性能数据的采集、解析、入库、汇总和展现,来对电信运营商网络的整体性能状态和发展趋势给出直观显示。PM系统由于管理着数量庞大的NE网元设备,每个NE网元设备每隔5分钟或15分钟持续上报性能数据,造成PM系统的性能数据量增长很快,而采用常规性能数据的容灾备份方式,由于备份效率低下,造成备份数据的速度远低于性能数据生成的速度,而导致性能数据永远备份不完的情况。随着大数据时代的到来,越来越多的大型信息处理系统,采用了分布式文件系统作为数据存储的载体,而Hadoop(Hadoop Distributed File System,简称HDFS)作为主流的分布式文件系统,已经得到广泛推广和使用。PM系统必须解决海量性能数据存储的问题,而采用Hadoop分布式文件系统来存储这些性能数据,是一个非常好的选择。但是,这些海量的性能数据还是给PM系统带来另外一个难题,如何高效率的实现PM系统的数据异地容灾?PM系统的性能数据具有下列特点:1)性能数据由PM系统通过采集EMS系统和NE网元的原始指标数据之后,再经过解析、入库、汇总之后生成,这些性能数据具有比较强的时间稳定特征,也即性能数据生成之后,随着时间的推移,性能数 ...
【技术保护点】
一种基于Hadoop文件系统实现数据异地容灾的方法,其特征在于,利用PM系统的性能数据具有时间稳定的特征,适于做数据增量备份,同时性能数据全部存储在Hadoop分布式文件系统中的特性,利用Hadoop分布式文件系统数据导入/导出的机制,将数据以文件方式从Hadoop系统中导出,然后将文件加密传输到异地容灾系统,最后将文件导入到容灾系统的Hadoop系统中实现数据异地容灾的同步备份。
【技术特征摘要】
1.一种基于Hadoop文件系统实现数据异地容灾的方法,其特征在于,利用PM系统的性能数据具有时间稳定的特征,适于做数据增量备份,同时性能数据全部存储在Hadoop分布式文件系统中的特性,利用Hadoop分布式文件系统数据导入/导出的机制,将数据以文件方式从Hadoop系统中导出,然后将文件加密传输到异地容灾系统,最后将文件导入到容灾系统的Hadoop系统中实现数据异地容灾的同步备份。2.根据权利要求1所述一种基于Hadoop文件系统实现数据异地容灾的方法,其特征在于,根据PM系统的硬件配置和应用服务在异地搭建PM容灾系统,在PM系统中部署容灾导出模块,在PM容灾系统中部署容灾导入模块;通过PM系统的性能数据文件入库进程,将性能数据文件入库到Hadoop文件系统中,并将性能数据刷新到Oracle数据库,同时将新增的性能数据文件记录下来;后继容灾导出模块定期扫描性能数据文件入库记录,找出新入库的性能数据文件列表,再利用Hadoop文件系统的文件导出功能,批量导出到本地目录中,进行文件打包压缩之后,基于SFTP文件传输方式传输到异地的PM容灾系统中;PM容灾系统对接收后的压缩包解压到本地目录中,再通过容灾系统的Hadoop文件系统的文件导入功能,将解压后的性能数据文件批量导入到Hadoop文件系统中,同时将性能数据刷新到容灾系统的Oracle数据库。3.根...
【专利技术属性】
技术研发人员:卢向辉,李建明,
申请(专利权)人:浪潮软件集团有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。