数据同步方法和装置制造方法及图纸

技术编号：12347985 阅读：62 留言：0更新日期：2015-11-18 19:54

本发明专利技术提供一种数据同步方法和装置，能够实现hadoop集群内部或hadoop集群间的数据统一，具有简便易行等等优点。其中数据同步方法包括：判断hadoop集群的数据同步类型，数据同步类型包括集群内部数据拷贝、集群内部地址共享、和集群间数据拷贝；根据判断结果执行预先选择的对应于该判断结果的数据质量核对任务；在执行数据质量核对任务时检查到存在数据不一致的情况下，执行最近一次数据同步任务。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别地涉及一种数据同步方法和装置。
技术介绍
目前很多大型IT企业推出了云平台、大数据平台、云计算、云存储、数据集市等服务，为不同企业之间或企业内部各业务部门之间的实现了数据共享与数据传输功能。图1示出了在大数据平台、云服务等环境中集群内部和集群之间的数据进行同步的过程。但是同步之后缺少数据质量核对的工作，可能存在数据不一致性问题，具体地:当数据共享方数据发送变化时，数据订阅方已经同步的数据就会与数据共享方不一致。数据订阅方难以察觉数据共享方数据发生变化，待发现后往往已经造成巨大损失。数据不一致性问题发生后，数据订阅方没有及时再次获取最新数据，造成数据订阅方连锁性数据错误。综上，现有技术中，数据不一致性问题发生后，缺少及时的通知机制，也缺少及时的、自动化、智能化的数据差异处理机制，带来了巨大损失。
技术实现思路
有鉴于此，本专利技术提供一种数据同步方法和装置，能够实现hadoop集群内部或hadoop集群间的数据统一，具有简便易行等等优点。为实现上述目的，根据本专利技术的一个方面，提供了一种数据同步方法。本专利技术的数据同步方法包括:判断hadoop集群的数据同步类型，所述数据同步类型包括集群内部数据拷贝、集群内部地址共享、和集群间数据拷贝；根据判断结果执行预先选择的对应于该判断结果的数据质量核对任务；在执行所述数据质量核对任务时检查到存在数据不一致的情况下，再次执行最近一次数据同步任务。可选地，所述根据判断结果执行预先选择的对应于该判断结果的数据质量核对任务的步骤包括:在所述判断结果为集群内部数据拷贝的情况下，核对...

【技术保护点】
一种数据同步方法，其特征在于，包括：判断hadoop集群的数据同步类型，所述数据同步类型包括集群内部数据拷贝、集群内部地址共享、和集群间数据拷贝；根据判断结果执行预先选择的对应于该判断结果的数据质量核对任务；在执行所述数据质量核对任务时检查到存在数据不一致的情况下，再次执行最近一次数据同步任务。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨泽森，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人