The embodiment of the invention provides a device and offline synchronization method based on large data, the method comprises: when receiving the data of the second goal of the first target data source and source command data synchronization, will access the first target data source to the first access information to send parameters to Data Reader according to the parameters, DataReader reads the first target data source in the data to be synchronized, and saves the data for the first data abstraction, on the basis of the first data processing logic abstraction conversion; will visit second target data source of the second required access to information sent to DataWriter through the DataWriter parameter form; on the basis of the parameter conversion after the data is written to the second target data source abstraction. Therefore, the process does not require users to manually synchronize different data sources in different interface types. It is not only easy to operate, but also saves the cost.
【技术实现步骤摘要】
一种基于大数据的数据同步方法及装置
本专利技术涉及大数据处理领域,尤其涉及一种基于大数据的数据同步方法及装置。
技术介绍
随着大数据技术的不断发展,当前各类数据存储服务层出不穷,例如:所述存储服务包括:关系型数据库Mysql、非关系型数据库HBase、数据仓库Hive、文件存储HDFS以及具有存储功能的文件索引服务Elasicsearch等。这些存储数据服务可能会应用到相同的存储数据,因此需要进行数据存储服务间的数据服务。但是,现有技术中,不同类型的数据存储服务之间进行数据同步时,由于不同类型的数据存储服务的接口类型不同,因此需要在不同类型的数据存储服务的接口中不断切换,因此不仅操作过程繁琐、而且实现的成本较高。
技术实现思路
有鉴于此,本专利技术实施例提供了一种基于大数据的同步方法及装置,解决了现有技术中由于不同类型的数据存储服务的接口类型不同,需要在不同类型的数据存储服务的接口中不断切换的问题。本专利技术实施例提供了一种基于大数据的同步方法,所述方法可以包括:当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;所述DataWriter依据所述第二访问信息对 ...
【技术保护点】
一种基于大数据的同步方法,其特征在于,所述方法包括:当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
【技术特征摘要】
1.一种基于大数据的同步方法,其特征在于,所述方法包括:当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。2.根据权利要求1所述的方法,其特征在于,所述将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader,包括:获取访问所述第一目标数据源的第一访问信息;将所述第一访问信息转换成相对应的参数;将所述第一访问信息相对应的参数发送给所述DataReader。3.根据权利要求1所述的方法,其特征在于,所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步的数据保存为第一数据抽象,包括:对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;依据所述第一目标数据源的连接信息连接到所述第一目标数据源;基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取所述待同步的数据。4.根据权利要求1所述的方法其特征在于,所述将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter,包括:获取访问所述第二目标数据源所需的第二访问信息;将所述第二访问信息转换成对应的参数;将所述第二访问信息对应的参数发送给所述DataWriter。5.根据权利要求1所述的方法,其特征在于,所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源,包括:将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;依据所述第二目标数据源的连接信息连接到所述第二目标数据源;依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所...
【专利技术属性】
技术研发人员:陈越晨,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。