【技术实现步骤摘要】
多中继互联网大数据推送方法和系统
本专利技术属互联网大数据推送技术,具体涉及多中继互联网大数据推送方法和系统。
技术介绍
一些应用领域通常需要将大量的数据从一个地方推送到遥远的另一个地方,比如将数千万个医学影像文件(通常每个文件大小在500KB——25MB,少数文件大到1GB——5GB)推送到异地作为容灾备份。国内有数万家医疗机构的医学影像数据远大于上述数量。我们的生活和工作逐渐迈入大数据时代,类似的应用需求越来越多。数据推送需要具备完全可靠、高效率、自动化三个基本特征:数据有极少数的丢失或损坏在绝大多数应用中是不允许的;数据推送慢就会推高应用成本,或者影响用户使用体验,影响工作效率;海量数据的推送显然不能用手工操作、并且必须最大限度地减少所有可能的故障,在故障出现时也要减少人工干预。如果采用数据专线连接推送,因为线路稳定性高、速度相对快,不但效率问题基本解决,出故障的机率也大大也降低,甚至可以不做特别处理,需自动化处理的工作也相对减少,但是数据专线连接成本高,不具备广泛应用到基层、到家庭、社区的条件。互联网的数据链路在不同的互联网接入运营商之间有瓶颈问题,数据推送的两端如果使用不同的互联网接入运营商的接入端,相互推送数据的速度相比使用同一家互联网接入运营商接入端的应用,速度要低很多。另外,目前互联网接入以ADSL(AsymmetricDigitalSubscriberLine,非对称数字用户线路)技术为主,其特点是不对称性,即下载远比上传快。数据推送目前可以实现的方法有很多。电子邮件是大家使用最早、最广泛的文件传递方法;FTP(文件传输协议)又是另一种国 ...
【技术保护点】
一种多中继互联网大数据推送方法,其特征在于包括:程序化或手工操作接受大数据推送任务,对任务进行组织和预处理,对预处理的待推送数据进行管理,在任务管理协调下由数据推送线程将数据推送到下一个接收实例,最终到达推送目标地址后对数据进行一致性验证,确认推送成功,接收实例将收到的数据通过接口提交给数据应用者;根据应用中的推送需求和应用环境,一对一推送或是一对多推送,按接收目标实例是否常连接,推送实例互联网接入端与目标实例互联网接入端是否为同一家互联网接入运营商等条件判定选择通过0个或多个中继实例推送数据;所说的实例通过名称注册和登录来相互识别推送源、中继和目标实例的名称与IP地址;当自动化数据推送处理过程中出现一般性可暂时跳过的故障和出现不可恢复的异常故障时分别发出异常报告;每一个实例完全双向工作模式,可同时推送和接收。
【技术特征摘要】
1.一种多中继互联网大数据推送方法,其特征在于基本过程:程序化或手工操作接收大数据推送任务,对任务进行组织和预处理,对预处理的待推送数据进行管理,在任务管理协调下由数据推送线程将数据推送到下一个接收实例,最终到达推送目标地址后对数据进行一致性验证,确认推送成功,接收实例将收到的数据通过接口提交给数据应用者,并且按以下步骤执行:步骤S120,实例地址名称管理,其中一个具有固定IP地址或固定域名指向的计算机上运行的实例接收注册、登录和查询,简称为名称注册服务实例;步骤S130,对推送和接收的任务进行管理,其中具体的管理流程如下:步骤S210,接收推送任务,并把任务基本描述信息存入任务主体记录表,将任务存入待推送任务队列;步骤S220,取出待推送任务队列中原始任务交给数据预处理过程,监测和管理预处理过程,对预处理后已进一步标准化和细化的待推送任务数据进行登记并且更新状态;这一步骤生成任务记录文件,进一步参考S330;任务状态包含:等待、准备好、推送进行、接收进行、接收完成、推送完成、挂起、中止、重试;步骤S230,把准备好的任务文件和推送任务数据交给数据推送处理过程,监测任务数据推送进展情况,并更新进度状态;步骤S240,监测数据接收过程,把收到的任务加入到任务主记录表,并更新数据接收状态;步骤S250,调用数据验证过程,对推送和接收的数据进行验证,验证成功进入完成流程或中继推送流程,验证失败重新再走数据推送流程;步骤S260,推送完成,推送实例处理任务完成后的状态以及数据,接收实例记录任务状态并通过接口管理S110过程将收到的数据提交给数据应用者;推送任务记录的结构和流程描述如下:步骤S320,从S101和S210接收推送任务,任务描述信息记录到主任务记录表中;从S240收到推送任务时也同样把任务描述信息写入主任务记录表;S101是接收推送任务的入口;主任务描述信息包括:任务编号、推送者、接收者、当前位置、进度状态、重试状态、优先级、任务类型、任务大小、任务时间、任务数据原位置、缓冲数据位置、任务客户编号、任务相关编号;步骤S330,在S140和S220生成任务文件,记录一个任务的具体可操作的推送信息;任务文件包括以下信息:描述任务主要信息的文件头以及待推送文件列表信息,其中包含:文件名称、大小和时间属性、子任务ID、工作状态、压缩代码、MD5编码;一个主任务一般包含多个子任务,也就是主任务是一个目录文件集,子任务是一个文件,MD5用于数据一致性验证;压缩代码0表示未压缩,1表示标准化的ZIP压缩,其它压缩代码由推送和接收方应用程序定义;步骤S340,S160和S170执行过程中记录推送片段信息;S160每推送成功一个数据包,在片段记录文件中记录信息;每当推送中途网络异常断开或其他问题导致中断时,再次恢复先尝试从中断位置恢复推送,如果接收方认可的话,继续推送,否则从头开始;步骤S140,待推送数据预处理以及接收推送数据后对进行过压缩或其他编码的数据进行恢复;工作于推送角色的实例,在推送预处理过程同时提取待推送数据摘要信息补充到主任务记录表,生成任务文件,任务状态进入准备好状态,由任务管理过程S130调度进入下面的推送流程;步骤S150,对经过预处理后的待推送数据、任务文件、推送片段记录文件、接收到的数据以及程序执行过程产生的临时数据进行管理;其中的管理操作包括存储空间管理、过期数据清理、文件及数据存储、读取;步骤S160,由S130调度,从S150提取待推送的数据,通过TCP/IP通讯,从S120找到推送目标地址或中继地址IP,把任务文件和目标数据推送到下一个目标地址;步骤S165,验证被推送的源数据与到达目的地后的数据的一致性,验证分为从小到大的逐级验证和总体验证,其中具体流程如下:步骤S610,提取推送任务的摘要信息,包括任务文件数量、任务总大小、数据位置、文件名称列表、每个文件的大小、文件的MD5码;步骤S620,推送数据片段一致性验证,以及断点恢复后可继续性验证;每推送完成一个数据片段,即时验证其一致性;导常中断推送后再恢复推送时,检测双方已成功推送的数据片段,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。