信息处理系统和设备及其控制方法以及数据传输设备技术方案

技术编号:10475194 阅读:176 留言:0更新日期:2014-09-25 13:34
本发明专利技术涉及处理装置和数据传送方法。一种装置包括第一设备、交换设备和第二设备。第一设备包括:第一传送器,被配置成传送多个分组;以及控制器,被配置成将第一时间信息添加到多个分组中包括的第一分组,第一时间信息指示开始传送多个分组的第一时间。交换设备包括:第一接收器,被配置成接收从第一传送器传送的多个分组;仲裁器,被配置成获取指示发生链路接通的第二时间的第二时间信息,将第二时间信息与第一时间信息进行比较,并且在第二时间晚于第一时间的情况下删除从第一传送器最终传送的第二分组;以及第二传送器,被配置成传送除了第二分组以外的多个分组。第二设备包括:第二接收器,被配置成接收从第二传送器传送的多个分组。

【技术实现步骤摘要】
信息处理系统和设备及其控制方法以及数据传输设备
这里讨论的实施例涉及信息处理系统、信息处理设备、数据传输设备和控制信息 处理系统的方法。
技术介绍
总体上,在具有通过网络传输数据的多个信息处理设备的信息处理系统中,当从 诸如在每个信息处理设备上执行的应用软件的较高层级软件请求数据传输时,所请求的数 据被分成多个分组并且被传输。 随后,在分成多个分组的数据传输中,如果最终分组到达目标节点,则目标节点将 根据最终分组中包括的附加信息认识到数据传输已完成。随后,目标节点向较高层级软件 通知一次数据传输的完成。 此外,在大规模信息处理系统中,特别是在诸如超级计算机的并行计算机中,在许 多情况中采用远程直接存储器存取(RDM)。RDMA指的是通过使用两个网络控制器将一个 计算机节点处的存储器数据直接传输到另一计算机节点处的存储器的功能。使用RDMA使 得可以实现具有高通过量和低延时的通信。特别地,利用作为用于传送控制协议/互联网 协议(TCP/IP)的网络的以太网(注册商标)的RDMA协议通信近年来正在变得可以使用。出 于该原因,越来越多的系统已采用RDMA。 当采用RDMA时,在网络的链路层处重新发送分组的方案常被用作保证分组递送 的方案。在该情况下,由于在网络区域中保证分组递送,因此不存在用于检测和重新发送因 例如用于发送和接收分组的节点之间的位错误等而已被放弃的分组的措施。 网络的链路层处的保证递送的一个例外是因硬件故障而发生链路断开 (link-down)。通常,对于因硬件故障而发生的链路断开,不能保证恢复正常操作之前所耗 用的时间段。出于该原因,当发生链路断开时,信息处理系统放弃正要通过已发生链路断开 的点的分组,以便阻止该分组留在网络中。置于信息处理系统外部的设备监视系统将该链 路断开错误检测为网络的硬件错误。 顺便提及,存在一些如下情况:因暂时的硬件故障而发生链路断开,并且紧随其后 链路接通被建立,从而使得能够恢复数据传输。当该事件在传输一系列分组的数据传输的 前一半或者中间发生时,包括该系列分组的最终分组的后一半中的分组有可能被递送到目 标节点,尽管数据传输的前一半或者中间的分组被放弃。在该情况下,在接收到最终分组 时,目标节点将向较高层级的软件通知数据传输完成。这实际上引起数据传输中的数据损 坏。随后,如果后继处理继续,则例如将引起文件系统内容的改变。结果,不存在反转,并且 将有可能引起对随后的处理有影响的操作错误。 为了阻止数据传输中的这种分组丢失,迄今为止执行如下文提及的序列。在该序 列中,首先,一旦发生链路断开,则使链路断开维持。随后,当外部设备监视系统检测到链路 断开错误时,信息处理系统向操作管理软件通知链路断开错误的发生,使得可能使用发生 链路断开的点的所有应用因该错误而终止。随后,信息处理系统通过设备监视系统针对链 路断开点使得链路接通再次发生。随后,信息处理系统再次执行使用发生链路断开的点的 应用。 此外,作为使用分组的通信技术,存在将序列号分配给分组并且通过找到序列 号的遗漏来检测分组丢失的传统技术。相关技术的文献示例包括日本公开专利公布 No.2007-208635。
技术实现思路
技术问题 然而,在停止所有应用之后使得链路接通发生的传统技术中,最初彼此独立操作 的设备监视系统和操作管理软件开始彼此紧密协作。信息处理系统的配置因此变得复杂。 此外,在使用序列号的传统技术中,对于超级计算机、云系统等中的节点间数据传 输,使用非常多的节点,并且因此要使用的序列号的数目变得极多,并且上下文管理变得困 难。因此难于实现该技术。 有鉴于此实现了本公开的技术,并且本公开的技术涉及提供信息处理系统、信息 处理设备、数据传输设备和用于控制信息处理系统的方法,它们通过简单的配置避免了生 成由于链路断开引起的分组丢失导致的故障。 根据本专利技术的一个方面,一种装置包括第一设备、交换设备和第二设备。第一设备 包括:第一传送器,被配置成传送多个分组;以及控制器,被配置成将第一时间信息添加到 多个分组中包括的第一分组,第一时间信息指示开始传送多个分组的第一时间。交换设备 包括:第一接收器,被配置成接收从第一传送器传送的多个分组;仲裁器,被配置成获取指 示发生链路接通的第二时间的第二时间信息,将第二时间信息与第一时间信息进行比较, 并且在第二时间晚于第一时间的情况下删除从第一传送器最终传送的第二分组;以及第二 传送器,被配置成传送除了第二分组以外的多个分组。第二设备包括:第二接收器,被配置 成接收从第二传送器传送的多个分组。 本专利技术的有利效果 根据实施例的一个方面,信息处理系统可以通过简单的配置避免生成由于链路断 开引起的分组丢失导致的故障。 【附图说明】 图1是图示信息处理系统的示例的系统配置图; 图2是根据第一实施例的信息处理系统的框图; 图3图示了最终分组的示例; 图4A是用于说明发送起始分组时的服务器的操作的框图; 图4B是用于说明发送中间分组时的服务器的操作的框图; 图4C是用于说明发送最终分组时的服务器的操作的框图; 图5A是用于说明发生链路接通时的交换机的操作的图示; 图5B是用于说明传输最终分组时的交换机的操作的图示; 图6是用于说明在交换机执行分组传输期间发生链路接通的情况下的分组输出 的示图; 图7是用于说明在交换机执行分组传输之前发生链路接通的情况下的分组输出 的示图; 图8是用于说明在交换机执行分组传输期间发生链路接通并且在分组传输期间 未发生链路接通的情况下的分组输出的示图; 图9是服务器执行的发送分组的处理的流程图; 图10是交换机执行的传输分组的处理的流程图; 图11是服务器执行的接收分组的处理的流程图; 图12是根据第二实施例的信息处理系统的框图; 图13是根据第三实施例的信息处理系统的框图; 图14是服务器的硬件配置图;以及 图15是交换机的硬件配置图。 【具体实施方式】 下文将参照附图详细说明本公开的信息处理系统、信息处理设备、数据传输设备 和用于控制信息处理系统的方法的实施例。应注意,下文说明的实施例并非旨在限制本公 开的信息处理系统、信息处理设备、数据传输设备和用于控制信息处理系统的方法。 [第一实施例] 图1是图示信息处理系统的示例的系统配置图。如图1中所示,根据该实施例的 信息处理系统包括服务器101和102以及交换机201至203。 服务器101和服务器102通过交换机201至203彼此耦接。连接服务器101、交 换机201至203以及服务器102的网络符合籍其执行RDMA通信的协议。例如,如果服务器 101和102以及交换机201至203的网络接口卡采用适于用在TCP/IP通信中的网络的RDMA 技术,则以太网(注册商标)可以用作连接设备的网络。 这里,在图1中,为了方便起见图示了两个服务器101和102以及三个交换机201 至203。在根据该实施例的信息处理系统中,可以设置其他服务器和交换机。此外,其他服 务器可以耦接到交换机201至203。此外,耦接服务器10本文档来自技高网
...

【技术保护点】
一种处理装置,包括:第一设备,包括第一传送器,被配置成传送多个分组,以及控制器,被配置成将第一时间信息添加到所述多个分组中包括的第一分组,所述第一时间信息指示开始传送所述多个分组的第一时间;交换设备,包括第一接收器,被配置成接收从所述第一传送器传送的所述多个分组,仲裁器,被配置成获取指示发生链路接通的第二时间的第二时间信息,将所述第二时间信息与所述第一时间信息进行比较,并且在所述第二时间晚于所述第一时间的情况下删除从所述第一传送器最终传送的第二分组,以及第二传送器,被配置成传送除了所述第二分组以外的所述多个分组;以及第二设备,包括第二接收器,被配置成接收从所述第二传送器传送的所述多个分组。

【技术特征摘要】
2013.03.18 JP 2013-0556491. 一种处理装置,包括: 第一设备,包括 第一传送器,被配置成传送多个分组,以及 控制器,被配置成将第一时间信息添加到所述多个分组中包括的第一分组,所述第一 时间信息指示开始传送所述多个分组的第一时间; 交换设备,包括 第一接收器,被配置成接收从所述第一传送器传送的所述多个分组, 仲裁器,被配置成获取指示发生链路接通的第二时间的第二时间信息,将所述第二时 间信息与所述第一时间信息进行比较,并且在所述第二时间晚于所述第一时间的情况下删 除从所述第一传送器最终传送的第二分组,以及 第二传送器,被配置成传送除了所述第二分组以外的所述多个分组;以及 第二设备,包括 第二接收器,被配置成接收从所述第二传送器传送的所述多个分组。2. 根据权利要求1所述的处理装置,其中 所述仲裁器通过监视所述第一接收器的状态或所述第二传送器的状态来检测链路接 通的发生。3. 根据权利要求1所述的处理装置,其中 当所述仲裁器检测到多次链路接通时,所述仲裁器保存后继发生的链路接通的时间, 作为所述第二时间信息。4. 根据权利要求1所述的处理装置,其中 所述仲裁器保存指示第一时间段的第一时段信息,并且在所述第一时间和所述第二时 间之间的差短于所述第一时间段的情况下,即便所述第二时间早于所述第一时间,仍删除 所述第二分组。5. 根据权利要求1所述的处理装置,其中 所述第一分组与所述第二分组相同。6. -种处理装置,包括: 第一设备,包括 第一传送器,被配置成传送多个分组,以及 控制器,被配置成将第一时间信息添加到所述多个分组中包括的第一分组,所述第一 时间信息指示开始传送所述多个分组的第一时间; 交换设备,包括 第一接收器,被配置成接收从所述第一传送器传送的所述多个分组, 仲裁器,被配置成获取指示发生链路接通的第二时间的第二时间信息,将所述第二时 间信息与所述第一时间信息进行比较,并且在所述第二时间晚于所...

【专利技术属性】
技术研发人员:长塚雅明
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1