数据中心无损网络中基于拥塞反馈的数据流传输控制方法技术

技术编号:34642363 阅读:24 留言:0更新日期:2022-08-24 15:18
本发明专利技术公开一种数据中心无损网络中基于拥塞反馈的数据流传输控制方法,步骤包括:检测交换机输出端口的数据分组的队列长度,判断输出端口的拥塞状态;如果处于无拥塞状态,则直接转发数据分组;如果处于持续拥塞状态,则启动ECN标记功能,对数据分组进行ECN标记后通过目的输出端口发送,以根据ECN标记控制发送速率;如果处于突发拥塞状态,则禁用ECN标记功能直至队列长度下降指定阈值,转发数据分组,同时生成拥塞通告报文CNM并直接通告拥塞流的发送端,以根据拥塞通告报文CNM控制发送速率。本发明专利技术能够快速反馈突发拥塞,避免PFC触发和PFC引起的队头阻塞,且具有实现方法简单、控制实现成本低且效率高等优点。实现成本低且效率高等优点。实现成本低且效率高等优点。

【技术实现步骤摘要】
数据中心无损网络中基于拥塞反馈的数据流传输控制方法


[0001]本专利技术涉及数据中心无损网络
,尤其涉及一种数据中心无损网络中基于拥塞反馈的数据流传输控制方法。

技术介绍

[0002]为了降低数据中心内部网络传输延时、提高网络吞吐率,基于远程直接内存访问(remote direct memory access,RDMA)的RoCE(rdma over converged ethernet)技术广泛部署于以太网数据中心网络(data center network,DCN)。但是,在RDMA传输过程中,即使是单个数据包丢失也会大大降低网络吞吐率,使得流完成时间大幅增加,严重损害了应用服务的性能。
[0003]为了保证高效、可靠的RDMA数据传输,数据中心以太网络广泛部署了基于优先级的流量控制(priority

based flow control,PFC)机制,防止缓存溢出。PFC机制是基于端口的逐跳流控机制,当交换机入端口队列长度超过PFC的暂停阈值,则向上游交换机发送PFC暂停报文,暂停上游交换机相关出端口的数据传输;当入端口队列长度减小到小于PFC的恢复阈值后,则向上游端口发送PFC恢复报文,恢复其数据传输。
[0004]但是上述基于端口的PFC暂停/恢复机制极容易导致队头阻塞、拥塞扩散和死锁等问题。即当交换机某个出端口被PFC暂停了,将导致队列中发送到其他无拥塞的出端口的数据包也被阻塞。更严重的是,当网络中某个交换机持续发生拥塞时,PFC逐跳流控机制最终会使得与该拥塞无关的上游交换机都会接收到PFC暂停信号并暂停数据包的转发,造成数据包的排队延时增加、网络吞吐率下降,显著增加了流的传输完成时间。
[0005]为了解决上述问题,一些流级别的端到端传输协议,如DCQCN(Data Center Quantized Congestion Notification)、TIMELY、HPCC、Swift和PCN等协议相继被提出,可以有效缓解网络拥塞,减少PFC的触发次数。但是上述传输协议解决网络拥塞时还会存在以下问题:
[0006]1、至少要1个RTT才能感知到网络拥塞,因而通常需要多个RTT才能将流的速率收敛到目标速率。
[0007]2、虽然能有效控制长流造成的持续拥塞,但难以控制生命期极短的突发短流所造成的突发拥塞。
[0008]3、在突发拥塞场景下,即使部署了上述端到端的传输协议,也会不可避免地触发PFC,出现PFC的负面问题。
[0009]因此,如何快速反馈拥塞,避免PFC触发,从而避免PFC的负面影响、加速流的完成,提升应用性能和用户体验,是亟待解决的问题。

技术实现思路

[0010]本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种实现方法简单、成本低、效率高的数据中心无损网络中基于拥塞反馈的数据流传输控制
方法,能够快速反馈拥塞,避免PFC触发和PFC引起的队头阻塞,加速流的完成,提升应用性能和用户体验。
[0011]为解决上述技术问题,本专利技术提出的技术方案为:
[0012]一种数据中心无损网络中基于拥塞反馈的数据流传输控制方法,步骤包括:
[0013]检测交换机输出端口的数据分组的队列长度,根据检测到的队列长度判断输出端口的拥塞状态;
[0014]如果输出端口的拥塞状态处于无拥塞状态,则直接转发数据分组到目的输出端口以发送给主机端;
[0015]如果输出端口的拥塞状态处于持续拥塞状态,则启动ECN标记功能,对数据队列中指定数据分组进行ECN标记后通过目的输出端口发送数据分组给主机端,以根据所述ECN标记控制主机端发送速率;
[0016]如果输出端口的拥塞状态处于突发拥塞状态,且拥塞流的数据分组与非拥塞流共享输入端口,则禁用ECN标记功能直至队列长度下降指定阈值,转发数据分组到目的输出端口,同时生成拥塞通告报文CNM并直接通告拥塞流的发送端,以根据拥塞通告报文CNM控制主机端发送速率。
[0017]进一步的,所述根据检测到的队列长度判断输出端口的拥塞状态包括:当所述队列长度小于预设ECN标记阈值QECN时,则判定输出端口处于无拥塞状态;当所述队列长度在预设ECN标记阈值QECN和预设突发拥塞反馈阈值QCNM之间时,则判断输出端口处于持续拥塞状态;当所述队列长度超过预设突发拥塞反馈阈值QCNM时,则判定输出端口处于突发拥塞状态。
[0018]进一步的,所述如果输出端口的拥塞状态处于持续拥塞状态时,对数据队列中超过所述预设ECN标记阈值QECN的数据分组进行ECN标记。
[0019]进一步的,所述如果输出端口的拥塞状态处于突发拥塞状态时,判断分组是否与非拥塞流共享输入端口,如果是禁用ECN标记功能直到队列长度下降到所述预设ECN标记阈值QECN以下再重新开启ECN标记功能,否则直接转发数据分组。
[0020]进一步的,所述突发拥塞反馈阈值QCNM的值在范围[Q
ECN
,max(Q
ECN
,Q
PFC
/M

3dC*(M

1))]内,其中M为交换机出端口数量,d为链路基础延时,C为链路带宽,Q
PFC
为预设PFC暂停阈值。
[0021]进一步的,还包括在接收端判断接收到的接收分组是否带有ECN标记的分组,如果是将ECN标记复制到拥塞通告分组CNP中,周期性向发送端发送所述拥塞通告分组CNP以及ACK信号,否则直接发送ACK信号给发送端。
[0022]进一步的,还包括根据接收到的数据分组类型控制发送端的发送速率,当接收到所述拥塞通告分组CNP(congestion notification packet)时,按照AIMD算法调节发送速率,当接收到带有拥塞通告报文CNM的数据分组时,将发送速率直接设为目标速率再发送数据分组。
[0023]进一步的,所述按照AIMD(Additive Increase Multiplicative Decrease,加性增乘性减)算法调节发送速率包括:
[0024]如果所述拥塞通告分组CNP中拥塞标记为1,则按照式计算ECN标记比例其中g为速率调节权重,为最近一个统计周期内的ECN标记比例,然后计算调节
后的新发送速率:
[0025]如果所述拥塞通告分组CNP中拥塞标记为0,则按照式计算ECN标记比例然后计算调节后的新发送速率:新的发送速率=(目标速率+当前发送速率)/2。
[0026]进一步的,所述当接收到带有拥塞通告报文CNM的数据分组时,将发送速率直接设为C/N目标速率,其中C为链路带宽,N为带有拥塞通告报文CNM的数据分组携带的拥塞流数量。
[0027]一种存储有计算机程序的计算机可读存储介质,所述计算机程序执行时实现如上述方法。
[0028]与现有技术相比,本专利技术的优点在于:
[0029]1、本专利技术在数据中心无损网络中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心无损网络中基于拥塞反馈的数据流传输控制方法,其特征在于,步骤包括:检测交换机输出端口的数据分组的队列长度,根据检测到的队列长度判断输出端口的拥塞状态;如果输出端口的拥塞状态处于无拥塞状态,则直接转发数据分组到目的输出端口以发送给主机端;如果输出端口的拥塞状态处于持续拥塞状态,则启动ECN标记功能,对数据队列中指定数据分组进行ECN标记后通过目的输出端口发送数据分组给主机端,以根据所述ECN标记控制主机端发送速率;如果输出端口的拥塞状态处于突发拥塞状态,且拥塞流的数据分组与非拥塞流共享输入端口,则禁用ECN标记功能直至队列长度下降指定阈值,转发数据分组到目的输出端口,同时生成拥塞通告报文CNM并直接通告拥塞流的发送端,以根据拥塞通告报文CNM控制主机端发送速率。2.根据权利要求1所述的数据中心无损网络中基于拥塞反馈的数据流传输控制方法,其特征在于,所述根据检测到的队列长度判断输出端口的拥塞状态包括:当所述队列长度小于预设ECN标记阈值QECN时,则判定输出端口处于无拥塞状态;当所述队列长度在预设ECN标记阈值QECN和预设突发拥塞反馈阈值QCNM之间时,则判断输出端口处于持续拥塞状态;当所述队列长度超过预设突发拥塞反馈阈值QCNM时,则判定输出端口处于突发拥塞状态。3.根据权利要求2所述的数据中心无损网络中基于拥塞反馈的数据流传输控制方法,其特征在于,所述如果输出端口的拥塞状态处于持续拥塞状态时,对数据队列中超过所述预设ECN标记阈值QECN的数据分组进行ECN标记。4.根据权利要求2所述的数据中心无损网络中基于拥塞反馈的数据流传输控制方法,其特征在于,所述如果输出端口的拥塞状态处于突发拥塞状态时,判断数据分组所属拥塞流是否与非拥塞流共享输入端口,如果是禁用ECN标记功能直到队列长度下降到所述预设ECN标记阈值QECN以下再重新开启ECN标记功能,否则直接转发数据分组。5.根据权利要求2所述的数据中心无损网络中基于拥塞反馈的数据流传输控制方法,其特征在于,所述突发拥塞反馈阈值QCNM的值在...

【专利技术属性】
技术研发人员:胡晋彬罗望卿何熠王进
申请(专利权)人:长沙理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1