System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 2.5D芯粒架构下针对垂直链路的负载均衡策略制造技术_技高网

2.5D芯粒架构下针对垂直链路的负载均衡策略制造技术

技术编号:44543527 阅读:1 留言:0更新日期:2025-03-11 14:09
本发明专利技术涉及一种2.5D芯粒架构下针对垂直链路的负载均衡策略,用于解决网络流量不均衡导致垂直链路上的流量分布不均匀的问题,进而提高系统的整体性能。首先对网络参数进行量化衡量,根据网络状况判定垂直链路是否处于不均衡状态。不均衡状态是由部分节点的流量高于平均流量导致,寻找流量较高的热点节点。针对这些节点制定分配策略,将流量转移到较空闲的链路上。结合强化学习的优点,采用Q‑Learning算法,对划分时机进行优化。

【技术实现步骤摘要】

本专利技术属于计算机体系结构领域,具体设计一种2.5d芯粒架构下针对垂直链路的负载均衡策略。


技术介绍

1、随着晶体管尺寸逐渐逼近物理极限,摩尔定律已经走到了尽头,当晶体管的尺寸缩小到一定程度后,量子隧穿效应、漏电流增加等物理现象变得难以控制,这直接影响了芯片的良率和性能,同时也限制了进一步提高集成电路密度的可能性。在这种背景下,ai、大语言模型的迅速发展对算力的需求却在不断增长。因此,半导体行业开始寻求新的解决方案,以在不依赖于更先进的工艺节点的情况下提升计算性能。

2、芯粒(chiplet)技术通过将一个大芯片拆解为多个较小的、易于制造的芯粒,然后将这些芯粒通过先进封装技术集成在一起,从而实现更高的计算性能。芯粒技术基于模块化设计理念,不仅可以降低制造工艺的复杂性,还能够支持异构芯粒的集成,这意味着不同功能的芯粒可以组合在一起,形成一个功能更为强大的系统。这种方法不仅简化了设计流程,还缩短了设计周期,使得芯片的开发更加灵活和高效。

3、在现有的封装技术中,3d集成方案是一种将芯粒进行垂直堆叠,并通过硅穿孔(tsv)实现芯粒间连接的技术。这种方法虽然能够显著提高芯片的集成密度,但同时也带来了许多问题。首先,3d集成中的布线复杂度极高,因为需要在多个垂直层之间进行精确的连接。其次,由于芯片内的热量无法有效散发,热量会在垂直堆叠的芯粒之间积聚,导致芯片的工作温度升高。这不仅降低了芯片的可靠性,还可能缩短芯片的使用寿命。此外,高能量密度也增加了芯片出现故障的风险,这些因素都使得3d集成技术在实际应用中面临诸多挑战。

4、为了解决这些问题,2.5d集成方案将芯粒放置在一个中介板上,芯粒之间通过中介板通信。这种方案虽然降低了芯片的集成密度,但同时也简化了制造过程,并增加了芯片的散热面积,从而提高了芯片的稳定性和可靠性。在2.5d集成方案中,中介板分为有源和无源两种类型。无源中介板仅提供物理连接,而有源中介板还可以集成一些功能性组件,如路由器、缓冲器等。这使得有源中介板具备了更强的灵活性和可扩展性,能够更好地适应不同的应用需求,因此成为了当前2.5d封装技术的主流选择。

5、在基于有源中介板的2.5d芯粒架构中,芯粒通过垂直链路连接到中介板,并与其他系统组件进行通信。如果所有芯粒内部的节点(片内节点)都直接连接到中介板,会导致布线密度过高,增加中介板上的网络的复杂性。然而,当多个片内的节点共享同一条垂直链路进行外部通信时,如何均衡地分配这些垂直链路的资源成为了一个关键问题。首先,节点流量被区分为站内流量(目的节点在源节点所在芯粒内部,无需经过垂直链路)和出站流量(目的节点在源节点所在芯粒外)。现有的方法通常将片内节点与垂直链路绑定,即某个节点的所有出站流量通过同一条垂直链路传输,并且主要关注解决垂直链路中的死锁问题,却较少考虑节点流量的动态变化。这种忽视可能导致在一些情况下,少量热点节点的流量激增,造成垂直链路上的流量分布不均匀。部分垂直链路可能会因此过载,而其他链路的带宽资源却未被充分利用。因此,实现垂直链路的负载均衡成为了亟待解决的问题。


技术实现思路

1、本专利技术提出了一种针对2.5d芯粒架构下垂直链路上的负载均衡策略。

2、本专利技术提供的一种负载均衡策略在网络流量不均衡导致部分垂直链路拥塞的状况下,对热点节点的出站流量进行划分,将流量分配到较为空闲的垂直链路上,从而提高垂直链路利用率并降低包的等待时延。流量的划分会使包的传输路径延长,导致系统能耗提升,同时增加了包的传输时延。在网络空闲时划分流量不能提升系统的整体性能,所以需要在合适的状况下使用该策略。为了实现这一策略,首先确定了2.5d芯粒架构,对网络参数进行量化衡量,根据网络状况判定是否进行流量划分以及如何划分。结合强化学习的优点,采用q-learning算法,对划分时机进行优化。q-learning是一种基于价值的强化学习方法,智能体通过观察当前状态、执行动作并接收反馈(奖励),来逐步改进它对未来状态采取何种动作的决策规则。q-learning的核心在于一个名为q表的结构,它记录了在特定状态下执行特定动作所能获得的预期回报。智能体通过不断的尝试与错误学习,更新q表中的值,最终收敛到一个最优策略,使得在任何给定状态下所采取的动作都能够最大化长期累积奖励。在2.5d芯粒架构中,q-learning能够处理动态变化的环境,并且不需要提前知道环境的全部信息。特别是在网络流量频繁变动的情况下,q-learning能够根据最新的网络状况调整流量分配策略,以达到负载均衡的目的。该方法不需要显式的环境模型,计算复杂度低,对硬件需求低。

3、下面具体介绍本专利技术所述方法及其实现原理。

4、本文的方法对芯粒和中介板是类似的,为了简洁起见,仅讨论单个芯粒。片内路由器集合为r={r1,r2,…,rn},垂直链路集合为vl={v1,v2,…,vv}。

5、步骤1.收集网络信息,判定不平衡状态,寻找热点节点。

6、本文使用注入率ir(injection rate)衡量节点的流量大小,注入率是指平均每个周期节点向网络注入包的数量。整个芯粒内网络的拥塞程度可以用平均注入率iavg表示:

7、

8、平均注入率会影响网络的等待时延,在网络拥塞状态下进行流量分配、采用较长的传输路径会带来相较空闲时更多的时延提升。对于垂直链路v负载lv使用所有片内节点对v的出站流量注入率之和表示:

9、

10、其中表示节点r的出站流量注入率。当r使用v作为垂直链路传输时否则为0。垂直链路上的平均负载lavg为各链路负载的算数平均值:

11、

12、为了衡量垂直链路的负载不均衡程度,计算负载的偏斜度(skewness)sc:

13、

14、当sc大于阈值tunbalance,即sc>tunbalance时,判定系统处于负载不均衡状态,该阈值设置为5或更高,表示系统对于不均衡的容忍程度。当处于不均衡状态时,寻找引起负载不均衡的热点节点。站内流量对于垂直链路是不会产生负载的,为了找到出站流量的热点节点,定义平均出站注入率为:

15、

16、如果一个节点r的出站流量注入率显著高于平均出站注入率,则定义其为热点节点,使用式(6)判断:

17、

18、thotspot是判断热点节点的阈值,代表网络的吞吐能力,对于吞吐量较高的系统,局部激增流量的影响较小,可以选择较高的阈值,在本例中使用t_hotspot=5.0。。

19、本文的方法使用距离来衡量流量传输的成本,对于两个节点,它们之间的距离定义为传输所需要的最小跳数。在二维网格结构中,节点r1和节点r2的距离可以由路由器的x轴方向坐标和y轴方向坐标计算:

20、

21、对于片内节点和垂直链路之间的距离,用路由器和对应边界路由器之间的距离表示。

22、对于热点节点r,其绑定的垂直链路为本文档来自技高网...

【技术保护点】

1.一种2.5D芯粒架构下针对垂直链路的负载均衡策略,其特征在于,包括以下步骤:

【技术特征摘要】

1.一种2.5d芯粒架构下针对垂直链路的...

【专利技术属性】
技术研发人员:方娟古明辉潘晨阳翟冉
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1