一种基于信息年龄的算力资源调度方法技术

技术编号：41668915 阅读：10 留言：0更新日期：2024-06-14 15:26

本发明专利技术提出一种基于信息年龄的算力资源调度方法，该方法通过结合实时服务平台和网络状态条件，完成计算型任务与算力中心的匹配，实现了AoI、能耗与计算精确度的权衡，达到算力资源有效调度和智能管理的目的。本发明专利技术考虑计算型任务对AoI、能耗与计算精确度三方面的需求，将算力资源调度问题建模为通信与算力资源约束下的最大化任务效用问题，并将其转化为马尔可夫决策问题，鉴于任务到达的动态性和信道的随机性，建立深度Q学习网络算法求解上述问题，可得到实时的算力资源调度策略。本发明专利技术方法较于现有算力资源调度方法在系统的任务效用上具有优势，并通过调整不同性能指标的权重，实现了对AoI、能耗和计算精确度的灵活调控，以满足不同场景需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及算力资源调度，具体涉及一种基于信息年龄的算力资源调度方法。

技术介绍

1、云计算技术作为一种计算模型，为数据中心管理、网络服务供给以及大规模计算等领域带来了极大的便利。然而，随着云计算的广泛应用，如何在资源有限的情况下确保数据的新鲜度和实时性，成为了技术发展的一大挑战。

2、aoi作为衡量数据新鲜度和实时性的关键指标，在保证数据质量和系统性能方面有至关重要的作用，特别是在涉及大量数据传输和计算的系统中，针对aoi的性能优化显得尤为重要，如在在线游戏、智能驾驶等实时应用场景中，过时信息会造成用户的服务体验下降，甚至造成判断失误进一步引发安全性问题。

3、常见的资源匹配算法是静态的，并未根据实时需求和资源状态进行动态调整。此外，现有算力资源调度方法未有效地考虑aoi、能耗和计算精确度之间的权衡，导致了资源利用率低下以及性能瓶颈。因此，亟需设计一种综合考虑aoi、能耗和计算精确度等因素的动态算力资源调度方法。

技术实现思路

1、本专利技术旨在解决云计算场景中算力中心在处理大规模计算型任务时无法同时兼顾数据新鲜度、低能耗、计算精确度等性能的问题。本专利技术采用一种基于信息年龄(age ofinformation，aoi)的算力资源调度方法，通过结合实时服务平台和网络状态条件，有效调度算力中心的算力资源，实现了对aoi、能耗和计算精确度等性能的平衡，达到算力资源有效调度和智能管理的目的。本专利技术方法考虑计算型任务对aoi、能耗与计算精确度三方面的需求，

2、本专利技术采用以下技术方案实现：

3、一种基于信息年龄(age of information，aoi)的算力资源调度方法，该方法面向云计算中的算力资源调度场景，在所述云计算中的算力资源调度场景中，存在一个服务平台集w＝(ω1,ω2,…ωi…,ωm)，其中元素ωi代表一个服务平台，每个服务平台有随机且独立的任务到达；该场景下同时存在一个算力调度中心，其下属有不同性能的算力中心，构成算力中心集s＝(s1,s2,…sj…,sn)，其中元素sj代表一个算力中心，假定m≥n。算力中心可以独立完成不同的计算型任务。所述算力调度中心实时收集每个服务平台的任务信息，并根据任务信息将当前任务匹配给下属的算力中心完成处理；具体包括如下步骤：

4、1)基于服务平台的异构性，确定服务平台的任务到达方式，所述服务平台的任务到达方式具体为：将一段连续时间分为t个离散时段，表示为{1,2,3,…,t}；每个时段称为一个时隙，每个时隙对应一个恒定的持续时间，表示为τ；

5、2)对算力调度中心、算力中心和服务平台进行如下限制：

6、i)每个算力中心的算力资源是固定的；

7、j)每个算力中心在一个时隙t内只能被一个服务平台的任务匹配；

8、k)所有任务使用的算力资源量不能超过总算力资源量；

9、l)每个任务的最大处理时间均不超过时隙长度τ；

10、m)每一时隙服务平台的任务到达符合泊松分布；

11、n)用户传输任务到服务平台的传输时延符合泊松分布；

12、o)如果服务平台ωj上次任务到达后未被处理，且在新时隙有新的任务到达，则未被处理的任务将被放弃，并由新的任务替代后继续进行任务匹配；

13、p)当任务到达数量大于算力中心的数量n时，要求算力中心必须进行全部匹配；

14、3)为了保证问题的长期随机优化特性，本专利技术将算力资源调度问题转换为马尔可夫决策问题(markov decision process，mdp)，mdp由三个关键要素组成，即mdp＝{state，action，reward}，其中，state为一个有限的状态集合，action为一个有限的动作集合，reward为即时奖励函数；

15、三个关键要素的具体定义如下：

16、(1)state

17、state＝{s(1),s(2),…s(t),…s(t)}

18、在时隙t，系统状态包括所有服务平台当前的到达任务所需的算力资源量和aoi，故状态s(t)定义为：s(t)＝(at,bt)

19、at＝{a1(t),a2(t),…ai(t)…,am(t)},bt＝{b1(t),b2(t),…bi(t)…,bm(t)}

20、其中，ai(t)表示服务平台ωi当前任务mi的aoi，bi(t)表示任务mi在时隙t所需的算力资源量；

21、ai(t)定义为当前时隙t与任务mi发布时隙fi(t)之差，考虑传输信道的随机性，任务从用户处传输到服务平台会产生一定的时延；ai(t)采用如下公式计算得到：

22、ai(t)＝t-fi(t)

23、

24、其中，表示用户传输任务到服务平台的传输时延，ai(t)为服务平台ωi当前任务mi的产生时隙；

25、(2)action

26、action＝{ac(1),ac(2),…ac(t),…ac(t)}

27、动作ac(t)定义为任务与算力中心的匹配关系，即ac(t)＝{ac1(t),ac2(t)}

28、其中，ac1(t)＝{m1(t),m2(t),…mi(t)…,mm(t)}，代表每个任务处理决策；ac2(t)＝{x1j(t),x2j(t),…xij(t)…,xmj(t)}，代表每个任务的匹配策略；

29、其中，mi(t)为任务处理决策，用于判断任务是否被处理；xij(t)为任务匹配策略，表示为xij(t)＝{0,1}，xij(t)＝1表示在时隙t时算力中心sj匹配到服务平台ωi当前的任务mi，xij(t)＝0表示在时隙t时算力中心sj没有匹配到服务平台ωi当前的任务mi；假定每个任务只能由一个服务平台执行，则任务匹配策略满足约束

30、mi(t)采用如下公式计算得到：

31、

32、其中，mi(t)＝1，则该任务被处理；mi(t)＝0，该任务未被处理；

33、(3)reward

34、资源调度问题的目标是最大化系统的任务效用，故将时隙t的即时回报奖励函数设计如下：

35、

36、其中，uij(t)表示一轮任务被处理后为平台带来的效用，由于aoi的数值与能耗的数值和效用呈相反的本文档来自技高网...

【技术保护点】

1.一种基于信息年龄的算力资源调度方法，其特征在于，该方法面向云计算中的算力资源调度场景，在所述云计算中的算力资源调度场景中，存在一个服务平台集W＝(v1,v2,…vi…,ωm)，其中元素ωi代表一个服务平台，每个服务平台有随机且独立的任务到达；该场景下同时存在一个算力调度中心，其下属有不同性能的算力中心，构成算力中心集S＝(s1,s2,…sj…,sN)，其中元素sj代表一个算力中心，假定M≥N；

2.根据权利要求1所述的基于信息年龄的算力资源调度方法，其特征在于，所述DQN算法的训练过程包括如下步骤：

【技术特征摘要】

1.一种基于信息年龄的算力资源调度方法，其特征在于，该方法面向云计算中的算力资源调度场景，在所述云计算中的算力资源调度场景中，存在一个服务平台集w＝(v1,v2,…vi…,ωm)，其中元素ωi代表一个服务平台，每个服务平台有随机且独立的任务到达；该场景下同时存...

【专利技术属性】
技术研发人员：孙浩阳，陈冰星，艾文倩，俞竹轩，周旭颖，
申请(专利权)人：中国计量大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人