System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能信息物理交通系统,尤其涉及一种基于超图的智能信息物理交通系统资源管理方法及系统。
技术介绍
1、随着智能消费电子产业的发展,智能信息物理网络中的消费电子产品及其产生的服务数量迅速增加。然而,客户数量的激增也带来了一些问题,包括频谱资源短缺以及多个不同客户之间的相互干扰,这阻碍了icts中多个消费者之间的大量数据交互。因此,为客户设计资源分配方法以提高网络性能,同时避免客户之间的干扰成为一个关键问题。
2、近年来,复杂干扰环境下的资源分配受到广泛关注。随着客户数量及其服务质量要求的增加,异构网络中以客户为中心的通信模式已成为当前的焦点。在这种场景下,由于大量客户密集部署,其通信区域重叠更加严重,导致大量重叠干扰,严重影响通信服务质量。因此,研究人员非常关注客户之间严重重叠干扰下的资源分配。有文献提出了一种新颖的资源分配方法,该方法使用拓扑信息和信道统计来避免来自周围客户的重叠干扰。有文献提出了一种分布式算法,该算法结合了非均匀价格讨价还价和鲁棒功率控制来抑制客户之间的同信道干扰。有文献提出了一种基于图论的文件调度协议和资源分配算法来分配资源,同时避免组内干扰和组间干扰。有文献提出了一种客户聚类算法,该算法消除了簇内干扰并提高了簇内资源效率。上述文献大多关注单个客户对之间的干扰,而很少考虑多个客户共同形成的重叠干扰。请注意,即使来自单个客户的干扰很弱,基于干扰的累积效应,来自多个客户的重叠干扰也可以构成强干扰。当邻近客户形成的累积干扰超过阈值时,会降低所有客户的通信质量。而且,在以客户为中心的icts通
技术实现思路
1、本专利技术提供基于超图的智能信息物理交通系统资源管理方法及系统,解决的技术问题在于:如何实现以客户为中心的icts通信中,客户之间的干扰避免,并同时改善网络容量。
2、为解决以上技术问题,本专利技术提供基于超图的智能信息物理交通系统资源管理方法,包括步骤:
3、s1、建立智能信息物理交通系统的超图干扰模型;
4、所述智能信息物理交通系统包括n个客户、m个设备到设备的客户对、多个路边单元和k个不同的信道资源,所述路边单元提供对网络的辅助接入,为不同的客户分配资源;每个信道最多分配给一个客户,并且每个客户对或客户最多使用一个信道;
5、所述超图干扰模型建立为h=(v,e),v表示由客户和客户对构成的顶点集,e表示超边集,超边集中的超边有强干扰形成的超边和累积干扰形成的超边,如果两个客户或客户对之间产生的干扰超过干扰阈值则该两个客户或客户对之间存在一条强干扰形成的超边,如果多个客户或客户对产生的干扰超过干扰阈值,则该多个客户或客户对存在一条累积干扰形成的超边;h=(v,e)由关联矩阵i表示为:
6、
7、关联矩阵i中第f行第j列的元素vf表示顶点集中第f个顶点,ej表示超边集中第j条超边,1≤a≤f,1≤b≤j,f表示顶点数,j表示超边数;
8、s2、根据所述超图干扰模型和所述智能信息物理交通系统的传输速率、功率,采用基于强化学习的深度q网络求解资源分配策略。
9、进一步地,所述步骤s2具体包括步骤:
10、s21、结合功率、信道选择和干扰建立求解客户和客户对的速率的初始优化模型如下:
11、
12、
13、
14、
15、
16、
17、
18、其中,为第n个客户cn的通信速率,为第m个客户对dm的通信速率,ξn,k为cn对信道k的选择因素,ζm,k为dm对信道k的选择因素,和分别表示cn和dm的发射功率,表示cn与路边单元之间的信道传输增益,为dm的信道传输增益,ith为干扰阈值,δ为干扰概率,为客户正常通信所需的最小速率,为客户对正常通信所需的最小速率,ψ为满足客户的通信所需最小速率的概率,ρ为满足客户对的通信所需最小速率的概率,pmax为最大功率阈值,pr{·}表示{·}中事件违规的概率,约束是客户和客户对共存的干扰概率约束,表示客户和客户对的干扰不应超过干扰阈值的概率,表示每个信道最多分配给一个客户,约束表示每个客户对最多使用一个信道,约束和表示保证客户正常通信所需的最小速率的概率约束,约束表示功率约束;
19、s22、对所述初始优化模型进行简化,得到最终优化模型:
20、s23、基于离散马尔可夫决策过程、基于强化学习的深度q网络和所述超图干扰模型、所述最终优化模型创建干扰避免资源分配模型;
21、s24、利用所述干扰避免资源分配模型求解下一时刻的资源分配策略。
22、进一步地,在所述步骤s22中,所述最终优化模型表示为:
23、
24、
25、
26、
27、
28、
29、其中,为化简后的表示为:
30、
31、cc、cd、qc、qd是为了简化形式而自定义的中间参数,表示为:
32、
33、σ2表示信道噪声功率;
34、其中,为自定义的参数,表示为:
35、
36、是一个辅助变量,
37、其中,为自定义的参数,表示为:
38、
39、和为估计的第n个客户和第m个客户对的信道增益,为客户的信道估计误差,τ为客户对的信道估计误差,q-1()为高斯反函数。
40、进一步地,所述干扰避免资源分配模型包括q网络、回放缓冲区、损失函数、∈-greedy算法,强化学习代理通过深度神经网络从所述智能信息物理交通系统、所述超图干扰模型和所述最终优化模型中提取包括发射功率、干扰状态、客户及客户对的传输速率的状态信息,并将所述智能信息物理交通系统执行当前动作at获取到当前状态信息的奖励rt一起发送至所述q网络,所述q网络输出最大的动作价值q(st,at;θ),由所述∈-greedy算法根据q(st,at;θ)选择最大化预期长期奖励的下一个动作作用于所述智能信息物理交通系统。
41、进一步地,在所述步骤s23中,所述干扰避免资源分配模型的马尔科夫决策问题表示为:
42、
43、即获得最优分配策略π最大化累积贴现奖励j(π),为期望算子,累积折扣奖励γ是折扣因子,rt是当前累计折扣奖励,rt由下式计算:
44、
45、其中,kt是当前使用的通信资源的数量,|v|表示顶点的数量,表示第k个资源的分配冲突度,定义为:
46、
47、ic(vi,k)表示分配相同的资源k的客户vi和客户v之间的冲突,ic(vi,k)定义为:
48、
49、进一步地,所述q网络的损失函数定义为:
...【技术保护点】
1.基于超图的智能信息物理交通系统资源管理方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,所述步骤S2具体包括步骤:
3.根据权利要求2所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,在所述步骤S22中,所述最终优化模型表示为:
4.根据权利要求3所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于:所述干扰避免资源分配模型包括Q网络、回放缓冲区、损失函数、∈-greedy算法,强化学习代理通过深度神经网络从所述智能信息物理交通系统、所述超图干扰模型和所述最终优化模型中提取包括发射功率、干扰状态、客户及客户对的传输速率的状态信息,并将所述智能信息物理交通系统执行当前动作at获取到当前状态信息的奖励rt一起发送至所述Q网络,所述Q网络输出最大的动作价值Q(st,at;θ),由所述∈-greedy算法根据Q(st,at;θ)选择最大化预期长期奖励的下一个动作作用于所述智能信息物理交通系统。
5.根据权利要求4所述的基于超图的智能信息物理交通系统资源管理方
6.根据权利要求5所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,所述Q网络的损失函数定义为:
7.根据权利要求6所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,求解所述最终优化模型的步骤包括:
8.根据权利要求7所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于:在所述步骤S224中,求得的解表示为:
9.基于超图的智能信息物理交通系统资源管理系统,其特征在于:包括超图干扰模型生成模块和无干扰资源分配模块,分别用于执行权利要求1~8任意一项所述的步骤S1、S2。
...【技术特征摘要】
1.基于超图的智能信息物理交通系统资源管理方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,所述步骤s2具体包括步骤:
3.根据权利要求2所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于,在所述步骤s22中,所述最终优化模型表示为:
4.根据权利要求3所述的基于超图的智能信息物理交通系统资源管理方法,其特征在于:所述干扰避免资源分配模型包括q网络、回放缓冲区、损失函数、∈-greedy算法,强化学习代理通过深度神经网络从所述智能信息物理交通系统、所述超图干扰模型和所述最终优化模型中提取包括发射功率、干扰状态、客户及客户对的传输速率的状态信息,并将所述智能信息物理交通系统执行当前动作at获取到当前状态信息的奖励rt一起发送至所述q网络,所述q网络输出最大的动作价值q(st,at;θ),由所述∈-gree...
【专利技术属性】
技术研发人员:黄杰,张仕龙,杨凡,喻涛,杨成,赖显智,蔡杰良,
申请(专利权)人:重庆理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。