System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向物理层安全感知协作通信的动态分层联盟博弈方法技术_技高网

面向物理层安全感知协作通信的动态分层联盟博弈方法技术

技术编号:41346123 阅读:2 留言:0更新日期:2024-05-20 10:01
本发明专利技术公开了一种面向物理层安全感知协作通信的动态分层联盟博弈方法,对于考虑物理层安全的协作通信环境中,具有中继和干扰功能的第三方协作设备、合法用户和窃听设备三方之间存在合作与对抗关系,因此,该方法采集结合匹配博弈和联盟博弈的分层博弈来建模表征这种关系的动态变化,以三方各自的长期效用最大化为目标,实现三方设备的智能决策。所述方法包括两个阶段,匹配阶段设计具有设备限制性的延迟接受算法来确定第三方协作设备的最佳决策,包括模式切换、工作功率分配和子信道选择;联盟阶段设计联盟形成算法来完成三方设备的盟友选择,然后基于深度强化学习框架整合这两个阶段求得整体分层博弈的均衡解,三方设备各自维护一个智能体,代表各自的偏好序列对匹配阶段进行指导,联盟阶段依据匹配结果最终确定三方设备的最佳决策。

【技术实现步骤摘要】

本专利技术属于物理层安全领域,具体涉及在考虑物理层安全的无线传输中存在的三方网络设备之间对抗与结盟的智能决策,尤其涉及一种面向物理层安全感知协作通信的动态分层联盟博弈方法


技术介绍

1、协作通信利用无线设备之间的合作来提高通信性能,这通常通过信号转发和天线资源共享等方式来实现。然而,由于无线信号的广播性质,合法用户间通信的安全性能容易受到主动窃听设备的威胁,而物理层安全技术利用无线通信的物理特性来保护合法通信。协作通信具有覆盖范围广、接入用户多、数据传输量大等特点,这使得它在物理层安全领域具有广阔的前景。部署协作设备,包括了中继器和干扰器等设备,适当的协作方案可以提高目标信道的安全传输速率。

2、在无线协作网络中,共享天线资源或参与信号转发的设备被称为协作设备。由于信道上不同信号间存在干扰的特性,这些协作设备可以成为干扰设备。具体而言,为了帮助合法用户,协作设备可以充当中继器,将信号从源传输到目的地,也可以通过传输人工噪声来混淆窃听设备,充当友好的干扰器,从而增强lu传输的保密性。而为了帮助窃听设备,协作设备通常被用作额外的窃听设备来拦截合法用户,同时发送干扰信号以降低合法用户的通信质量,从而提高窃听设备的窃听效率。作为一种可行的物理层安全技术,目前的研究重点是将中继功能模式和干扰功能模式结合起来,在协作设备上实施服务于不同的网络状况。

3、然而,大多数研究假设这些协作设备隶属于合法用户或者窃听设备,由其中一方部署并配置,而没有考虑协作设备也有自己的利益需求,这种协作设备被称为第三方协作设备。第三方协作设备通过为合法用户和窃听设备提供帮助来换取它们的报酬,同时也会产生一定的损耗,因此它们倾向于选择能够带来更高利润的盟友,目前的研究中报酬的方式可以是基于第三方协作设备的功率进行价格补偿,也可以是通过射频信号向第三方协作设备提供额外能量。由于在现实场景中,合法用户或窃听设备都可能是考虑自身收益的自私的设备,因此合法用户和窃听设备需要平衡它们为第三方协作设备提供的报酬与其带来的辅助能力和性能增量。因此,只有当第三方协作设备提供的帮助实际上有利于合法用户或窃听设备的性能时,才会选择与其结盟,这种自私的行为导致网络中合法用户窃听设备和第三方协作设备之间的联盟关系是可变的。这种可变的关系需要仔细地建模和分析,然而由于以下原因,这是具有挑战性的:一方面第三方协作设备需要确定自己的模式切换、功率分配和信道选择,这显然是一个多维的策略组,此外这些策略并不简单地由第三方写作设备自己的偏好配置,同时还要考虑到盟友的偏好,需要使这些策略同时有利于第三方协作设备与其盟友;另一方面三方的盟友选择也是三方共同确定的,在不同的时间间隙中联盟的情况是不同的,三方总是会选择能够以最低的成本最大化自身收益的合适的盟友。除此以外,由于无线系统中信道条件的不确定性,任一方都会对另外两方的策略做出反应,导致网络中三方的关系动态变化,形成一个内在的分层结构,最终实现三方长期效用的优化与智能决策。


技术实现思路

1、专利技术目的:针对上述现有协作网络中运用物理层安全技术时存在的对三方设备存在的自私性与合作对抗关系动态变化的问题,本专利技术提供一种面向物理层安全感知协作通信的动态分层联盟博弈方法。

2、技术方案:一种面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:所述方法基于分层博弈,面向无线协作通信网络中的合法用户、窃听者和第三方协作设备,采用物理层安全要求的保密传输速率、窃听速率和设备能耗定义三方设备关心的效用函数,以实现三方长期效用最大化为目标,结合匹配博弈和联盟博弈构建分层博弈建模三方设备的动态交互过程,基于深度强化学习设计具有设备限制性的延迟接受算法和联盟形成算法来实现三方设备的盟友选择和智能决策。

3、所述方法包括以下步骤:

4、(1)建立考虑物理层安全的无线协作网络模型,包括若干个第三方协作设备、合法用户和窃听设备之间的链路关系,以及所有信道的状态信息;

5、在无线协作网络中,每对通信的合法用户占用一个正交信道,第三方协作设备的信道选择则会在这些信道中进行,其功率分配划分为k个等级,其模式切换在中继功能模式和干扰功能模式中进行,表示为θn(t)∈{0,1},其中θn(t)=0表示中继模式,θn(t)=1表示干扰模式;网络中每个信道的频率带宽为w。

6、具体地,该步骤是建立第三方协作设备存在的无限写作网络模型,考虑到物理层安全技术构建三方设备之间的链路关系,包括合法发射机与合法接收机之间的合法通信链路、窃听设备对合法发射机的窃听链路,第三方协作设备从合法发射机接收信号的链路、第三方协作设备到合法接收机的转发链路和第三方协作设备到窃听设备的转发链路。合法用户通信时面临窃听设备的窃听攻击,要求实现秘密通信,窃听设备则关注拦截能力。第三方协作设备选择与合法用户和窃听设备中的一方结盟,利用自己的中继能力和干扰能力来提高合法用户的保密传输速率或窃听设备的拦截率,依次换取来自合法用户和窃听设备的回报。

7、在考虑物理安全的系统中,每对通信的合法用户占用一个频率带宽为w的正交信道,它们的功率确定;第三方协作设备需要选择是否占用这些信道,它们的功率分为k级,表示为pn(t)∈pk,pk={p0,p1,…,pk-1},考虑的整个时间表示为t={0,1,…,t-1}。

8、(2)根据网络中通信和窃听关系,在每个时间间隙中,计算三方设备关心的物理量,合法用户的传输速率cl(t)和保密传输速率rl(t),窃听设备的窃听速率cml(t)和成功拦截率iml(t);

9、进一步地,考虑的物理层安全的无线协作网络场景中,包括如下计算过程:

10、在每个时间间隙中,计算每对合法用户通信中的传输速率cl(t)和保密传输速率rl(t),窃听设备的窃听速率cml(t)和拦截率iml(t)。

11、合法用户的传输速率的计算方法为:

12、

13、

14、

15、

16、cl(t)=wlog2(1+γl(t)),

17、上式中,pl表示发射用户的传输功率,σ2表示接收用户处的零均值加性高斯白躁声,hl(t),hnl(t)和hln(t)分别表示合法通信链路间的信道系数,第三方协作设备到接收用户间的链路的信道系数,发射用户到第三方协作设备间的链路的信道系数,而它们的平方则表示这些链路间的信道增益,colnl(t)和colnm(t)分别表示第三方协作设备是否与合法用户和窃听者结盟;对于窃听速率cml(t)的计算方法为:

18、

19、

20、

21、

22、cml(t)=wlog2(1+γml(t)),

23、上式中,hlm(t)和hnm(t)分别表示发射用户到窃听设备间的链路的信道系数,第三方协作设备到窃听设备间的链路的信道系数,而它们的平方则表示这些链路间的信道增益;保密传输速率rl(t)的计算方法为:<本文档来自技高网...

【技术保护点】

1.一种面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:该方法基于分层博弈,面向无线协作通信网络中的合法用户、窃听者和第三方协作设备,结合保密传输速率、窃听速率和设备能耗构建效用函数,以实现三方长期效用最大化为目标,且结合匹配博弈和联盟博弈构建分层博弈建模三方设备的动态交互过程,基于深度强化学习设计具有设备限制性的延迟接受算法和联盟形成算法来实现三方设备的盟友选择和智能决策;

2.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,在无线协作网络中,每对通信的合法用户占用一个正交信道,第三方协作设备的信道选择则会在这些信道中进行,其功率分配划分为k个等级,其模式切换在中继功能模式和干扰功能模式中进行,表示为θn(t)∈{0,1},其中θn(t)=0表示中继模式,θn(t)=1表示干扰模式;网络中每个信道的频率带宽为W。

3.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(2)中互相通信的合法用户间的传输速率Cl(t)的计算为:

4.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(3)中每对合法通信用户的效用函数rl(t)的计算为:

5.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(4)中的分层博弈在每个时间间隙中包含两个阶段,在第一个阶段针对匹配子博弈三方设备生成各自用于匹配的偏好列表,包括合法用户和第三方协作设备匹配时对彼此的偏好排序,窃听设备和第三方协作设备匹配时对彼此的偏好排序,然后联合确定这两种匹配情况下第三方协作设备的最优模式切换θn(t)、功率分配Pn(t)和信道选择ωnl(t);在第二个阶段针对联盟子博弈三方设备按照各自的优化目标[LP],[MP]和[NP]确定自己的联盟决策εL(t),εM(t),εNL(t)和εNM(t),并确定最终三方的最优智能决策,得到分层博弈整体的均衡解。

6.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:步骤(5)中的具有设备限制性的延迟接受算法是在两种确定性情况下进行的,包括第三方协作设备与合法用户结盟的情况和第三方协作设备与窃听设备结盟的情况,意味着会得到两种情况下各自的匹配结果;

7.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:步骤(6)中设计的联盟形成算法是依据如下准则制定的:

8.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:步骤(7)中用于训练代表三方设备的智能体的算法是基于策略梯度算法和演员-评论家框架设计的:在学习过程中状态空间考虑了信道增益、联盟状态和第三方协作设备的信道选择状态,所有的信道增益包括|hl(t)|2,|hlm(t)|2,|hln(t)|2,|hnl(t)|2和|hnm(t)|2,联盟状态用F(t)表示,第三方协作设备的信道选择状态包括ωnl(t);动作空间采用独热编码缩减空间大小。

...

【技术特征摘要】

1.一种面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于:该方法基于分层博弈,面向无线协作通信网络中的合法用户、窃听者和第三方协作设备,结合保密传输速率、窃听速率和设备能耗构建效用函数,以实现三方长期效用最大化为目标,且结合匹配博弈和联盟博弈构建分层博弈建模三方设备的动态交互过程,基于深度强化学习设计具有设备限制性的延迟接受算法和联盟形成算法来实现三方设备的盟友选择和智能决策;

2.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,在无线协作网络中,每对通信的合法用户占用一个正交信道,第三方协作设备的信道选择则会在这些信道中进行,其功率分配划分为k个等级,其模式切换在中继功能模式和干扰功能模式中进行,表示为θn(t)∈{0,1},其中θn(t)=0表示中继模式,θn(t)=1表示干扰模式;网络中每个信道的频率带宽为w。

3.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(2)中互相通信的合法用户间的传输速率cl(t)的计算为:

4.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(3)中每对合法通信用户的效用函数rl(t)的计算为:

5.根据权利要求1所述的面向物理层安全感知协作通信的动态分层联盟博弈方法,其特征在于,步骤(4)中的分层博弈在每个时间间隙中包含两个阶段,在第一个阶段针对匹配子博弈三方设备生成各自用于匹配的偏好列表,包括合法用...

【专利技术属性】
技术研发人员:易畅言刘登辉陈若阳
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1