【技术实现步骤摘要】
一种抗干扰CSMA/CA协议执行方法、装置及存储介质
[0001]本专利技术主要涉及通信智能抗干扰处理
,具体涉及一种抗干扰CSMA/CA协议执行方法、装置及存储介质。
技术介绍
[0002]随着多用户无线接入设备的快速发展,多用户应用场景要求提供高带宽效率和低延迟的服务。但是,由于无线信道的开放性,容易受到干扰机的恶意干扰,这些干扰会降低网络可靠性、隐私性和安全性。CSMA/CA协议广泛应用于MAC接入机制,通过二进制回退机制(BEB)解决多用户通信问题,在一定程度上减少了节点间的相互干扰,提高其通信性能。但是CSMA/CA协议的二进制回退机制容易被干扰利用,恶意干扰通过伪造信号让正常的待发节点认为信道忙碌,从而使正常节点触发回退机制,导致数据包的大量丢失或延迟发送,在该过程中恶意干扰只需要较小的功率就可以使网络瘫痪。现阶段的协议抗干扰方法主要是干扰检测,然后通过路由选择、信道分配、功率控制等方法提高其抗干扰性能。但是,这些方法并没有从协议的角度去提高抗干扰性能。
技术实现思路
[0003]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种抗干扰CSMA/CA协议执行方法、装置及存储介质。
[0004]本专利技术解决上述技术问题的技术方案如下:一种抗干扰CSMA/CA协议执行方法,包括如下步骤:
[0005]S1:基于CSMA/CA协议和决策调整参数构建抗干扰CSMA/CA协议;
[0006]S2:感知当前环境状态,根据epsilon
‑
gre
【技术保护点】
【技术特征摘要】
1.一种抗干扰CSMA/CA协议执行方法,其特征在于,包括如下步骤:S1:基于CSMA/CA协议和决策调整参数构建抗干扰CSMA/CA协议;S2:感知当前环境状态,根据epsilon
‑
greedy算法在预设决策集合中获得当前环境状态的决策;S3:将所述决策分发给通信节点,所述通信节点根据所述决策进行抗干扰CSMA/CA协议的任务并感知下一个环境状态;S4:计算所述当前环境状态下选取所述决策所获得的经验值;S5:将所述当前环境状态下的经验值与所有历史环境状态下的经验值进行累计,利用Q学习算法对累计经验值优化处理,并将所述当前环境状态转移至下一环境状态;S6:重复步骤S2
‑
S5,直至抗干扰CSMA/CA协议的任务执行完成。2.根据权利要求1所述的抗干扰CSMA/CA协议方法,其特征在于,所述基于CSMA/CA协议和决策调整参数构建抗干扰CSMA/CA协议,具体为:定义决策调整参数为a,基于CSMA/CA协议中的竞争窗口CW和决策调整参数a和重新定义所述竞争窗口CW,得到竞争窗口CW
’
,其中,CW∈[CW
min
,CW
max
],CW
’
∈a
·
[CW
min
,CW
max
];定义状态空间S,s
i
∈S:S={s1,s2,...,s
n
},其中,s
i
=a
i
·
CW
’
表示在i时刻环境状态,a
i
CW
’
表示通过决策a
i
调整后的竞争窗口CW
’
,定义决策空间A,a
i
∈A:A={a1,a2,...,a
n
},其中,a
i
表示在i时刻做出对竞争窗口CW
’
调整的决策,定义决策转移概率P,P=p{s
i+1
|s
i
,a
i
},其中,p表示在环境状态s
i
下选取决策a
i
转移到s
i+1
的概率,定义回报值R,R(s
i
,a
i
)表示在环境状态s
i
下选取决策a
i
获得的经验值;根据定义的状态空间S、决策空间A、决策转移概率P、回报值R和竞争窗口CW
’
得到抗干扰CSMA/CA协议。3.根据权利要求2所述的抗干扰CSMA/CA协议方法,其特征在于,所述计算所述当前环境状态下选取所述决策所获得的经验值,具体为:从信道中获得单位时间内成功传输的数量、单位时间的长度和信道的传输速率;将所述单位时间内成功传输的数量和所述单位时间的长度进行比值计算,得到吞吐量;将所述吞吐量和所述信道的传输速率进行比值计算,得到归一化吞吐量,将所述归一化吞吐量作为经验值。4.根据权利要求2所述的抗干扰CSMA/CA协议方法,其特征在于,所述利用Q学习算法对累计经验值优化处理,具体为:利用Q学习算法进行Q值更新,从而实现对累计经验值进行优化,获取最大累计经验值Θ,将所述最大累计经验值Θ作为优化目标,所述优化目标为:其中,Ri为i时刻的经验值,E
π
为在决策π下所取的累计经验值,A表示决策空间。5.根据权利要求4所述的抗干扰CSMA/CA协议方法,其特征在于,所述利用Q学习算法进
行Q值更新,具体为:利用Q学习算法的Q值更新公式更新Q值,所述Q值更新公式为:其中,θ表示学习率,所述学习率用于调整状态和经验值对Q值的影响,γ表示折扣因子,r
i
表示在环境状态s
i
下...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。