【技术实现步骤摘要】
Spectrum Sharing Networks,”in IEEE INFOCOM 2022
‑
IEEE Conference on Computer Communications Workshops(INFOCOMWKSHPS),2022.]中,作者在动态车联网场景下提出了一种基于深度强化学习实现安全MEC服务的方案,但该方案是通过物理层安全技术来实现安全服务的,具有局限性,没有探索智能反射面的潜在好处。
[0006]综上所述,现有技术目前还存在着以下缺点:
[0007](1)现有技术是在静态车联网场景下优化目标车辆的安全移动边缘计算服务延迟问题,不适用于具有繁重计算任务的动态移动边缘计算车辆网络。
[0008](2)现有技术只有当所有目标车辆给配有移动边缘计算服务器的基站传送完任务时,基站才会为目标车辆分配MEC计算资源,这大大加重了车联网服务延迟。
[0009](3)在动态车联网场景下,现有技术在进行移动边缘计算安全服务延迟问题的研究时,并未考虑智能反射面的潜在好处。
[0010]在实时变化的信道下,如何选择合适的深度强化学习算法来应对高维度的状态空间;如何利用深度强化学习来优化RIS和MEC等都是RIS辅助MEC安全服务技术要解决的关键问题。
技术实现思路
[0011]为了克服上述现有技术的不足,本专利技术的目的在于提供一种智能反射表面辅助的车联网安全计算卸载方法、系统、设备及介质,基于深度确定性策略梯度算法(Deep deterministic policy gradien
【技术保护点】
【技术特征摘要】
1.一种智能反射表面辅助的车联网安全计算卸载方法,其特征在于:包括以下步骤:步骤1:构建RIS辅助MEC车辆网络通信场景,同时加入窃听者模型;步骤2:构建RIS辅助的安全通信场景;步骤3:对步骤1中构建的RIS辅助MEC车辆网络场景的优化目标进行建模,构建模型求解时的目标函数;步骤4:根据步骤3提出的优化目标构建深度强化学习算法模型;步骤5:根据步骤4提出的深度强化学习算法模型构建深度强化学习训练模型,结合步骤1、步骤2以及步骤3中的通信场景和目标函数,设置训练模型的状态、动作及奖励,对RIS辅助MEC车辆网络通信场景的优化目标进行模型训练;步骤6:根据步骤5的训练模型得到RIS辅助MEC车辆网络决策模型,得到优化问题的最优解,即得到车联网安全计算卸载方案。2.根据权利要求1所述的一种智能反射表面辅助的车联网安全计算卸载方法,其特征在于:所述步骤1的具体方法为:BS同时与不同正交子频带中的车辆用户建立多个通信链路,资源受限的目标车辆可以将其计算任务卸载到配备MEC服务器的BS,从而获取MEC计算资源,获取计算服务的目标车辆表示为:其中,User
M
表示第M个目标车辆用户;未被服务的车辆被认为是潜在的窃听者,可以表示为:ε={Eve1,Eve2,
…
,Eve
E
}其中,Eve
E
表示第E个潜在窃听者。3.根据权利要求1所述的一种智能反射表面辅助的车联网安全计算卸载方法,其特征在于:所述步骤2的具体方法为:步骤2.1:假设RIS的第n个元素的反射系数表示为:其中,φ
n
∈[0,2π),RIS反射系数矩阵定义为:Θ=diag([θ1,θ2,...,θ
N
])由不存在带内干扰,通过最大比合并技术设计接收波束形成,其可表示为:其中,f
M
表示第M个V2I链路的波束形成向量;步骤2.2:通信信道建模;在MEC车辆网络中,信道包括:第m个V2I链路第m个目标车辆和RIS之间的链路第m个目标车辆到第e个潜在窃听者的链路RIS到第e个潜在窃听者之间的链路RIS到BS的链路RIS到BS的信道服从Rician分布,表示为:
其中,κ
i,b
是Rician因子,ρ是参考距离d0=1m处的路径损耗,d
i,b
是RIS和BS之间的距离,α
i,b
为RIS到BS链路的路径损耗指数,非LOS分量的每个元素遵循具有零均值和单位方差的复高斯分布,同样h
m,e
,h
m,b
,h
m,i
,h
i,e
遵循Rician分布,由于拥挤的城市环境和车辆之间的阻塞效应,κ
m,b
和κ
m,e
均为零;步骤2.3:信号接收过程建模;BS处的第m个V2I链路接收信号可以表示为:其中,P
m
是第m个目标车辆的发射功率,s
m
表示与计算任务相关联的单位能量信号样本,噪声向量n
m
可以表示为:n
m
=[n1,...n
K
]
T
其中,BS处的第m个V2I链路的上行链路信干噪比SINR由下式给出:相似的,第e辆窃听车辆处的第m个V2I链路的窃听信号表示为:其中,第e辆窃听车辆处的第m个V2I链路的SINR可以表示为:因此,第m个V2I链路的容量和第e个窃听车辆到第m个V2I链路的窃听容量可以分别表示为:C
m
=log(1+η
m
)C
e,m
=log(1+η
e,m
)在MEC车辆网络中,一旦用户完成卸载过程,BS就根据任务的大小灵活地分配MEC服务器的计算资源,MEC服务器的每个CPU周期都可以处理一定数量的数据位,假设总计算能力为ζbit/s。4.根据权利要求1所述的一种智能反射表面辅助的车联网安全计算卸载方法,其特征在于:所述步骤3的具体方法为:步骤3.1:安全过程建模;任何未经服务的车辆都可以窃听任何V2I链路,为了保护任务数据不被窃听,用于保护机密信息的冗余可以表示为:max{0,R
b
‑
R
S
}其中,R
b
为码字率,R
S
为机密信息的目标保密率;如果窃听者的容量C
e
大于R
b
‑
R
S
,则会发送保密中断,用容量C
b
近似R
b
,因此第m个V2I链路的保密传输速率可以表示为:
R
S,m
=[0,(C
m
‑
maxC
e,m
)]
+
,e∈ε其中,[x]
+
=max{0,x};第m个V2I链路的MEC服务时间(卸载和计算时间)可以表示为:其中,S
m
是任务大小,ζ
m
是分配的计算资源;步骤3.2:优化目标建模;优化目标是通过为不同的计算任务设计RIS反射系数矩阵Θ和MEC资源分配来最小化服务时间,前者将影响传输时间,而后者将决定计算时间,考虑到整个MEC服务周期由所有V2I链路的最大服务时间决定,将上述目标转化为以下最小
‑
最大问题:C1:C2:其中,约束C1表示分配给不同目标车辆的计算资源总和为固定值,约束C2表示RIS反射系数的模数约束为单位模。5.根据权利要求1所述的一种智能反射表面辅助的车联网安全计算卸载方法,其特征在于:所述步骤4的具体方法为:DDPG是一种无模型model
‑
free、异策略off
‑
policy的Actor
‑
Critic架构的算法,Actor网络用于预测动作,Critic网络用于评估当前状态下采取该动作的未来收益,Actor网络和Critic网络都由两个深度神经网络DNN网络组成:训练网络和目标网络,Actor网络的训练和目标网络参数分别为θ
a
和θ
a
′
,Critic网络的训练和目标网络参数分别为θ
c
和θ
c
′
;在时隙t,Actor训练网络将S
t
作为输入,并输出动作a
t
,Critic训练网络将S
t
和a
t
作为输入并输出状态
‑
动作函数值state
‑
action value Q
π
(S
t
,a
t
∣θ
c
),其可表示为:Q
π
(S
t
,a
t
∣θ
c
)=E
π
[R
t
∣S
t
,a
t
,π]其中,E[
·
]表示期望函数,π表示Actor训练网络的策略,当在经验回放池D中累计了足够的四元组(S
t
,a
...
【专利技术属性】
技术研发人员:俱莹,白皓文,王浩宇,裴庆祺,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。