【技术实现步骤摘要】
一种基于深度强化学习的毫米波通信波束训练方法
[0001]本专利技术涉及毫米波无线通信
,特别是涉及一种基于深度强化学习的毫米波通信 波束训练方法。
技术介绍
[0002]随着无线通信技术的不断发展,一些频段较低的频谱资源几乎已全部被占用。为了满足 通信性能的要求,获得更多的频谱资源,人们的关注点转移到频段更高的频带上,即毫米波 频段。该频段是指频率在30~300GHz范围内的频带,频带内的频谱资源丰富、传输速率较高, 能够满足一些带宽需求较高的应用的需要。然而由于毫米波信号的传播特性,与微波信道相 比,毫米波信道的路损较高。考虑到毫米波信号的波长相比于微波信号较短,而天线的间隔 与信号波长通常是正相关的,所以可以将大量的天线集中于较小的空间内形成大规模的天线 阵来提高较高的增益。大规模MIMO技术与毫米波通信是互相补充的,毫米波通信解决了大 规模MIMO技术的频谱资源短缺问题,同时大规模MIMO技术弥补了毫米波通信的路径损 耗,因此毫米波大规模MIMO通信的应用前景十分广阔。
[0003]在现有的研究工作中,通常会在发送端和接收端均预先设定一个码本,码本中包含若干 波束成形矢量(也称码字),收发端遍历码本中的码字来收发导频信号,将接收功率最大的码 字组合作为正式发送和接收信号的波束成形矢量组合,该过程称为波束训练。然而,大规模 天线阵列和定向窄波束的使用导致这种遍历码本的训练算法是非常耗时的。尤其是在动态的 场景中,毫米波信道是不断变化的,实现频繁而精确的波束对准十分困难,到目前为止都是 一个非常具有 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的毫米波通信波束训练方法,其特征在于,包括如下步骤:步骤S1、构建用户端与基站端之间的毫米波通信信道模型;步骤S2、设计用户端与基站端的码本,根据设计的码本构建最终接收信号的模型,再根据该模型对波束训练过程进行数学建模;步骤S3、定义状态、动作和奖励在波束训练中的表示;步骤S4、将步骤S3中定义的状态视为多通道的图像,输入至构建好的卷积神经网络中,得到状态对应的所有动作的值。2.根据权利要求1所述一种基于深度强化学习的毫米波通信波束训练方法,其特征在于,所述步骤S1具体包括:设置一个针对于单用户的毫米波MIMO通信系统,该系统中,用户端有N
r
根天线,基站端有N
t
根天线,天线的排列方式均采用均匀线性阵列,所述毫米波通信信道模型建模为:公式(1)中,L、α
l
、θ
l
分别表示路径数、第l条路径的信道增益、信道的到达角和信道的离开角;定义Θ
l
和Ψ
l
为空间域的到达角和离开角,均服从[0,π]内的均匀分布,d
t
和d
r
分别表示基站端和用户端阵列天线的间隔,λ为毫米波信号的波长,u(
·
)表示信道导向矢量;信道的导向角在相邻时间间隔内的变化量服从高斯分布,表达式为:公式(2)中,θ0~u(0,π)表示t=0时刻随机的初始信道导向角,θ
t
表示t时刻的信道导向角,表示信道导向角的变化量。3.根据权利要求1所述一种基于深度强化学习的毫米波通信波束训练方法,其特征在于,在所述步骤S2中,所述用户端与基站端的码本的表达式为:所述用户端与基站端的码本的表达式为:在公式(3)和公式(4)中,所述最终接收信号的表达式为:在公式(5),分别表示基站端的发送功率、用户端的接收码字、基站端的发送码字以及信道噪声矢量,并且‖w‖2=‖f‖2=1,|x|2=1;因此,接收信号矩阵的表达式为:在公式(6)中,分别表示接收端和发送端的DFT码本,表示信道矩阵,x、P分别表示发送的信号和信号的功率,表示信道噪
声矩阵,表示接收信号矩阵,矩阵中第m行、第n列的元素Y(m,n)表示发送端使用码本F中的第n(n=1,2,
…
,N
t
)个码字发送、接收端使用码本W中的第m(m=1,2,
…
,N
r
)个码字接收所得到的信号;波束训练过程表示为以下优化问题:波束训练过程表示为以下优化问题:4.根据权利要求3所述一种基于深度强化学习的毫米波通信波束训练方法,其特征在于,在所述步骤S3中,定义状态在波束训练中的表示,具体包括:设t时刻信道矩阵为H
t
,与其对应的接收信号矩阵为Y
t
,定义矩阵Z
t
为Y
t
的模,将连续几个时刻的接收信号强度矩阵Z
t
定义为一个状态S
t
,具体表示如下:S
t
(i)=Z
ttt
‑
C
,i=1,2,
…
,C
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)公式(7)中,S
t
是一个三维矩阵,第三维度大小为C,C表示连续时刻的数目,Z
t+i
‑
C
表示在时刻t...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。