当前位置: 首页 > 专利查询>吉林大学专利>正文

基于无人机数据采集系统的联合轨迹优化与带宽分配方法技术方案

技术编号:32734792 阅读:12 留言:0更新日期:2022-03-20 08:40
本发明专利技术公开了一种基于无人机数据采集系统的联合轨迹优化与带宽分配方法,包括以下步骤:建立无人机辅助传感器网络模型;为降低传感器节点能量消耗,定义传感器唤醒休眠策略;基于深度强化学习对无人机轨迹控制和带宽分配策略进行优化。本发明专利技术联合考虑了无人机轨迹与带宽分配策略,提出了一种基于深度强化学习的无人机轨迹优化与资源分配方案,显著地节约了传感器节点能耗,提高了无人机数据采集成功率。率。率。

【技术实现步骤摘要】
基于无人机数据采集系统的联合轨迹优化与带宽分配方法


[0001]本专利技术属于无线通信
,具体是一种基于强化学习的无人机辅助无线传感器网络中联合轨迹优化和带宽分配的方法。

技术介绍

[0002]无人机(UAV)起源于军事领域,用于侦察、监视、测绘和其他军事目的。近年来,随着飞行控制、导航和通信等关键技术的进步以及成本的降低,无人机在民用领域也得到了广泛的应用,包括货运、工程建设和通信网络。传统固定通信基础设施受到建设成本高,位置固定等因素的影响,在面对地势险峻地区的通信部署、突发灾害时的通信设施破坏以及临时通信环境搭建等需求时往往难以应对。与传统的陆地通信系统相比,无人机辅助通信系统具有灵活性高、易于部署、成本低等优点。把无人机作为空中基站搭载平台,能够增加无线网络的容量,扩大系统的通信覆盖范围,实现低成本、按需部署的通信服务要求。另外,在通信基础设施薄弱或受灾地区中,基于无人机辅助的通信系统能够快速建立通信链路,即无人机通信亦可在应急通信中发挥重要作用。
[0003]随着物联网(IoT)技术的发展,由多个传感器节点(SNs)组成的无线传感器网络(WSNs)已经能够为环境的连续监测、自动控制、智能决策的数据传输等提供大量的高质量服务。传感器网络中的SNs通常能量有限,且数量众多,广泛分布在难以到达的地区。因此,如果没有基站(BSs)等基础设施的支持,SNs很难收集数据。无人机的低成本和高机动性为无线传感器网络的数据采集提供了一种有效的解决方案,但无人机的控制系统面临挑战。因此本专利技术提出了一种基于深度强化学习(DQN)的无人机控制方法,以智能地解决传感器网络中的数据采集问题。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于深度强化学习的资源分配方法对无人机轨迹和带宽分配进行优化。
[0005]本专利技术采用的技术方案如下:
[0006]基于无人机数据采集系统的联合轨迹优化与带宽分配方法,包括:
[0007]步骤1,建立无人机辅助传感器网络模型:
[0008]建立无线传感器网络场景,其中无人机作为移动数据收集器,从地面上的传感器节点获取信息,无人机从固定的起始点出发,定期飞行采集数据,单个周期的飞行时间被限制在T秒以内,并将无人机固定在高度H米处飞行;
[0009]步骤2,基于无人机辅助传感器网络模型定义传感器节点休眠策略,建立地空信道模型,计算数据传输速率;
[0010]步骤3,基于数据传输速率定义效用函数,并基于深度强化学习对无人机轨迹控制与带宽分配进行优化。
[0011]优选的,所述步骤1中,假设整个传感器网络包括K个传感器节点,第k个传感器节
点n
k
有D
k
个比特数据被收集;
[0012]将无人机飞行时间T离散化为M个时隙,即T=Mδ
t
,其中δ
t
代表一个充分小的时间步长,无人机的轨迹序列定义为{u[m],1≤m≤M},其中u[m]=u(mδ
t
)表示无人机在第m个时隙处的位置;其中x,y分别代表无人机的X,Y坐标。
[0013]优选的,所述步骤2中传感器节点休眠策略具体为:
[0014]在无人机飞行期间,传感器节点n
k
需要发送数据时则唤醒,否则令传感器节点休眠以节省能源;
[0015]传感器节点n
k
的唤醒休眠策略用w
k
[m]表示,其中w
k
[m]=0表示第m时隙n
k
在休眠状态,w
k
[m]=1表示n
k
以固定的传输功率P
k
传输速率R
k
[m]传输数据。
[0016]优选的,所述步骤2中,假设地空链路信道建模为莱斯信道,将每个时隙的衰落块数记为L;将无人机与传感器节点n
k
在第m时隙第l个衰落块上的信道系数记为其中ρ
k
[m,l]是小尺度衰落系数,β
k
[m]是大尺度衰落系数,[m]是大尺度衰落系数,β0表示无人机与传感器节点n
k
距离为1米时的参考信道功率增益,α为路径损耗系数,H表示无人机飞行高度;
[0017]当传感器节点n
k
以固定的传输功率P
k
传输数据时,第l个衰落块可实现的传输速率为其中σ2为噪声功率,Γ为实际调制方案与理论高斯信号的信噪比之差;
[0018]传感器节点n
k
与无人机之间的输出概率为与无人机之间的输出概率为
[0019]其中F(
·
)表示ρ
k
[m,l]的相同累积分布函数CDF,用表示,其中Q1(a,b)表示Marcum

Q函数,K
c
表示莱斯k因子,z代表F(z)函数中的自变量;
[0020]假设则数据传输速率R
k
[m]表示为:
[0021][0022]其中,β0表示无人机与传感器节点n
k
距离为1米时的参考信道功率增益,α为路径损耗系数,H表示无人机飞行高度,σ2为噪声功率,Γ为实际调制方案与理论高斯信号的信噪比之差,F
‑1(∈)表示F(∈)这个函数的倒数,∈为自变量;
[0023]假设无人机整个带宽资源为B,第m时隙分配给传感器节点n
k
的带宽记为b
k
[m],则当∑
m
R
k
[m]w
k
[m]b
k
[m]≥D
k
时,传感器节点n
k
的数据被成功接收。
[0024]优选的,所述步骤3中,定义优化目标为无人机飞行时间T期间更多的接收传感器
节点数据,假设效用函数θ
m,k
表示传感器节点n
k
的数据是否在第m时隙之前被成功接收,将θ
m,k
定义为定义为将无人机在飞行时间T内的轨迹表示为U={u[m],m=1,

,M},M表示总的时隙数,带宽分配策略表示为k表示第k个传感器节点;将无人机在相邻时间的移动定义为
[0025]通过联合优化无人机轨迹U和带宽分配策略B以获得多个传感器节点SNs数据,优化问题为:
[0026][0027][0028][0029][0030][0031]u[0]=u0[0032]其中u0表示无人机的初始位置;Δx[m],Δy[m]分别表示无人机相邻时间在X轴和Y轴移动的距离。
[0033]优选的,具体优化方法为:
[0034]建立马尔科夫决策模型:马尔科夫决策模型包含三个元素:状态S、动作A和奖励R,定义在第m时隙的状态为s
m
={u[m],w,z,D},其中u[m]表示无人机在第m时隙的位置,向量w={w1[m],w2[m],本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,包括:步骤1,建立无人机辅助传感器网络模型:建立无线传感器网络场景,其中无人机作为移动数据收集器,从地面上的传感器节点获取信息,无人机从固定的起始点出发,定期飞行采集数据,单个周期的飞行时间被限制在T秒以内,并将无人机固定在高度H米处飞行;步骤2,基于无人机辅助传感器网络模型定义传感器节点休眠策略,建立地空信道模型,计算数据传输速率;步骤3,基于数据传输速率定义效用函数,并基于深度强化学习对无人机轨迹控制与带宽分配进行优化。2.根据权利要求1所述的基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,所述步骤1中,假设整个传感器网络包括K个传感器节点,第k个传感器节点n
k
有D
k
个比特数据被收集;将无人机飞行时间T离散化为M个时隙,即T=Mδ
t
,其中δ
t
代表一个充分小的时间步长,无人机的轨迹序列定义为{u[m],1≤m≤M},其中u[m]=u(mδ
t
)表示无人机在第m个时隙处的位置;其中x,y分别代表无人机的X,Y坐标。3.根据权利要求2所述的基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,所述步骤2中传感器节点休眠策略具体为:在无人机飞行期间,传感器节点n
k
需要发送数据时则唤醒,否则令传感器节点休眠以节省能源;传感器节点n
k
的唤醒休眠策略用w
k
[m]表示,其中w
k
[m]=0表示第m时隙n
k
在休眠状态,w
k
[m]=1表示n
k
以固定的传输功率P
k
传输速率R
k
[m]传输数据。4.根据权利要求3所述的基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,所述步骤2中,假设地空链路信道建模为莱斯信道,将每个时隙的衰落块数记为L;将无人机与传感器节点n
k
在第m时隙第l个衰落块上的信道系数记为在第m时隙第l个衰落块上的信道系数记为其中ρ
k
[m,l]是小尺度衰落系数,β
k
[m]是大尺度衰落系数,β0表示无人机与传感器节点n
k
距离为1米时的参考信道功率增益,α为路径损耗系数,H表示无人机飞行高度;当传感器节点n
k
以固定的传输功率P
k
传输数据时,第1个衰落块可实现的传输速率为其中σ2为噪声功率,Γ为实际调制方案与理论高斯信号的信噪比之差;传感器节点n
k
与无人机之间的输出概率为与无人机之间的输出概率为与无人机之间的输出概率为其中F(
·
)表示ρ
k
[m,l]的相同累积分布函数CDF,用表示,其中Q1(a,b)表示Marcum

Q函数,K
c
表示莱斯
k因子,z代表F(z)函数中的自变量;假设∈表示最大可容忍中断概率,则数据传输速率R
k
[m]表示为:其中,β0表示无人机与传感器节点n
k
距离为1米时的参考信道功率增益,α为路径损耗系数,H表示无人机飞行高度,σ2为噪声功率,Γ为实际调制方案与理论高斯信号的信噪比之差,F
‑1(∈)表示F(∈)这个函数的倒数,∈为自变量;假设无人机整个带宽资源为B,第m时隙分配给传感器节点n
k
的带宽记为b
k
[m],则当∑
m
R
k
[m]w
k
[m]b
k
[m]≥D
k
时,传感器节点n
k
的数据被成功接收。5.根据权利要求4所述的基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,所述步骤3中,定义优化目标为无人机飞行时间T期间更多的接收传感器节点数据,假设效用函数θ
m,k
表示传感器节点n
k
的数据是否在第m时隙之前被成功接收,将θ
m,k
定义为将无人机在飞行时间T内的轨迹表示为U={u[m],m=1,

,M},M表示总的时隙数,带宽分配策略表示为k表示第k个传感器节点;将无人机在相邻时间的移动定义为k表示第k个传感器节点;将无人机在相邻时间的移动定义为通过联合优化无人机轨迹U和带宽分配策略B以获得多个传感器节点SNs数据,优化问题为:s.t.s.t.s.t.s.t.u[0]=u0其中u0表示无人机的初始位置;Δx[m],Δy[m]分别表示无人机相邻时间在X轴和Y轴移动的距离。6.根据权利要求5所述的基于无人机数据采集系统的联合轨迹优化与带宽分配方法,其特征在于,具体优化方法为:建立马尔科夫决策模型:马尔科夫决策模型包含三个元素:状态S、动作A和奖励R...

【专利技术属性】
技术研发人员:于银辉田子玉郭思宇程国豪
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1