【技术实现步骤摘要】
车联网中深度强化学习辅助的RAN切片和任务卸载联合优化方法
[0001]本专利技术属于车联网
,具体是一种车联网中深度强化学习辅助的RAN切片和任务卸载联合优化方法。
技术介绍
[0002]车联网(Internet of Vehicles,IoV)基于车用无线通信技术,将车辆、路边单元(Road
‑
Side
‑
Unit,RSU)、基站和服务提供商连接为一个有机的整体,实现全方信息实时共享
[1]。车载用户可以获得自动驾驶、路径规划、碰撞预警、车载娱乐、高清地图下载等服务
[2]。一般而言,车辆搭载的计算设备能力有限。车联网中有许多对延迟敏感的计算任务,若任务被卸载至远端的云服务器,远程传输和处理带来的高延迟对延迟敏感型任务而言是无法接受的
[3]。移动边缘计算(Mobile Edge Computing,MEC)
[4]将数据处理从云端转移到网络边缘设备中,终端设备产生的任务交由边缘设备处理,有效降低传输过程中产生的延迟。车辆大部分时间处于高速移动状态,任务发布在时间和空间上分布不均匀。边缘网络资源有限,很难为车载用户提供稳定的服务质量(Quality
‑
of
‑
Service,QoS)保证
[5]。车联网用户常同时处于多个基站的覆盖范围内,如何为任务选择最优卸载目的地也是一个挑战性问题。
[0003]网络切片
[6]是一种对网络架构和服务模式的重要革新技术。通过将物理无线接入网(Ra ...
【技术保护点】
【技术特征摘要】
1.一种车联网中深度强化学习辅助的RAN切片和任务卸载联合优化方法,其特征是联合优化方法的应用场景是MEC辅助的车联网系统,在该系统中:基于MEC的控制器和基站通过有线连接;车辆处于基站的覆盖范围内才连接基站卸载任务;在基站覆盖范围内的车载任务,均通过基站卸载至控制器进行调度;控制器实时分配任务,并交由合适的基站处理;基站接收到任务后,为任务分配物理资源并进行处理;最后,基站将处理结果传回车辆;同时处于多个基站的覆盖范围内,车辆在同一时隙仅关联唯一的基站来卸载任务;所述物理资源包括频谱资源和计算资源;联合优化方法的目的是最大化车联网任务完成数量;联合优化方法的步骤包括:步骤1)采用面向服务的RAN切片框架,时间被划分为多个等长的切片窗口;每个切片窗口被划分为等长的调度时隙;在大时间尺度的切片窗口上进行资源切片,在小时间尺度的调度时隙上进行任务调度;基于排队模型,RAN切片和任务卸载联合优化问题被建模为一个耦合约束和资源约束下的最大化长期任务完成数的联合优化问题;步骤2)把联合优化问题解耦为RAN切片子问题和协作式任务调度子问题:切片采用最优化方法,以切片窗口为周期,为RAN切片分配物理资源,解决RAN切片子问题;采用基于深度强化学习的算法得到的任务调度策略,解决协作式任务调度子问题;步骤3)采用联合优化策略对RAN切片子问题和协作式任务调度子问题联合求解。2.根据权利要求1所述的联合优化方法,其特征是步骤1)中,切片窗口w任务完成情况依赖于RAN切片策略和协作式任务调度策略,其中:a、面向RAN切片的频谱资源策略集合和计算资源策略集合分别被表示为和b、协作式任务调度策略集合被表示为定义二元变量这个二元变量代表在第w个切片窗口,车辆i连接基站j之后,任务处理是否满足延迟需求;如果能够满足延迟需求,则否则r
i,j,m
表示车辆i向基站j提交任务m时的上行传输速率;任务类型o=1和o=2分别表示延迟敏感型任务和延迟容忍型任务;每个基站的物理资源被划分为2个面向任务卸载的RAN切片,即第一种切片和第二种切片,分别支持延迟敏感型任务和延迟容忍型任务;在切片窗口w,基站j分配给两种切片的频谱和计算资源数量表示为和
在满足延迟约束的条件下,当任务完成时,系统获得对应的收益,若任务未完成,系统产生对应的损失;定义1在第w个切片窗口内,任务完成且满足延迟需求时,系统获得的总奖励U
(w)
其中u
j,o
∈(0,1)代表请求类型为o的任务在基站j上的对应收益因子;定义2在第w个切片窗口内,任务未能满足延迟需求时,系统产生的总损失H
(w)
其中h
j,o
∈(0,1)代表请求类型为o的任务在基站j上对应的损失因子;表示基站集合;表示调度时隙t内基站j采集到的类型为o的任务集合;时间被划分为多个等长的切片窗口,每个切片窗口被划分为等长的调度时隙;以最大化车辆任务完成数为目标,动态RAN切片问题(P0)被建模为P0:约束条件包括:a、保证每个基站j分配得到的子信道数为正数;b、保证每个基站分配车辆的频谱和计算资源不超过自身持有的资源总数;d、保证了每个车辆只能连接唯一的地面基站;e、保证了排队系统中队列的稳定性,同时,也表明了RAN资源的切片决策和任务调度决策是耦合的即耦合约束;表示基站j中请求类型为o的卸载队列的服务强度,表示基站j中处理队列o的服务强度;表示切片窗口w包含的调度时隙集合。3.根据权利要求2所述的联合优化方法,其特征是步骤2)中,面向任务卸载的RAN切片资源分配方法解决RAN切片子问题:RAN切片子问题P1是给定任务调度决策通过优化RAN切片决策最大化系统的任务完成数,即P1:约束条件包括:约束条件包括:和将P1转化为以切片窗口为周期的一次性优化one-shot问题P2:P2:约束条件包括:约束条件包括:
使用拉格朗日乘数法求解问题P2,将一个有多个变量和多个约束条件的最优化问题转化为一个有多个变量的无约束方程组的极值问题,则P2问题被转化为P3:P3:在给定任务调度策略的情况下,控制器计算出每个基站处理任务的具体数...
【专利技术属性】
技术研发人员:田一博,沈航,白光伟,王天荆,
申请(专利权)人:南京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。