System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种空中智能超表面辅助空天地海网络可靠安全通信方法技术_技高网
当前位置: 首页 > 专利查询>厦门大学专利>正文

一种空中智能超表面辅助空天地海网络可靠安全通信方法技术

技术编号:44103867 阅读:0 留言:0更新日期:2025-01-24 22:31
一种空中智能超表面辅助空天地海网络可靠安全通信方法,属于智能超表面辅助通信、空天地海一体化网络、空中智能超表面轨迹优化、抗干扰防窃听安全通信等领域。提出一种基于深度强化学习空中智能超表面辅助防窃听及恶意干扰的空天地海一体化网络安全通信方法,该方法结合空中智能超表面飞行轨迹、用户信道状态和坐标等重要信息数据,考虑空天地海网络中的安全通信要求、空中智能超表面飞行速度、通信可靠性等多方面约束,提出以自我引导事后经验回放‑Softmax深度双确定性策略梯度算法为基础的空中智能超表面安全通信方案,旨在最大程度地保障可靠安全通信并提高通信质量。

【技术实现步骤摘要】

本专利技术属于智能超表面辅助通信、空天地海一体化网络、空中智能超表面轨迹优化、抗干扰防窃听安全通信等领域,具体是涉及基于深度强化学习的空天地海网络中空中智能超表面辅助抗干扰和防窃听的一种空中智能超表面辅助空天地海网络可靠安全通信方法。


技术介绍

1、智能超表面是一个均匀的平面阵列,由许多低成本的无源反射元件组成。其中每个元件自适应地调整其反射幅度或相位,而实时可编程的特点使超表面改变其电磁特性。通过有效地设计反射单元的相位,即可实现实时可控的反射波束赋形。智能超表面的低成本、低能耗、可编程、易部署使得其运用于各类通信模型中,在提高通信性能、扩展覆盖范围和减少干扰方面具有巨大的潜力。将智能超表面加装在无人机上作为空中智能超表面辅助通信系统,能够提高地面用户的通信可靠性和频谱效率,同时具有高动态性。而空天地海链路特性使得用户更容易受到干扰和窃听。在存在窃听和严重干扰环境中,用户的安全可靠通信是急需讨论的话题,同时空中智能超表面的位置部署对于用户的通信质量影响重大。因此,干扰攻击和窃听下空中智能超表面辅助空天地海网络的可靠安全通信是一个尤为关键的课题。

2、智能超表面能够通过动态地调整信号的传输特性,从而提高通信的抗干扰性。[h.yang, z. xiong, j. zhao, "intelligent reflecting surface assisted anti-jamming communications: a fast reinforcement learning approach," in ieeetransactions on wireless communications, vol. 20, no. 3, pp. 1963-1974, march2021, doi: 10.1109/twc.2020.3037767.] 提出一种基于模糊狼爬山快速学习算法的联合功率分配和反射波束成形方法以学习最优抗干扰策略,在强干扰情况下保证用户的可达速率和通信质量达标。

3、同时将智能超表面搭载在无人机上构成空中智能超表面并优化轨迹是一种十分有效的抗干扰策略。[k. lin, h. yang, m. zheng, l. xiao, c. huang and d. niyato,"penalized reinforcement learning-based energy-efficient uav-ris assistedmaritime uplink communications against jamming," in ieee transactions onvehicular technology, doi: 10.1109/tvt.2024.3406896.] 设计一种基于惩罚深度强化学习的优化方法,用于优化空中智能超表面的轨迹以最大化能量收集效率的同时,增大用户的信噪比,提高用户在干扰情况下的可达速率,提升系统可靠性能。

4、此外,窃听者试图窃取敏感信息,危及通信的隐私性。因此在智能超表面上使用反射波束赋形,以提高用户的可实现保密率,同时抑制窃听者的窃听数据速率。[h. yang, z.xiong, j. zhao, d. niyato, l. xiao and q. wu, "deep reinforcement learning-based intelligent reflecting surface for secure wireless communications," inieee transactions on wireless communications, vol. 20, no. 1, pp. 375-388,jan. 2021, doi: 10.1109/twc.2020.3024860.] 应用一种基于深度决策后状态-优先经验回放学习的安全波束形成算法辅助安全通信,实现基站处的波束成形矩阵和智能超表面处的相移矩阵(反射波束成形),使系统在存在窃听的情况下安全稳定运行。


技术实现思路

1、本专利技术的目的是提供一种空中智能超表面辅助空天地海网络可靠安全通信方法,利用深度强化学习算法,在存在干扰、窃听的环境下优化无人机的飞行轨迹、智能超表面反射单元参数和卫星发射功率等动作,以适应动态干扰环境下的通信环境,抑制窃听者的同时,保障基于空中智能超表面辅助通信系统中的可靠安全通信。

2、为实现上述专利技术目的,本专利技术提供以下技术方案:

3、一种干扰攻击与窃听下的空天地一体化网络中空中智能超表面辅助可靠安全通信方法包括以下步骤:

4、步骤1:设定系统中有个用户,随机分布在地面平面和海面上,主动式窃听者配备双天线,其中一根负责窃听所有用户接收信号,另一根通过发射信号对用户进行干扰;将空中智能超表面总飞行时间等间隔划分为个时隙,每个时隙内,空中智能超表面分析信道状态,反射卫星传输数据向各个用户,同时通过调整飞行轨迹来应对无线通信网络中的干扰攻击和非法窃听;空中智能超表面的反射单元参数,飞行方向和卫星发射功率共同组成动作空间;

5、步骤2:构建两类主神经网络:神经网络、、神经网络、,网络参数分别为、、和;以及这四个神经网络对应的四个目标神经网络、、、,网络参数为、、、;初始化所有网络参数为随机参数,目标网络参数与主网络的参数相同;神经网络、负责根据当前状态输出每个动作的概率,并根据这些概率选择合适的动作与环境交互;神经网络、负责评估、的表现,并指导其后续行为动作;目标网络用于减少训练不稳定和提高学习效率;

6、步骤3:初始化经验回放缓冲池和,经验回放缓冲池通过存储和抽样智能体与环境的交互经验用于模型更新,显著提高了学习效率和稳定性;随后接收来自通信环境的初始系统状态;

7、步骤4:第时隙,将所有用户信道信息,地面用户接收到信号的保密速率、可达速率,地面用户的坐标和窃听者的信道信息构建为状态向量,其中为所有用户的集合;

8、步骤5:第时隙,基于策略、和自我引导探索策略选择具有探索噪声的动作;是高斯噪声,自我引导探索策略通过对系统性能达到值、系统性能目标值和动作随机值的修改从而在探索和利用之间找到一个平衡;在自我引导探索策略下,已学习的策略被用于引导网络快速通过熟悉的区域,然后探索更复杂的阶段;通过这种方式,网络可以阶段地学习任务,逐步提高其适应动态干扰环境和抑制窃听者的能力;

9、步骤6:空中智能超表面执行动作,控制卫星发射功率的同时,选择飞到下一个位置或进行悬停,并通过超表面将卫星发射信号反射至用户,得到下一个时隙状态空间;

10、步骤7:计算系统当前的通信速率,其中为与0对比取最大值, 为用户可达速率,、分别是卫星对第k个用户的发射功率和干扰机发射功率;、、分别是卫星到第k个用户的信道、干扰信号到超表面反射至用户的信道和干扰信号直接至用户的信道; 为主动窃听者窃听速率,、、分别是卫星到主动窃听者的信道、干扰信号到超表面反射至窃听者的信道和干扰信号直接至窃听者的信道,为加性复本文档来自技高网...

【技术保护点】

1.一种空中智能超表面辅助空天地海网络可靠安全通信方法,其特征在于包括以下步骤:

2.如权利要求1所述一种空中智能超表面辅助空天地海网络可靠安全通信方法,其特征在于在步骤5)中,所述自我引导探索策略通过对系统性能达到值、系统性能目标值和动作随机值的修改,在探索和利用之间找到平衡,从而引导网络阶段性地学习任务;在自我引导探索策略下,已学习的策略被用于引导网络快速通过熟悉的区域,然后探索更复杂的阶段;通过这种方式,网络阶段地学习任务。

3.如权利要求1所述一种空中智能超表面辅助空天地海网络可靠安全通信方法,其特征在于在步骤7)中,所述计算系统当前的通信速率和窃听者的窃听速率的具体步骤为:计算系统当前的通信速率,其中为与0对比取最大值, 为用户可达速率,、分别是卫星对第k个用户的发射功率和干扰机发射功率;、、分别是卫星到第k个用户的信道、干扰信号到超表面反射至用户的信道和干扰信号直接至用户的信道;为主动窃听者窃听速率,、、分别是卫星到主动窃听者的信道、干扰信号到超表面反射至窃听者的信道和干扰信号直接至窃听者的信道,为加性复高斯噪声功率。

【技术特征摘要】

1.一种空中智能超表面辅助空天地海网络可靠安全通信方法,其特征在于包括以下步骤:

2.如权利要求1所述一种空中智能超表面辅助空天地海网络可靠安全通信方法,其特征在于在步骤5)中,所述自我引导探索策略通过对系统性能达到值、系统性能目标值和动作随机值的修改,在探索和利用之间找到平衡,从而引导网络阶段性地学习任务;在自我引导探索策略下,已学习的策略被用于引导网络快速通过熟悉的区域,然后探索更复杂的阶段;通过这种方式,网络阶段地学习任务。

3.如权利要求1所述一种...

【专利技术属性】
技术研发人员:杨和林黄达远
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1