一种面向协作感知的高能效传感器调度方法及相关设备技术

技术编号：43894297 阅读：15 留言：0更新日期：2025-01-03 13:08

本申请实施例提供了一种面向协作感知的高能效传感器调度方法及相关设备，包括：获取当前时刻下每个传感器的当前状态信息；根据当前状态信息，采样得到当前休眠时长；将当前状态信息输入至下层策略网络，得到发射功率的概率分布，以根据发射功率的概率分布进行采样，得到当前发射功率；将当前休眠时长及当前发射功率发送至每个传感器，以使得每个传感器向目标服务器发送感知信息；根据感知信息将所有目标监测点的当前信息年龄进行更新，得到目标信息年龄，并根据目标信息年龄得到效益函数值；设定传感器调度经验，并对目标服务器的当前权重参数值进行更新，直至满足预设时刻阈值，并将目标权重参数值作为目标服务器对于每个传感器的目标调度策略。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及传感器调度领域，尤其设计一种面向协作感知的高能效传感器调度方法及相关设备。

技术介绍

1、在物联网和数字孪生等应用中，协作感知技术通过广泛分布的传感器收集目标空间区域的数据并传输至目标服务器，以实现对物理环境的实时监控。为了确保对实时物理环境的有效监测，需要高覆盖率的感知数据和及时的数据传输，即接收高质量的感知数据。

2、然而，现有技术中，传感器调度通常基于简化的信道模型，利用启发式算法实现节能，但是这些方法可能无法准确反映实际的动态信道条件和传感器工作模式，导致调度策略不够精确。在多源数据传输到协作感知中心的过程中，由于信道的动态性，存在传输失败的风险，这会增加信息年龄(aoi，age ofinformation)，降低数据的新鲜度。

3、还有很大一部分的传感器调度研究集中于最小化接收端的数据新鲜度，而忽视了传感器端的能耗问题，未充分考虑如何在保证数据新鲜度的同时，优化传感器的能耗。

技术实现思路

1、本申请实施例提供了一种面向协作感知的高能效传感器调度方法及相关设备，用于在一定的覆盖约束下，保证数据新鲜度并降低能耗。

2、本申请实施例第一方面提供了一种面向协作感知的高能效传感器调度方法，应用于目标服务器，所述目标服务器由上层策略网络、上层价值网络、下层策略网络和下层价值网络构成，包括：

3、获取当前时刻下每个传感器的当前状态信息；其中，所述当前状态信息包括所述当前时刻下的所述每个传感器的当前工作模式、所述目标服务器

4、根据所述当前工作模式、所述当前信道状态以及所述当前信息年龄，对所述每个传感器进行休眠概率分布采样，得到所述上层策略网络中对应于所述每个传感器的当前休眠时长；

5、将所述当前工作模式、所述当前信道状态、所述当前信息年龄及所述当前休眠时长输入至所述下层策略网络，得到对应于所述每个传感器的发射功率的概率分布，以根据所述发射功率的概率分布进行功率概率分布采样，得到对应于所述每个传感器的当前发射功率；

6、将所述当前休眠时长及所述当前发射功率发送至对应的所述每个传感器，以使得所述每个传感器根据所述目标服务器的当前调度策略向所述目标服务器发送感知信息；其中，所述调度策略与所述当前休眠时长存在关联关系；

7、根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄，并根据所述目标信息年龄得到所述每个传感器在当前时刻下的效益函数值；其中，所述效益函数值与所述每个传感器的电量能耗值存在关联关系；

8、将所述当前状态信息、所述当前休眠时长、所述当前发射功率及所述效益函数值设定为传感器调度经验，并按照预设存储规则将所述传感器调度经验存入经验池，以于所述经验池中采样预设数量的传感器调度经验，对所述上层策略网络、所述上层价值网络、所述下层策略网络和所述下层价值网络的当前权重参数值进行更新，直至满足预设时刻阈值，并将对应于所述预设时刻阈值的目标权重参数值作为所述目标服务器对于所述每个传感器的目标调度策略的选择依据。

9、可选地，所述获取当前时刻下每个传感器的当前状态信息之后，所述方法还包括：

10、设定对应于所有传感器的最大休眠时长；其中，所述当前工作模式包括休眠模式和激活模式，所述最大休眠时长用于表征所述每个传感器处于所述休眠模式下的最大持续时间；

11、根据所述每个传感器的所述当前工作模式及所述每个传感器的初始动作集合，确定于所述最大休眠时长内，满足覆盖约束条件的目标动作集合；其中，所述初始动作集合用于表征任意一个传感器于所述最大休眠时长内的当前工作模式的动作集合；所述覆盖约束条件用于表征在当前时刻下满足预设覆盖率的传感器处于所述激活模式的动作集合；

12、将所述当前状态信息及所述目标动作集合输入至所述上层策略网络，得到对应于所述目标动作集合中传感器数量的动作维度向量，以根据所述动作维度向量确定掩蔽向量；其中，所述掩蔽向量用于表征所述每个传感器在当前时刻满足所述覆盖约束条件的结果。

13、可选地，所述根据所述当前工作模式、所述当前信道状态以及所述当前信息年龄，对所述每个传感器进行休眠概率分布采样，得到所述上层策略网络中对应于所述每个传感器的当前休眠时长，包括：

14、根据所述掩蔽向量、所述动作维度向量、所述当前工作模式、所述当前信道状态以及所述当前信息年龄，确定所述每个传感器对应于不同休眠时长的休眠概率的概率分布；其中，所述休眠概率的概率分布与所述上层策略网络的所述当前权重参数值存在关联；

15、根据所述休眠概率的概率分布进行休眠概率分布采样，得到所述当前休眠时长。

16、可选地，所述将所述当前工作模式、所述当前信道状态、所述当前信息年龄及所述当前休眠时长输入至所述下层策略网络，得到对应于所述每个传感器的发射功率的概率分布，包括：

17、将所述当前工作模式、所述当前信道状态、所述当前信息年龄及所述当前休眠时长输入至所述下层策略网络，得到均值向量；其中，所述均值向量与当前时刻下的所述下层策略网络的所述当前权重参数值存在关联；

18、基于所述均值向量，结合对应的所述每个传感器的方差向量，得到所述每个传感器的所述发射功率的概率分布。

19、可选地，所述根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄之前，所述方法还包括：

20、若所述当前调度策略为休眠策略，根据所述休眠策略控制所述每个传感器休眠对应的所述当前休眠时长；

21、若所述当前调度策略为激活策略，根据所述激活策略控制所述每个传感器，以使得每个所述传感器基于对应的所述当前发射功率向所述目标服务器发送所述感知信息。

22、可选地，所述根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄，包括：

23、若所述目标服务器接收到任一目标监测点的所述感知信息，根据所述感知信息将所述当前信息年龄更新为预设常数因子，并将所述预设常数因子作为所述目标信息年龄；

24、若所述目标服务器未接收到任一目标监测点的所述感知信息，根据所述感知信息将所述当前信息年龄与所述预设常数因子进行相加，并将相加后的值作为所述目标信息年龄。

25、可选地，所述根据所述目标信息年龄得到所述每个传感器在当前时刻下的效益函数值，包括：

26、确定对应于所述每个传感器的电量损耗值；

27、基于所述电量损耗值进行近似估计，得到在当前时刻下的所述每个传感器的传感器能耗值；

28、根据所述传感器能耗值、所述目标信息年龄以及对应的所有传感器的数量和目标监测点的数量，得到所述效益函数值。

29、可选地，所述当前权重参数值包括对应于当前时刻的所述上层策略网络的当前上层策略权重值、所述上层价值网络的当前本文档来自技高网...

【技术保护点】

1.一种面向协作感知的高能效传感器调度方法，其特征在于，应用于目标服务器，所述目标服务器由上层策略网络、上层价值网络、下层策略网络和下层价值网络构成，所述方法包括：

2.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述获取当前时刻下每个传感器的当前状态信息之后，所述方法还包括：

3.根据权利要求2所述的面向协作感知的高能效传感器调度方法，其特征在于，所述根据所述当前工作模式、所述当前信道状态以及所述当前信息年龄，对所述每个传感器进行休眠概率分布采样，得到所述上层策略网络中对应于所述每个传感器的当前休眠时长，包括：

4.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述将所述当前工作模式、所述当前信道状态、所述当前信息年龄及所述当前休眠时长输入至所述下层策略网络，得到对应于所述每个传感器的发射功率的概率分布，包括：

5.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄之前，所述方法还包括：</p>

6.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄，包括：

7.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述根据所述目标信息年龄得到所述每个传感器在当前时刻下的效益函数值，包括：

8.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述当前权重参数值包括对应于当前时刻的所述上层策略网络的当前上层策略权重值、所述上层价值网络的当前上层价值权重值、所述下层策略网络的下层策略权重值和所述下层价值网络的当前下层价值权重值，所述于所述经验池中采样预设数量的传感器调度经验，对所述上层策略网络、所述上层价值网络、所述下层策略网络和所述下层价值网络的当前权重参数值进行更新，包括：

9.一种面向协作感知的高能效传感器调度系统，其特征在于，应用于目标服务器，所述目标服务器由上层策略网络、上层价值网络、下层策略网络和下层价值网络构成，所述系统包括：

10.一种面向协作感知的高能效传感器调度装置，其特征在于，所述装置包括：

...

【技术特征摘要】

2.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述获取当前时刻下每个传感器的当前状态信息之后，所述方法还包括：

5.根据权利要求1所述的面向协作感知的高能效传感器调度方法，其特征在于，所述根据所述感知信息将所有目标监测点的所述当前信息年龄进行更新，得到目标信息年龄之前，所述方法还包括：

6...

【专利技术属性】
技术研发人员：肖奕霖，刘博，周薇，
申请(专利权)人：深圳市人工智能与机器人研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人