本发明专利技术公开了一种量子密钥分发网络的路由方法及相关装置。所述方法包括:采集第一QKD网络的状态,并计算对应的奖励函数的值,将状态输入至预设的演员网络中,输出对应的动作;奖励函数为多个拓扑状态影响参数的线性组合;利用演员‑评论家网络的训练架构,结合状态、动作和奖励函数值,对演员网络进行训练,直至达到训练终止条件;将训练好的演员网络作为策略网络;将待确定路由的第二QKD网络中各节点间链路的状态输入至策略网络,通过策略网络输出第二QKD网络中各节点间链路的权重值;根据所述策略网络输出的权重值,计算第二QKD网络的最优路由。本发明专利技术提供了更智能、鲁棒性更强的策略网络,以实现分发效率较高,负载更为均衡的路由策略。
【技术实现步骤摘要】
本专利技术涉及量子通信,特别涉及一种量子密钥分发网络的路由方法及相关装置。
技术介绍
1、近年来,量子密钥分发(quantum key distribution,qkd)网络因其理论上的无条件安全性而迅速发展。可信中继qkd网络是基于信任节点构成的qkd网络,通过量子密钥生成层之上密钥数据的逐跳中继,解决单光子信号传输距离的限制,进而实现可供更多用户使用和满足更远距离传输的qkd网络。该网络理论上可以实现全球范围的量子密钥分发,被认为是目前技术条件下最为可行的广域量子密钥网络组网方式。
2、对于qkd网络路由的实现方案,与经典通信网络的架构所不同的是,qkd网络的路由不仅要考虑类似路由时延等经典通信网络相似的指标,还需要考虑量子信道相关的评价指标,因此,qkd网络的路由实现,需要结合经典信道与量子信道相关参数进行评估和设计。
技术实现思路
1、本申请的专利技术人发现,对于qkd网络路由的实现方案,发展至今,有多种路由算法可以满足不同的网络环境和需求,比如开放式最短路径优先协议,基于监督学习的路由算法,以及基于传统深度强化学习的路由算法等等,在量子密钥分发网络方面,它们存在着明显的不足,并且难以有效地应对现代量子密钥分发网络的挑战。现有技术通常考虑了qkd网络中的量子密钥量作为单一影响因素,部分现有路由算法需要人工经验预设参数来建模,不能自适应于更复杂的网络场景,另外基于传统深度强化学习的路由算法随着网络规模的增长,其所需的计算资源和训练时长也呈现出显著的增长。
<
p>2、鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种量子密钥分发网络的路由方法及相关装置。3、第一方面,本专利技术实施例提供一种量子密钥分发网络的路由方法,包括:
4、通过预设的模拟环境,迭代地执行下述步骤:采集用于训练的第一量子密钥分发qkd网络当前时间步的状态,并计算对应的奖励函数的值,将所述状态输入至预设的演员网络中,输出对应的动作,所述动作为更新后的所述qkd网络中各节点间链路的权重值;所述奖励函数为多个量子密钥分发网络拓扑状态的影响参数的线性组合;
5、利用预设的演员网络-评论家网络的训练架构,以及每个时间步的状态、动作和奖励函数值,对所述演员网络进行训练,直至达到预设的训练终止条件;将训练好的演员网络作为策略网络;
6、获取待确定路由的第二qkd网络中各节点间链路的状态;
7、将所述第二qkd网络中各节点间链路的状态作为所述策略网络的输入,通过所述策略网络输出第二qkd网络中各节点间链路的权重值;
8、根据所述策略网络输出的各链路的权重值,计算所述第二qkd网络的最优路由。
9、在一个实施例中,在对演员网络进行训练之前,还包括:
10、构建奖励函数及对应的约束条件;所述奖励函数为下述参数的线性组合:所有量子密钥分发通过路由策略所全通的路径总时间、量子密钥新鲜度、平均本地量子密钥消耗速率、平均本地量子密钥生成速率和路径量子密钥利用率;
11、其中,所述所有量子密钥分发通过路由策略所全通的路径总时间,为所有量子密钥分发过程通过路由选择策略所全通的路径的传播时延、传输时延、处理时延和排队时延之和;
12、所述量子密钥新鲜度,表征量子密钥分发网络中所有节点中剩余量子密钥量与所述节点量子密钥池最大容量的比值;
13、所述平均本地量子密钥消耗速率,表征单位时间内所有节点间链路的量子密钥消耗速率的平均值;
14、所述平均本地量子密钥生成速率,表征单位时间内所有节点间链路的量子密钥生成速率的平均值;
15、所述路径量子密钥利用率,表征链路上所分发的所有量子密钥的容量在整个链路总容量中的占比;
16、所述约束条件包括:
17、所有量子密钥分发通过路由策略所全通的路径总时间小于等于预设的服务质量qos要求的延迟;
18、所有量子密钥通过一个节点到另外一个节点的密钥利用率的最小值,大于等于预设的qos要求的路径量子利用率;
19、所述平均本地量子密钥消耗速率小于所述平均本地量子密钥生成速率。
20、在一个实施例中,所述计算奖励函数值,包括:
21、基于所述约束条件,针对执行模拟量子密钥分发操作后所述第一qkd网络,统计所述所有量子密钥分发通过路由策略所全通的路径总时间、量子密钥新鲜度、平均本地量子密钥消耗速率、平均本地量子密钥生成速率和路径量子密钥利用率,并基于所述所有量子密钥分发通过路由策略所全通的路径总时间、量子密钥新鲜度、平均本地量子密钥消耗速率、平均本地量子密钥生成速率和路径量子密钥利用率,计算对应的所述奖励函数值。
22、在一个实施例中,通过预设的模拟环境,迭代地执行下述步骤:采集用于训练的第一量子密钥分发qkd网络当前时间步的状态,并计算对应的奖励函数值,将所述状态输入至预设的演员网络中,输出对应的动作,所述动作为更新后的所述qkd网络中各节点间链路的权重值;包括:
23、在预设的模拟环境中,初始化第一qkd网络中各节点间链路的权重值以及初始化第一qkd网络中各节点间链路的状态;
24、将各节点间链路的状态作为所述演员网络的输入,通过所述演员网络输出各节点间链路对应的权重值;所述权重值为所述路由演员网络输出的当前时间步的动作;所述演员网络的架构为量子-经典神经网络组建的混合神经网络;
25、根据所述演员网络输出的所述各节点间链路的权重值,以及每个密钥字节包的源节点和目的节点,利用预设的量子最短路径搜索算法,确定从源节点到第一qkd网络中每个节点的最短量子密钥分发路径;
26、根据从源节点到第一qkd网络中每个节点的最短量子密钥分发路径,确定从源节点到目的节点所经过的最短量子密钥分发路径,在所述第一qkd网络中执行模拟量子密钥分发的操作,并根据模拟量子密钥分发操作的结果,计算当前时间步的动作对应的奖励函数值;
27、重复执行下述步骤:根据所述第一qkd网络中上个时间步的模拟量子密钥分发结果,确定各节点间链路的更新后的状态;将所述更新后的状态输入至所述演员网络,通过所述演员网络输出更新后的各节点间链路对应的权重值,所述权重值为下一个时间步的动作;基于所述权重值更新最短量子密钥分发路径,并再次执行模拟量子密钥分发操作,根据模拟量子密钥分发操作的结果计算所述下一个动作对应的奖励函数值的步骤,直至对所述演员网络的训练终止;
28、训练终止的条件包括下述任一条件:
29、奖励函数值达到收敛状态;
30、迭代次数已达到预设的训练轮数阈值。
31、在一个实施例中,所述演员网络的架构包括:
32、依次连接的第一角度编码单元、至少一层包含待优化参数的第一参数化量子线路单元以及第一经典神经网络;所述第一参数化量子线路中包含多个量子逻辑门组成的量子线路;
33、本文档来自技高网
...
【技术保护点】
1.一种量子密钥分发网络的路由方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,在对演员网络进行训练之前,还包括:
3.如权利要求2所述的方法,其特征在于,所述计算奖励函数值,包括:
4.如权利要求1所述的方法,其特征在于,通过预设的模拟环境,迭代地执行下述步骤:采集用于训练的第一量子密钥分发QKD网络当前时间步的状态,并计算对应的奖励函数值,将所述状态输入至预设的演员网络中,输出对应的动作,所述动作为更新后的所述QKD网络中各节点间链路的权重值,具体包括:
5.如权利要求4的方法,其特征在于,所述演员网络的架构包括:
6.如权利要求1所述的方法,其特征在于,利用预设的演员网络-评论家网络的训练架构,以及每个时间步的状态、动作和奖励函数值,对所述演员网络进行训练,直至达到预设的训练终止条件,包括:
7.如权利要求1所述的方法,其特征在于,根据所述策略网络输出的各链路的权重值,计算所述第二量子密钥分发网络的最优路由,包括:
8.如权利要求4、5和7任一项所述的方法,其特征在于,所述量子最短路径搜索算法,通过下述步骤实现:
9.一种量子密钥分发网络路由的装置,其特征在于,包括:
10.一种计算设备,其特征在于,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-8任一项所述的量子密钥分发网络的路由方法。
...
【技术特征摘要】
1.一种量子密钥分发网络的路由方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,在对演员网络进行训练之前,还包括:
3.如权利要求2所述的方法,其特征在于,所述计算奖励函数值,包括:
4.如权利要求1所述的方法,其特征在于,通过预设的模拟环境,迭代地执行下述步骤:采集用于训练的第一量子密钥分发qkd网络当前时间步的状态,并计算对应的奖励函数值,将所述状态输入至预设的演员网络中,输出对应的动作,所述动作为更新后的所述qkd网络中各节点间链路的权重值,具体包括:
5.如权利要求4的方法,其特征在于,所述演员网络的架构包括:
6.如权利要求1所述的方法,其特征在于,利用预设...
【专利技术属性】
技术研发人员:郭聪,解宇恒,郝苑辰,孙宇辰,林跃锋,
申请(专利权)人:深圳量旋科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。