一种基于随机博弈在线学习的众包用户信息年龄管理算法制造技术

技术编号：23860044 阅读：34 留言：0更新日期：2020-04-18 13:18

本发明专利技术涉及一种基于随机博弈在线学习的众包用户信息年龄管理算法，采取最大化未来期望收益的方法，让众包用户在学习过程中自适应地动态调整数据包产生速率，根据学习结果获取不同状态下的最佳选择策略，使得使用该策略的用户长期收益最大化。解决众包用户在动态环境下自适应选择可以最大化长期收益的最佳选择策略的问题，将众包用户之间的竞争描述为随机博弈模型，使用在线学习算法获得最佳数据包产生速率选择策略。

An information age management algorithm of crowdsourcing users based on online learning of stochastic game

全部详细技术资料下载

【技术实现步骤摘要】
一种基于随机博弈在线学习的众包用户信息年龄管理算法
本专利技术属于众包和在线学习领域，尤其涉及一种基于随机博弈在线学习的众包用户信息年龄管理算法。
技术介绍
随着物联网(IoT)技术的快速发展和便携式设备的广泛普及，对实时信息更新的需求越来越迫切，例如新闻、天气预报和交通状况等。在大多数的情况下，过时的信息几乎没有用处。为了收集实时的交通数据，谷歌地图邀请用户群体在自己的位置提交实时路况信息，比如报告是否存在交通堵塞或者交通事故，使用该地图的其他用户则可以及时看到这些交通消息，并根据这些信息来更好地规划自己的路线。这种众包的做法越来越多，它结合了群体的集体努力来保持信息的实时更新。众包集结了群体的力量来完成特定的任务。众包平台招募用户来执行特定的感知任务。为了能提供足够及时的数据信息，众包平台需要吸引大量的用户。然而，生成和传输信息会消耗用户移动设备上的资源，因此，众包平台需要设计有效的激励机制来补偿用户对电池、计算能力等资源的消耗，以鼓励用户贡献更多的信息。众包平台通常会根据用户完成任务的数量给予相应的奖励。信息年龄(Age-of-information，AoI)作为一种评价信息新鲜度的新指标被引入，它度量了用户采集的数据信息从生成到被接收之间经过的时间。现有的这类关于AoI的经济问题更多的是将两个众包平台之间的竞争定义为一种非合作博弈，而对试图从平台得到理想的利润的用户之间的竞争进行研究的文献还比较少。从用户的角度看，特别是用户如何管理AoI以从众包平台获得最优的回报，目前还没有研究。具体地说，在...

【技术保护点】
1.一种基于随机博弈在线学习的众包用户信息年龄管理算法，其特征在于，包含以下步骤：/n步骤1，初始化众包数据和当前信道的属性，具体包括：/n输入初始随机探索概率参数θ

【技术特征摘要】
1.一种基于随机博弈在线学习的众包用户信息年龄管理算法，其特征在于，包含以下步骤：
步骤1，初始化众包数据和当前信道的属性，具体包括：
输入初始随机探索概率参数θ0，折现系数γ，∈-纳什均衡的近似参数∈，用户1和用户2生成数据包的单位成本{c1,c2}，初始平均AoI{f1(0),f2(0)}，以及初始信道状态{q1(0),q2(0)}；设置当前迭代数t＝0；初始化用户的状态s(0)＝{s1(0),s2(0)}，在所有离散状态下的状态值{V1[s1(t),s2(t)],V2[s1(t),s2(t)]}及策略对π(0)＝{π1(0),π2(0)}；
步骤2，计算随机探索概率参数
步骤3，两个用户分别以1-θ的概率根据当前策略π(t)＝{π1(t),π2(t)}选择动作a(t)＝{a1(t),a2(t)}，即数据包产生的速率；以θ的概率随机选择动作a(t)＝{a1(t),a2(t)}；
步骤4，根据两个用户的动作以及用户当前状态，计算得到用户1对于众包平台的贡献比例期望收益为，用户2对于众包平台的贡献比例为和期望收益；
在Δt时间内，计算用户i在该时间段中产生的所有数据包的AoI，用户i在t轮迭代后的AoI；并计算得出t+1轮迭代中的用户AoI的转移概率；
使用户1和用于2的策略达到近似纳什均衡，即最佳策略对；
用表示近似最佳策略对，对于任意状态s∈S，都有其中并且∈>，因此，用户i在状态s下的状态值的计算可以写为
两个用户的近似最佳策略对计算方式分别为和
步骤5，利用步骤4中最佳策略对更新用户1用户2的最佳策略；
步骤6，根据步骤4所得结果分别更新两个用户的状态值；
步骤7，如果用户的策略收敛，结束算法并输出策略对；否则增值t...

【专利技术属性】
技术研发人员：陈艳姣，朱笑天，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人