无线分布式机器学习中数据获取处理的方法、装置及系统制造方法及图纸

技术编号:29281165 阅读:15 留言:0更新日期:2021-07-16 23:18
本说明书公开一种无线分布式机器学习中数据获取处理的方法、装置及系统,其中适于在边缘计算服务器上执行的数据获取方法,包括:根据当前训练集训练目标模型,根据重要性估计值定义,在测试集上得到重要性均值L

【技术实现步骤摘要】
无线分布式机器学习中数据获取处理的方法、装置及系统


[0001]本专利技术涉及通信
,具体而言,涉及一种无线分布式机器学习中数据获取处理的方法、装置及系统。

技术介绍

[0002]随着物联网、车联网等技术的发展和大规模智能终端的部署,边缘计算在处理终端产生的大量数据发挥着越来越重要的作用,针对边缘计算中的设备部署、资源分配、性能优化的研究也越来越多。相关的研究从各种不同的方面入手优化边缘计算的通信性能或将边缘计算方法结合实际应用中。相关的边缘计算技术主要研究如何通过资源的分配提高信道利用率、最大化通信容量、降低时延,但不会考虑传输的数据本身对于模型训练的影响。为了提高通信效率,常常会对通信数据进行压缩,但数据的有损压缩会带来信息的损失,所以需要在数据大小和信息损失之间进行权衡。训练数据中信息的损失,可能在特征空间中将训练数据移至分类超平面的另一端,从而对模型的训练带来负面影响,此时应调整压缩率减少信息的损失。在边缘学习中,优化的目标还应包括模型的性能,当前模型对此数据的特征提取、分析的能力较弱,这样的数据应提供更多的细节信息帮助模型学习对这类数据的处理方法。所以通信方案的设计除了获得更高的通信容量外,还应考虑到提高传输数据的总重要性。
[0003]综上,如何提高通信中数据质量,优化模型的性能,成为亟待解决的问题。

技术实现思路

[0004]本说明书提供一种无线分布式机器学习中数据获取处理的方法、装置及系统,用以克服现有技术中存在的至少一个技术问题。
[0005]根据本说明书实施例的第一方面,提供一种无线分布式机器学习中的数据获取方法,适于在边缘计算服务器上执行,包括:根据当前训练集训练目标模型,得到当前目标模型;基于当前目标模型,对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
,所述重要性评估值为当前目标模型对数据样本的模型输出与数据样本的标准输出之间差值的二范数的平方,所述重要性评估值表征当前目标模型对该数据样本的分析能力;设置阈值θ,根据重要性均值L
ave
,得到重要性阈值θL
ave
;测量与各边缘设备的信道条件,根据所述信道条件计算各边缘设备对应的传输速率,选择传输速率最大的边缘设备发送传输触发命令;接收被选择的边缘设备发送的数据;计算接收到的每一数据的重要性评估值L,若该数据的重要性评估值L大于重要性阈值θL
ave
,且该数据的压缩率未达到数据传输的最大压缩率,则向被选择的边缘设备发送该数据的重传请求命令;若该数据的重要性评估值L不大于重要性阈值θL
ave
,或该数据的压缩率已达到传输的最大压缩率,则将该数据加入当前训练集,并且继续根据各边缘设备发送的对应的信道条件选择传输数据的边缘设备;当接收到的数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型。
[0006]可选地,所述重要性评估值的定义包括:
[0007]L=||F(x)-G
t
||2[0008]其中,L为数据样本(x,G
t
)对应的数据重要性,F(x)为当前目标模型对数据样本的模型输出,G
t
为该数据样本的标准输出。
[0009]可选地,所述测量与各边缘设备的信道条件,根据所述信道条件计算各边缘设备对应的传输速率,选择传输速率最大的边缘设备发送传输触发命令的步骤,包括:测量与各边缘设备的信道条件,根据所述信道条件获得与各边缘设备之间当前信号传输的信噪比;根据所述信噪比,通过香农公式计算对应的传输速率;选择传输速率最大的边缘设备发送传输触发命令。
[0010]根据本说明书实施例的第二方面,提供一种无线分布式机器学习中的数据处理方法,适于在边缘设备上执行,包括:接收边缘计算服务器发送的传输触发命令,随机选取数据,以第一压缩率对数据进行压缩,并传输该压缩数据;若接收到边缘计算服务器发送的对应数据的重传请求命令,则以第二压缩率对该数据进行压缩,并向边缘计算服务器发送第二压缩率下的压缩数据,所述第二压缩率大于所述第一压缩率,所述第二压缩率不大于数据传输的最大压缩率。
[0011]根据本说明书实施例的第三方面,提供一种边缘计算服务器,包括模型训练模块、均值计算模块、阈值计算模块、设备选择模块、数据接收模块、评估模块、更新模块,其中:模型训练模块,被配置为根据当前训练集训练目标模型,得到当前目标模型;均值计算模块,被配置为基于当前目标模型,对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
,所述重要性评估值为当前目标模型对数据样本的模型输出与数据样本的标准输出之间差值的二范数的平方,所述重要性评估值表征当前目标模型对该数据样本的分析能力;阈值计算模块,被配置为设置阈值θ,根据重要性均值L
ave
,得到重要性阈值θL
ave
;设备选择模块,被配置为测量与各边缘设备的信道条件,根据所述信道条件计算各边缘设备对应的传输速率,选择传输速率最大的边缘设备发送传输触发命令;数据接收模块,被配置为接收被选择的边缘设备发送的数据;评估模块,被配置为,计算接收到的每一数据的重要性评估值L,若该数据的重要性评估值L大于重要性阈值θL
ave
,且该数据的压缩率未达到数据传输的最大压缩率,则向被选择的边缘设备发送该数据的重传请求命令;若该数据的重要性评估值L不大于重要性阈值θL
ave
,或该数据的压缩率已达到传输的最大压缩率,则将该数据加入当前训练集,并且继续根据各边缘设备发送的对应的信道条件选择传输数据的边缘设备;更新模块,被配置为当接收到的数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型。
[0012]可选地,所述均值计算模块中重要性评估值的定义包括:
[0013]L=||F(x)-G
t
||2[0014]其中,L为数据样本(x,G
t
)对应的数据重要性,F(x)为当前目标模型对数据样本的模型输出,G
t
为该数据样本的标准输出。
[0015]可选地,所述设备选择模块包括测量单元、计算单元、选择单元,其中:测量单元,被配置为测量与各边缘设备的信道条件,根据所述信道条件获得与各边缘设备之间当前信号传输的信噪比;计算单元,被配置为根据所述信噪比,通过香农公式计算对应的传输速率;选择单元,被配置为选择传输速率最大的边缘设备发送传输触发命令。
[0016]根据本说明书实施例的第四方面,提供一种边缘设备,包括发送模块、重传模块,其中:发送模块,被配置为接收边缘计算服务器发送的传输触发命令,随机选取数据,以第一压缩率对数据进行压缩,并传输该压缩数据;重传模块,被配置为若接收到边缘计算服务器发送的对应数据的重传请求命令,则以第二压缩率对该数据进行压缩,并向边缘计算服务器发送第二压缩率下的压缩数据,所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无线分布式机器学习中的数据获取方法,适于在边缘计算服务器上执行,其特征在于,包括:根据当前训练集训练目标模型,得到当前目标模型;基于当前目标模型,对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
,所述重要性评估值为当前目标模型对数据样本的模型输出与数据样本的标准输出之间差值的二范数的平方,所述重要性评估值表征当前目标模型对该数据样本的分析能力;设置阈值θ,根据重要性均值L
ave
,得到重要性阈值θL
ave
;测量与各边缘设备的信道条件,根据所述信道条件计算各边缘设备对应的传输速率,选择传输速率最大的边缘设备发送传输触发命令;接收被选择的边缘设备发送的数据;计算接收到的每一数据的重要性评估值L,若该数据的重要性评估值L大于重要性阈值θL
ave
,且该数据的压缩率未达到数据传输的最大压缩率,则向被选择的边缘设备发送该数据的重传请求命令;若该数据的重要性评估值L不大于重要性阈值θL
ave
,或该数据的压缩率已达到传输的最大压缩率,则将该数据加入当前训练集,并且继续根据各边缘设备发送的对应的信道条件选择传输数据的边缘设备;当接收到的数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型。2.根据权利要求1所述的方法,其特征在于,所述重要性评估值的定义包括:L=||F(x)-G
t
||2其中,L为数据样本(x,G
t
)对应的数据重要性,F(x)为当前目标模型对数据样本的模型输出,G
t
为该数据样本的标准输出。3.根据权利要求1所述的方法,其特征在于,所述测量与各边缘设备的信道条件,根据所述信道条件计算各边缘设备对应的传输速率,选择传输速率最大的边缘设备发送传输触发命令的步骤,包括:测量与各边缘设备的信道条件,根据所述信道条件获得与各边缘设备之间当前信号传输的信噪比;根据所述信噪比,通过香农公式计算对应的传输速率;选择传输速率最大的边缘设备发送传输触发命令。4.一种无线分布式机器学习中的数据处理方法,适于在边缘设备上执行,其特征在于,包括:接收边缘计算服务器发送的传输触发命令,随机选取数据,以第一压缩率对数据进行压缩,并传输该压缩数据;若接收到边缘计算服务器发送的对应数据的重传请求命令,则以第二压缩率对该数据进行压缩,并向边缘计算服务器发送第二压缩率下的压缩数据,所述第二压缩率大于所述第一压缩率,所述第二压缩率不大于数据传输的最大压缩率。5.一种边缘计算服务器,包括模型训练模块、均值计算模块、阈值计算模块、设备选择模块、数据接收模块、评估模块、更新模块,其中:模型训练模块,被配置为根据当前训练集训练目标模型,得到当前目标模型;
均值计算模块,被配置为基于当前目标模型,对测试集中的每一数...

【专利技术属性】
技术研发人员:张剑钟绍宸孙学文王奎
申请(专利权)人:北京超星未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1