基于样本差异分析的多深度神经网络参数融合系统及方法技术方案

技术编号：35299521 阅读：13 留言：0更新日期：2022-10-22 12:47

本发明专利技术设计基于样本差异分析的多深度神经网络参数融合系统及方法，属于深度学习和神经网络领域；包括代表性样本选取模块、边缘样本特征差异系数计算模块和多边参数融合模块；所述代表性样本选取模块从边缘样本集中选取最佳边界训练数据，以此作为边缘代表性样本数据，并将其发送到边缘样本特征差异系数计算模块，边缘样本特征差异系数计算模块对边缘代表性样本数据每一维度进行差异性计算，得到边缘代表性样本数据的差异系数；基于差异系数，多边参数融合模块对深度神经网络模型参数进行参数融合；对有需要的边缘设备端神经网络模型参数进行融合调整，有效的提升边缘设备端神经网络模型的质量，进而提升边缘设备端实时决策的能力。的能力。

全部详细技术资料下载

【技术实现步骤摘要】
基于样本差异分析的多深度神经网络参数融合系统及方法

[0001]本专利技术属于深度学习和神经网络领域，尤其涉及基于样本差异分析的多深度神经网络参数融合系统及方法。

技术介绍

[0002]随着算法、算力和大数据的发展，神经网络在计算机视觉、语音识别、自然语言处理等应用中取得了重大突破。边缘计算的发展促使计算向数据产生端迁移，形成了在边缘侧应用神经网络模型实时决策的解决方案，从而降低了延迟，减少了数据传输量。受限于边缘设备有限的的计算能力和存储能力，边缘设备端无法实时通过流式数据训练复杂的神经网络模型，需要结合边缘服务器或其他边缘设备等进行协同训练。同时，边缘侧数据来源具有较强的局部性，容易导致模型过拟合，需要更丰富的数据完成训练以满足更大范围、更多功能的任务需求。因此，为了满足边缘侧的神经网络更新需求，需要通过多边协作训练和参数融合调整边缘神经网络模型参数，提升边缘神经网络模型的决策准确率。
[0003]分布式机器学习和联邦学习是现有边缘环境中参数融合的常用技术方案。分布式机器学习指利用多个计算节点行机器学习的算法和系统，旨在提高性能、保护隐私，并可扩展至更大规模的训练数据和更大的模型。分布式机器学习系统中，训练数据被分为不相交的数据分片并发送给各个计算节点，计算节点在本地执行随机梯度下降。工作者将梯度或模型参数上传至参数服务器，参数服务器对收到的梯度或模型参数聚合(如计算加权平均等)后得到全局梯度或全局模型参数。在边缘智能环境中使用分布式机器学习范式进行实时推理和实时训练时，其中的计算节点为边缘设备，参数服务...

【技术保护点】

【技术特征摘要】
1.基于样本差异分析的多深度神经网络参数融合系统，其特征在于，包括代表性样本选取模块、边缘样本特征差异系数计算模块和多边参数融合模块；所述代表性样本选取模块安装在边缘端，边缘样本特征差异系数计算模块和多边参数融合模块安装在边缘服务器端。2.根据权利要求1所述的基于样本差异分析的多深度神经网络参数融合系统，其特征在于，所述代表性样本选取模块从边缘样本集中选取最佳边界训练数据，以此作为边缘代表性样本数据，并将其发送到边缘样本特征差异系数计算模块，边缘样本特征差异系数计算模块对边缘代表性样本数据每一维度进行差异性计算，得到边缘代表性样本数据的差异系数；基于差异系数，多边参数融合模块对深度神经网络模型参数进行参数融合。3.基于样本差异分析的多深度神经网络参数融合系统及方法，通过所述权利要求1基于样本差异分析的多深度神经网络参数融合系统实现；其特征在于，包括以下步骤：步骤1：基于神经网络对流式数据进行实时决策，并通过流数据聚类算法实时积累边缘端样本数据；从生成的边缘端样本数据中，利用边缘代表性样本选取模块选取出边缘端代表性样本数据上传至边缘端服务器；边缘端有n个，通过边缘代表选取模块得到n个边缘端代表性样本，n为正整数；步骤2：基于步骤1生成的边缘侧代表性样本，在边缘服务器端通过边缘样本特征差异系数计算模块进行样本特征差异分析，得出样本特征差异系数；步骤3：根据步骤2所得的样本特征差异系数字典，利用多边参数融合模块在边缘服务器端对神经网络模型参数进行融合；步骤4：将根据步骤3得到的更新后模型参数发送至各边缘端并更新边缘端模型参数，完成参数融合。4.根据权利要求3所述的基于样本差异分析的多深度神经网络参数融合系统及方法，其特征在于，步骤1所述边缘代表性样本选取模块是从边缘端样本集中选取靠近各分类边界并且彼此靠近的训练数据，作为边缘端代表性样本，从而降低数据被错误分类的概率；首先根据在边缘端通过流数据聚类算法得到的聚类结果，找到各个聚成簇之间的最佳边界、各个类中距离最佳边界距离最短的数据点，即边界数据以及属于该最佳边界的数据，其中最佳边界由式1表示，边界数据需要满足式2；W
·
X+b＝0
ꢀꢀ
(1)其中，W是权重向量，即W＝{w1，w2，...，wn}，n是属性个数；b是标量；X是为数据集合，具有类标号y
i
；根据式2依次找出距离最佳边界距离最短的边界数据，将其存入到各个最佳边界的代表性样本集中；各个最佳边界的代表性样本选取是从每个最佳边界的边界数据开始计算；然后从当前最佳边界的数据中找出与当前数据最相邻的k个数据点；如果存在与当前数据不属于同一类的数据点，则将其存入当前最佳边界的代表性样本中；如果相邻的k个数据点与当前数据属于同一类，则该k个相邻数据将被丢弃，并从当前最佳边界的数据中选出距最佳边界距离最短的数据点存入当前最佳边界的代表性样本中；最后依次对新加入的数据点重复以上操作，直到当前最佳边界的数据全部被处理。5.根据权利要求3所述的基于样本差异分析的多深度神经网络参数融合系统及方法，
其特征在于，步骤1具体为：步骤1.1：对边缘端样本数据dataset进行聚...

【专利技术属性】
技术研发人员：那俊，张瀚铎，张斌，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人