一种应用于边缘设备的模型训练方法及系统技术方案

技术编号：31320069 阅读：28 留言：0更新日期：2021-12-13 00:03

本发明专利技术公开了一种应用于边缘设备的模型训练方法及系统，属于模型压缩和迁移学习领域，包括：在边缘设备中加载预训练好的原模型，并识别出其中由Point

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于边缘设备的模型训练方法及系统

[0001]本专利技术属于模型压缩和迁移学习领域，更具体地，涉及一种应用于边缘设备的模型训练方法及系统。

技术介绍

[0002]随着智能化的普及，个人的智能设备大部分时间都处于闲置状态。将训练任务从云端迁移到边缘上可以充分利用边缘设备的算力。边缘上的数据量远少于云端，训练模型所需时间通常不会很长。减少需要上传的数据，训练效率也能得到提高。同时个人敏感数据不用再上传到云端，隐私问题能够很好的得到解决。
[0003]边缘设备上的存储和计算资源是有限的，如何在资源受限的设备上有效的训练神经网络模型需要解决二个问题：其一是，硬件的发展速度不再遵循摩尔定律，逐渐趋于平缓，而模型大小以及数据规模却在持续增长；为了减轻云的计算负载，训练需要从云平台转移到边缘平台，而个人闲置设备(边缘设备)硬件资源相较于云更少，因此需要解决在资源受限的边缘设备上不能训练日益增大的模型的问题。其二则是，在边缘设备上，数据的分布以及种类较为贫瘠，而模型要取得好的效果一般需要较多的数据用来训练，所以需要解决在边缘设备上模型效果不好的问题。
[0004]针对问题一，可以利用模型压缩技术对现有的效果好的模型进行压缩，将参数量庞大且冗余的模型架构压缩成参数量少且精巧的模型架构，使得压缩后的模型能够在边缘设备上进行训练。目前模型压缩算法主要有：模型量化、模型剪枝(或模型稀疏化)以及模型结构设计三种方法。
[0005]针对问题二，迁移学习是一个很好的解决方案。迁移学习可以帮助提升模型效果，模型首先在较...

【技术保护点】

【技术特征摘要】
1.一种应用于边缘设备的模型训练方法，其特征在于，包括：在边缘设备中加载预训练好的原模型，并识别出其中由Point
‑
wise卷积层、Depth
‑
wise卷积层和Point
‑
wise卷积层依次连接构成的残差块；在残差块的基础上加入对应的轻架构，以将所述原模型转换为目标模型；所述轻架构包括相连接的Group
‑
wise卷积层和Point
‑
wise卷积层；利用目标任务数据集对所述目标模型进行训练，并通过两步压缩的方式对先后对所述目标模型中的共享参数和非共享参数进行压缩，从而完成对所述目标模型的训练和压缩；其中，所述共享参数为所述目标模型中属于所述原模型的参数，所述非共享参数为属于所述目标模型中属于轻架构的参数。2.如权利要求1所述的应用于边缘设备的模型训练方法，其特征在于，所述两步压缩包括：在对所述目标模型进行训练之前，对所述共享参数进行压缩；对所述目标模型训练结束后，对所述非共享参数进行压缩。3.如权利要求1所述的应用于边缘设备的模型训练方法，其特征在于，所述两步压缩包括：在对所述目标模型进行训练之前，对所述共享参数进行压缩，并利用压缩后的共享参数对所述目标模型中属于所述原模型、但不与轻架构接壤的部分的激活值，压缩后再传入下一层网络；对所述目标模型训练结束后，对所述非共享参数进行压缩。4.如权利要求1所述的应用于边缘设备的模型训练方法，其特征在于，所述两步压缩包括：在对所述目标模型进行训练之前，对所述共享参数进行压缩；在对所述目标模型的每一轮训练中，先对所述非...

【专利技术属性】
技术研发人员：李瑞轩，辜希武，高鑫，李玉华，王号召，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人