一种基于压缩数据直接计算的智能负载处理方法和系统技术方案

技术编号：36539478 阅读：16 留言：0更新日期：2023-02-01 16:34

本发明专利技术涉及一种基于压缩数据直接计算的智能负载处理方法和系统，包括以下步骤：基于给定的定义了原始模型逐层结构的代码文件，判断该原始模型是否满足压缩数据直接计算优化条件，若满足，则进入下一步骤；否则按照常规训练方式展开模型训练；基于LSH聚类算法对输入矩阵进行压缩，并将LSH聚类算法对应的压缩过程参数与原始模型的权重参数联合作为网络参数进行训练，得到结果模型；利用结果模型对输入矩阵进行直接计算，得到数据处理结果。本发明专利技术可以广泛应用于大数据处理技术领域。明可以广泛应用于大数据处理技术领域。明可以广泛应用于大数据处理技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于压缩数据直接计算的智能负载处理方法和系统

[0001]本专利技术涉及一种基于压缩数据直接计算的智能负载处理方法和系统，属于大数据处理

技术介绍

[0002]随着深度学习技术的通用性逐渐增强，深度学习技术广泛普及。一方面，轻量级模型负载被越来越广泛地应用于如机器人、自动驾驶运动控制、流媒体视觉系统等物联网领域中，加速社会智能化。另一方面，日益增长的超大规模模型负载越来越深入地应用于如医学影像分析、分子动力学模拟、天体目标分类等各类专业学科领域，推动科技发展。
[0003]在深度学习技术赋能各领域突破技术壁垒的同时，其经验和知识也反馈到深度学习
，促成深度学习模型的代际演化。此外，在配备大量并行处理单元的高算力处理核心(如图形处理单元GPU)的问世、存储资源的升级和扩展，以及丰富且有效的超大规模数据集的加持下，深度学习模型逐渐呈现出更深层次和更复杂的趋势。自2018年谷歌提出BERT模型以来，以BERT、GPT等为代表的模型向着“超大规模”方向发展。如今，模型参数已经扩张到万亿规模，例如2021年发布的GLM模型拥有1.75万亿参数，远超2020年刚升级为1750亿参数的GPT
‑
3模型。具有如此庞大的参数量的模型，更需要超大规模的训练数据才能充分施展能力，目前COCO、Criteo等人工标注类数据集已达GB级，更有PanGu、WuDao等TB级无标注数据集供模型设计者使用。
[0004]然而，随着模型和数据集规模的盘旋扩张，模型训练、推理负载所需的巨额计算成本在

【技术保护点】

【技术特征摘要】
1.一种基于压缩数据直接计算的智能负载处理方法，其特征在于包括以下步骤：基于给定的定义了原始模型逐层结构的代码文件，判断该原始模型是否满足压缩数据直接计算优化条件，若满足，则进入下一步骤；否则按照常规训练方式展开模型训练；基于LSH聚类算法对输入矩阵进行压缩，并将LSH聚类算法对应的压缩过程参数与原始模型的权重参数联合作为网络参数进行训练，得到结果模型；利用结果模型对输入矩阵进行直接计算，得到数据处理结果。2.如权利要求1所述的一种基于压缩数据直接计算的智能负载处理方法，其特征在于，所述压缩数据直接计算优化条件的判断包括：判断原始模型中是否存在包含矩阵运算的模型层；对包含矩阵运算的模型层，根据其参数维度及参数矩阵稀疏性判断该模型层是否属于计算密集型；若属于计算密集型，则判定该原始模型满足压缩数据直接计算优化条件。3.如权利要求1所述的一种基于压缩数据直接计算的智能负载处理方法，其特征在于，所述基于LSH聚类算法对输入矩阵进行压缩，并将LSH聚类算法对应的压缩过程参数与原始模型的权重参数联合作为网络参数进行训练，得到结果模型，包括：建立基于LSH聚类算法的卷积算子架构作为前向传播机制，对输入矩阵的瞬态冗余进行检测和消除；建立基于二值近似和进制转换的反向传播机制，用于将LSH聚类算法中的非连续性条件转换为连续性条件；将基于LSH聚类算法的卷积算子架构对应的压缩过程参数与原始模型的权重参数联合作为网络参数，采用确定的前向传播机制和反向传播机制，以梯度下降更新的方式完成模型训练，得到结果模型。4.如权利要求3所述的一种基于压缩数据直接计算的智能负载处理方法，其特征在于，所述基于LSH聚类算法的卷积算子架构的工作流程，包括：基于LSH聚类算法对输入矩阵X进行处理，获得输入矩阵X的聚簇质心矩阵X
c
；将聚簇质心矩阵X
c
与原始模型对应的权重矩阵W进行矩阵乘法，得到质心结果矩阵Y
c
；将质心结果矩阵Y
c
恢复至原始模型卷积层理论输出大小，得到最终输出矩阵Y。5.如权利要求4所述的一种基于压缩数据直接计算的智能负载处理方法，其特征在于，所述基于LSH聚类算法对输入矩阵X进行处理，获得输入矩阵X的聚簇质心矩阵X
c
，包括：将输入矩阵X垂直分片成L组，其中，L为哈希函数矩阵的行数；对展开后的输入矩阵X应用哈希函数矩阵，得到具有H个哈希向量的投影矩阵，其中，H为哈希函数矩阵的列数；对投影矩阵执行逐元素的二进制映射，得到一个比特矩阵；将比特矩阵的每...

【专利技术属性】
技术研发人员：张峰，官佳薇，杜小勇，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人