一种神经网络数据量化存储方法技术

技术编号：27740424 阅读：20 留言：0更新日期：2021-03-19 13:33

本发明专利技术公开了一种神经网络量化存储方法。本发明专利技术方法首先将长度为L位的数据由高到低逐位判断是否为零，找到第一个非零数值对应的位置；如果数据为无符号数据，设定有效位数n，从第一个非零位置截取长度为n的数据进行存储，如果到第L‑n位依旧为零，保留L‑n位到L‑1位的数据段，添加标志位后进行存储；如果数据为有符号数据，设定有效位数m，从第一个非零位置截取长度为m的数据进行存储，如果到第L‑m+1位依旧为零，保留L‑m+1位到L‑1位的数据段，添加标志位、符号位后进行存储。本发明专利技术方法按照有效位数进行量化存储，过滤了高位为零的数据以及低位对神经网络预测精度影响较小的数据，大幅节约了存储空间和硬件算力。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络数据量化存储方法
本专利技术属于人工智能
，尤其是神经网络
，具体涉及一种神经网络数据量化存储方法。
技术介绍
深度学习自20世纪50年代诞生起，至今已经发展了几十年，历经几起几落，主要的原因都是当时计算机的算力不足，而随着计算机算力突飞猛进的发展，深度学习技术重新火热起来。虽然计算机的算力有了长足的进步，但是对于深度学习来说，其庞大的计算量以及参数量对计算机来说依旧是不小的挑战。通常来说，网络越大，参数越多该网络就有更好的性能，目前已经有非常多的经典网络诞生，这些网络的预测精度已经逐渐逼近人类的预测精度，甚至在某些领域已经超过了人类的预测精度。但是随之而来的问题是，网络过深，参数众多非常难以训练和部署，虽然其预测精度很高，但是这些缺点也限制了神经网络的应用范围，神经网络消耗的内存巨大，难以在小型设备上部署，而有些场景又需要实时预测，所以算力依旧是急需解决的问题之一。针对这一情况，量化是目前最常用也是应用最广泛的手段，量化有着原理简单，公式少，实现方便，性能稳定，技巧多样等特点，量化一般的做法是把高精度的浮点值截断或投影到低精度的浮点值或定点值上，但是量化的缺点也显而易见，直接进行量化会导致神经网络模型精度大幅下降。线性量化是目前最常用的量化方法，其做法是将需要量化的数据归一化到某一个区间，然后直接将数据的末尾进行舍入，从而达到将数据长度缩短的目的。该方法简单易于实现，不过对于神经网络的数据并没有做针对性设计，所以网络精度会受到影响。除此之外，还有众多非线性的量化方法也被提出，与线性量化不同，...

【技术保护点】
1.一种神经网络数据量化存储方法，其特征在于，该方法具体如下：/n(1).首先取得神经网络需要量化的数据，包括权重、偏置、样本数据；/n(2).然后将长度为L位的数据d由高到低逐位判断是否为零，找到第一个非零数值对应的位置i；/n(3).如果数据d为无符号数据，则：/n根据ceil(log

【技术特征摘要】
1.一种神经网络数据量化存储方法，其特征在于，该方法具体如下：
(1).首先取得神经网络需要量化的数据，包括权重、偏置、样本数据；
(2).然后将长度为L位的数据d由高到低逐位判断是否为零，找到第一个非零数值对应的位置i；
(3).如果数据d为无符号数据，则：
根据ceil(log2(L-n))+n＝K设定有效位数n，K为硬件存储要求；
遍历数据d的第0位至第(L-n)位，从数据d第一个非零位置i，截取长度为有效位数n的数据，即截取di到di+n的数据进行存储，其他数据舍弃不存储；di表示第i位数据；
如果到第(L-n)位，dL-n依旧为零，则停止...

【专利技术属性】
技术研发人员：宋一平，梁骏，钟宇清，宋蕴，杨常星，
申请(专利权)人：杭州国芯科技股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人