用于神经网络量化的方法和设备技术

技术编号：17813248 阅读：64 留言：0更新日期：2018-04-28 05:47

一种用于神经网络量化的方法和设备。描述了用于在深度神经网络中执行网络参数量化的设备和方法、系统和制造该设备的方法。一方面，确定神经网络的网络参数的损失函数的二阶偏导矩阵的对角线，然后使用所述对角线对网络参数进行加权，作为对网络参数进行量化操作的一部分，其中，二阶偏导矩阵是海赛矩阵。另一方面，使用网络参数的梯度的一阶矩估计和二阶矩估计对神经网络进行训练，然后使用所述二阶矩估计对所述网络参数进行加权，作为对所述网络参数进行量化操作的一部分。另一方面，通过使用熵约束的标量量化(ECSQ)迭代算法执行网络参数量化。另一方面，通过一次性地对深度神经网络的所有层的网络参数一起量化来执行网络参数量化。

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络量化的方法和设备本申请要求于2016年10月19日提交的第62/409,961号美国临时专利申请和于2017年2月15日提交的第15/433,531号美国非临时专利申请的优先权，这些申请的全部内容通过引用合并于此。
本公开通常涉及深度神经网络，更具体地，涉及一种用于神经网络量化的方法和设备。
技术介绍
机器学习技术正在不断地发展，从网络搜索、内容过滤、商业网站自动推荐、自动化游戏、对象检测、图像分类、语音识别、机器翻译、药物发现和基因组学，已经开始支持现代社会的很多方面。目前机器学习领域中的最先进的技术是深度神经网络，其使用由多个处理层组成的计算模型，所述多个处理层学习具有多个抽象级别的数据表示(通常是极大量的数据)，因此术语“深度学习”、“深度网络”等参见例如在Nature，卷521，pp.436-444(2015年5月28日)中的LeCun，Yann，YoshuaBengio和GeoffreyHinton的“Deeplearning”，其全部内容通过引用合并于此。机器学习的第一也是最重要的阶段是训练。考虑针对图像分类的机器学习系统。例如人、宠物、车辆和房屋的图像的大数据集被收集，每一个图像都标有相应的类别。在训练期间，机器被展示图像，并以分数向量的形式产生输出，每个类别对应一个输出。最终的目标是使正确的类别获得所有类别中的最高分，但这不可能发生在训练之前。在训练中使用测量输出分数与分数的期望模式(pattern)之间的误差(或差距)的目标函数。更具体地，机器修改其内部的可调参数以减少从目标函数计算的误差。这些可调参数，通常称为权重，用于定义...
用于神经网络量化的方法和设备

【技术保护点】
一种用于神经网络量化的方法，包括：确定神经网络的网络参数的损失函数的二阶偏导矩阵的对角线，其中，所述二阶偏导矩阵是海赛矩阵；使用确定的对角线对所述网络参数进行加权，作为对所述网络参数进行量化操作的一部分，其中，所述加权是海塞加权。

【技术特征摘要】
2016.10.19 US 62/409,961;2017.02.15 US 15/433,5311.一种用于神经网络量化的方法，包括：确定神经网络的网络参数的损失函数的二阶偏导矩阵的对角线，其中，所述二阶偏导矩阵是海赛矩阵；使用确定的对角线对所述网络参数进行加权，作为对所述网络参数进行量化操作的一部分，其中，所述加权是海塞加权。2.如权利要求1所述的用于神经网络量化的方法，其中，通过将海赛加权的均值用作集群中心，经由所述网络参数的海赛加权的k均值聚类对所述网络参数进行量化。3.如权利要求2所述的用于神经网络量化的方法，其中，通过二进制编码对量化的网络参数进行编码。4.如权利要求1所述的用于神经网络量化的方法，其中，将海赛加权的均值用作集群中心通过均匀量化对所述网络参数进行聚类，并且通过可变长度二进制编码对量化的网络参数进行编码。5.如权利要求1所述的用于神经网络量化的方法，其中，神经网络是具有多个层的深度神经网络，并且同时对所有层执行量化。6.如权利要求1所述的用于神经网络量化的方法，其中，熵编码被使用，并且量化聚类通过使用熵约束的标量量化(ECSQ)来执行。7.如权利要求6所述的用于神经网络量化的方法，其中，将海赛加权的均值用作集群中心通过均匀量化对所述网络参数进行聚类。8.如权利要求6所述的用于神经网络量化的方法，其中，通过使用用于执行熵约束的标量量化(ECSQ)的迭代操作对所述网络参数进行聚类。9.如权利要求8所述的用于神经网络量化的方法，其中，通过使用迭代操作对所述网络参数进行聚类的步骤包括：根据集群的失真度量和聚类后的网络参数的熵来定义拉格朗日代价函数；迭代地分配并更新集群，直到拉格朗日代价函数减小到小于阈值。10.如权利要求8所述的用于神经网络量化的方法，其中，在执行迭代操作中使用海赛加权。11.一种用于神经网络量化的方法，包括：使用网络参数的梯度的一阶矩估计和二阶矩估计对神经网络进行训练；使用所述二阶矩估计对所述网络参数进行加权，作为对所述网络参数进行量化的一部分。12.如权利要求11所述的用于神经网络量化的方法，其中，通过随机梯度下降(SGD)优化器执行所述训练。13.一种神经网络量化中的设备，包括：一个或更多个非易失性计算机可读介质；至少一个处理器，其中，所述至少一个处理器在执行存储在所述一个或更多个非易失性计算机可读介质上的指令时执行以下步骤：确定神经网络的网络参数的损失函数的二阶偏...

【专利技术属性】
技术研发人员：崔柳真，李正元，穆斯塔法·艾尔可哈米，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人