针对分辨率降低的神经网络的优化量化制造技术

技术编号：29256157 阅读：30 留言：0更新日期：2021-07-13 17:27

用于生成和使用神经网络的定点操作的系统和方法包括：使用缩放因子将浮点加权因子转换为定点加权因子。将缩放因子定义成使成本函数最小化，并且缩放因子是从预定基数的倍数集合中导出的。将可能的缩放函数的集合定义成减少用于针对多个可能的缩放因子中的每一个评估成本函数的计算量。该系统和方法可以在被编程为执行逻辑的一个或多个控制器中实现。

全部详细技术资料下载

【技术实现步骤摘要】
针对分辨率降低的神经网络的优化量化
本申请一般涉及使用定点值计算的神经网络。
技术介绍
近年来，通过使用深度学习方法，在计算机视觉和语音处理/识别领域中，实现了大多数基于机器学习的突破。使用这些基于深度学习的分类器对输入数据进行分类的任务已得到广泛研究，并且被用于许多不同的应用。基于该应用，分类所需的神经网络可能非常庞大，其中具有数千万个变量。这样的大型网络需要大量的计算和数据存储资源，因此具有很高的能量/功率占位面积。由于较高的资源需求，许多深度学习任务主要在云中完成（大多数计算是在GPU或诸如神经网络加速器之类的特殊硬件上实行的）。由于计算和功率的约束，在许多情况下，深度学习网络无法部署在资源受约束的环境中。最新趋势是将应用领域从成像器和电话扩展到其他种类的传感器（例如，惯性传感器）。由于电池寿命的限制，这些传感器可以成为没有永久云连接的可穿戴设备的一部分——所谓的边缘计算。因此，需要用于边缘设备上的局部分类的新颖概念。
技术实现思路
一种用于将神经网络的浮点加权因子转换为定点加权因子的方法包括：选择预定数量的候选缩放因子，其是预定基数的倍数。该方法包括：在成本函数中评估每一个候选缩放因子。该方法包括：作为候选缩放因子中导致成本函数的最小值的一个来选择缩放因子。该方法包括：通过使用缩放因子缩放浮点加权因子来生成定点加权因子。该方法包括：使用定点加权因子来操作神经网络。预定基数可以是二。该方法可以进一步包括：响应于完成神经网络的训练阶段，将定点加权因子提供给推理阶段。预定数量的候选缩放因...

【技术保护点】
1.一种用于将神经网络的浮点加权因子转换为定点加权因子的方法，所述方法包括：/n选择预定数量的候选缩放因子，其是预定基数的倍数；/n在成本函数中评估每一个候选缩放因子；/n作为候选缩放因子中导致成本函数的最小值的一个来选择缩放因子；/n通过使用缩放因子缩放浮点加权因子来生成定点加权因子；以及/n使用定点加权因子来操作神经网络。/n

【技术特征摘要】
20200110 US 16/7394841.一种用于将神经网络的浮点加权因子转换为定点加权因子的方法，所述方法包括：
选择预定数量的候选缩放因子，其是预定基数的倍数；
在成本函数中评估每一个候选缩放因子；
作为候选缩放因子中导致成本函数的最小值的一个来选择缩放因子；
通过使用缩放因子缩放浮点加权因子来生成定点加权因子；以及
使用定点加权因子来操作神经网络。

2.根据权利要求1所述的方法，其中，预定基数是二。

3.根据权利要求1所述的方法，进一步包括：响应于完成神经网络的训练阶段，将定点加权因子提供给推理阶段。

4.根据权利要求1所述的方法，其中，预定数量的候选缩放因子包括更大数量的候选，所述候选具有的值超过浮点加权因子的绝对值的平均值。

5.根据权利要求1所述的方法，其中，预定数量的候选缩放因子包括仅一个小于相关联的浮点加权因子的绝对值的平均值的候选。

6.根据权利要求1所述的方法，其中，成本函数是浮点加权因子与候选缩放因子和对应的定点加权因子的乘积之间的均方误差。

7.根据权利要求1所述的方法，进一步包括：在预定数量的训练间隔之后的神经网络的训练阶段期间更新缩放因子。

8.一种机器学习系统，其包括：
控制器，其被编程为使用缩放因子将神经网络的浮点加权因子转换为定点加权因子，所述缩放因子是预定基数b的倍数，并且使成本函数最小化，所述成本函数是浮点加权因子与候选缩放因子和对应的定点加权因子的乘积之间的均方误差，并且在训练阶段期间的预定数量的迭代之后，改变缩放因子。

9.根据权利要求8所述的机器学习系统，其中，控制器被进一步编程为使用定点操作来实现神经网络。

10.根据权利要求8所述的机器学习系统，其中，候选缩放因子包括：分别具有指数L和L-1的第一和第二候选值，使得浮点加权因子的绝对值的平均值在bL与bL-1之间。

【专利技术属性】
技术研发人员：A·马尔霍特拉，T·罗茨尼克，C·皮特斯，
申请(专利权)人：罗伯特·博世有限公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人