数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：29791936 阅读：35 留言：0更新日期：2021-08-24 18:11

本公开涉及数据处理方法、装置、计算机设备和存储介质，可以对神经网络进行训练，在训练的过程中，对输入数据、输出数据、权值、权值梯度进行与量化相关的处理时，利用参数服务器实现了权值的更新、权值量化参数的计算、对权值进行量化、量化后权值分别进行数据布局，而后将权值量化参数、所述前向量化后权值和所述反向量化后权值广播至所述多个工作节点，利用工作节点实现其他处理过程，对参数服务器和工作节点所进行的处理进行了合理的划分，减少了处理过程中装置进行权值量化、数据布局的计算次数，减少了计算开销、传输带宽、访存量、通讯量，降低了装置的能耗。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质
本公开涉及计算机
，特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展，神经网络neuralnetwork，NN)的应用越来越广泛，其被应用于图像处理、视频处理、语音识别等数据处理中。神经网络通过样本数据的训练，不断修正网络权值和阈值使误差函数沿负梯度方向下降，逼近期望输出。它是一种应用较为广泛的识别分类模型，多用于函数逼近、模型识别分类、数据压缩和时间序列预测等。神经网络被应用到图像识别、语音识别、自然语言处理等领域中，然而，随着神经网络复杂度提高，数据的数据量和数据维度都在不断增大，不断增大的数据量等对运算装置的数据处理效率、存储装置的存储容量及访存效率等提出了较大的挑战。相关技术中，采用固定位宽对神经网络的运算数据进行量化，即将浮点型的运算数据转换为定点型的运算数据，以实现神经网络的运算数据的压缩，但相关技术中进行量化所占用的计算开销、传输带宽大、访存量高、通讯量大、浪费装置的能耗。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够解决上述技术问题数据处理方法、装置、计算机设备和存储介质。根据本公开的一方面，提供了一种数据处理装置，用于对神经网络进行训练，所述神经网络包括多个神经网络层，所述装置包括参数服务器和多个工作节点，其中，所述参数服务器用于接收每个工作节点发送的对应当前神经网络层的权值梯度，并根据多个权值梯度和权值更新算子对所述当前神经网络层的权值进行更新，得到更新后权值；...

【技术保护点】
1.一种数据处理装置，其特征在于，用于对神经网络进行训练，所述神经网络包括多个神经网络层，所述装置包括参数服务器和多个工作节点，其中，所述参数服务器用于/n接收每个工作节点发送的对应当前神经网络层的权值梯度，并根据多个权值梯度和权值更新算子对所述当前神经网络层的权值进行更新，得到更新后权值；/n根据权值参数算子和所述更新后权值进行量化参数计算，得到对应的权值量化参数；/n根据确定的权值量化参数和权值量化算子对所述更新后权值进行量化处理，得到量化后权值；/n利用前向布局算子和反向布局算子对所述量化后权值分别进行数据布局处理，得到前向量化后权值和反向量化后权值；/n将所述权值量化参数、所述前向量化后权值和所述反向量化后权值，广播至所述多个工作节点，以使目标工作节点能够根据接收到的数据进行对应的数据处理操作，所述目标工作节点为所述多个工作节点中的任意一个。/n

【技术特征摘要】
1.一种数据处理装置，其特征在于，用于对神经网络进行训练，所述神经网络包括多个神经网络层，所述装置包括参数服务器和多个工作节点，其中，所述参数服务器用于
接收每个工作节点发送的对应当前神经网络层的权值梯度，并根据多个权值梯度和权值更新算子对所述当前神经网络层的权值进行更新，得到更新后权值；
根据权值参数算子和所述更新后权值进行量化参数计算，得到对应的权值量化参数；
根据确定的权值量化参数和权值量化算子对所述更新后权值进行量化处理，得到量化后权值；
利用前向布局算子和反向布局算子对所述量化后权值分别进行数据布局处理，得到前向量化后权值和反向量化后权值；
将所述权值量化参数、所述前向量化后权值和所述反向量化后权值，广播至所述多个工作节点，以使目标工作节点能够根据接收到的数据进行对应的数据处理操作，所述目标工作节点为所述多个工作节点中的任意一个。

2.根据权利要求1所述的装置，其特征在于，
所述目标工作节点，用于根据接收到的所述权值量化参数、所述前向量化后权值、量化后输入数据、输入数据量化参数和前向卷积网络算子进行卷积前向运算，得到对应所述当前神经网络层的输出数据。

3.根据权利要求2所述的装置，其特征在于，
所述目标工作节点，还用于在所述当前神经网络层为所述神经网络的最后一层时，根据预设的目标输出数据确定所述输出数据的误差，以使所述装置根据所述误差判断是否满足训练结束条件。

4.根据权利要求1所述的装置，其特征在于，
所述目标工作节点，用于根据输入数据和输入数据参数算子进行量化参数计算，得到输入数据量化参数；
根据确定的输入数据量化参数和输入数据量化算子对输入数据进行量化处理，得到量化后输入数据。

5.根据权利要求2所述的装置，其特征在于，
所述目标工作节点，用于对所述输出数据进行误差运算，得到所述输出数据的输出数据梯度。

6.根据权利要求5所述的装置，其特征在于，
所述目标工作节点，还用于根据所述输出数据梯度和输出数据梯度参数算子进行量化参数计算，得到输出数据梯度量化参数；
根据确定的输出数据梯度量化参数和输出数据梯度量化算子对所述输出数据梯度进行量化处理，得到量化后输出数据梯度。

7.根据权利要求6所述的装置，其特征在于，
所述目标工作节点，还用于根据所述量化后输出数据梯度、所述输出数据梯度量化参数、所述量化后输入数据、所述输入数据量化参数和权值梯度算子进行权值梯度运算，得到对应所述当前神经网络层的新的权值梯度，并将所述新的权值梯度发送至所述参数服务器。

8.根据权利要求6所述的装置，其特征在于，
所述目标工作节点，还用于根据所述量化后输出数据梯度、所述输出数据量化参数、所述反向量化后权...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：中科寒武纪科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人