一种深度神经网络处理装置、解压缩方法及压缩方法制造方法及图纸

技术编号：38911752 阅读：42 留言：0更新日期：2023-09-25 09:28

本发明专利技术涉及一种深度神经网络处理装置、解压缩方法及压缩方法，该深度神经网络处理装置包括：储存模组，用来储存多个二元码、编码树、零点值及尺度；解压缩模组，耦接于储存模组，用来根据多个二元码、编码树及零点值，产生量化权重阵列，其中根据对齐的量化权重阵列及零点值，量化权重阵列被产生；以及深度神经网络处理模组，耦接于解压缩模组，用来根据量化权重阵列及尺度，处理输入讯号。本发明专利技术可实现在嵌入式系统领域中的深度学习技术的模型精度、计算负担及记忆体需求之间的平衡。算负担及记忆体需求之间的平衡。算负担及记忆体需求之间的平衡。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度神经网络处理装置、解压缩方法及压缩方法
[0001]本申请要求在2022年03月10日提交中国专利局、申请号为US 17/691,145、申请名称为“具有解压缩模组的深度神经网络处理装置、解压缩方法及压缩方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

[0002]本专利技术相关于一种用于嵌入式系统的装置及方法，尤其涉及用于在嵌入式系统中的一种深度神经网络处理装置、解压缩方法及压缩方法。

技术介绍

[0003]随着深度学习技术的发展，人工智慧(artificial intelligence，AI)的性能，尤其是在与感知及预测相关的任务中，已大幅地超越现有技术。然而，因为深度学习技术的主要产品是包含有大量(例如百万)权重的深度神经网络模型，沉重的计算负担及高的记忆体需求被需要以实现高的模型精度，其限制了在嵌入式系统领域中的深度学习技术的发展。因此，如何在嵌入式系统领域中的深度学习技术的模型精度、计算负担及记忆体需求之间取得平衡，是一个亟待解决的问题。

技术实现思路

[0004]本专利技术提供了一种深度神经网络处理装置、解压缩方法及压缩方法，在不牺牲深度神经网络模型的性能的情况下，降低沉重的计算负担及高的记忆体需求，以及维持模型精度，以解决上述问题。
[0005]本专利技术揭露一种具有解压缩(decompressing)模组的深度神经网络DNN处理装置，包括：储存模组，用来储存多个二元码(binary code)、编码树(coding tree)、零点值(zero<...

【技术保护点】

【技术特征摘要】
1.一种具有解压缩(decompressing)模组的深度神经网络(deep neural network)处理装置，其特征在于，包括：储存模组，用来储存多个二元码(binary code)、编码树(coding tree)、零点值(zero
‑
point value)及尺度(scale)；所述解压缩模组，耦接于所述储存模组，用来根据所述多个二元码、所述编码树及所述零点值，产生量化权重阵列(quantized weight array)，其中根据对齐的(aligned)量化权重阵列及所述零点值，所述量化权重阵列被产生；以及深度神经网络处理模组，耦接于所述解压缩模组，用来根据所述量化权重阵列及所述尺度，处理输入讯号。2.根据权利要求1所述的深度神经网络处理装置，其特征在于，所述深度神经网络处理模组被设定为人工智慧(artificial intelligence)引擎，以将所述输入讯号转换为所需资讯，其中所述输入讯号从感测器被获得。3.根据权利要求1所述的深度神经网络处理装置，其特征在于，还包括：控制模组，耦接于所述储存模组，用来执行在所述储存模组中储存的多个指令，以控制所述解压缩模组及所述深度神经网络处理模组。4.根据权利要求1所述的深度神经网络处理装置，其特征在于，所述解压缩模组还包括：接收电路，用来接收所述多个二元码、所述编码树、所述零点值及所述尺度；解码(decoding)电路，耦接于所述接收电路，用来根据所述多个二元码及所述编码树，产生所述对齐的量化权重阵列；以及去对齐(de
‑
alignment)电路，耦接于所述接收电路及所述解码电路，用来根据所述对齐的量化权重阵列及所述零点值，产生所述量化权重阵列。5.根据权利要求4所述的深度神经网络处理装置，其特征在于，根据所述编码树，所述解码电路解码所述多个二元码，以产生所述对齐的量化权重阵列。6.根据权利要求4所述的深度神经网络处理装置，其特征在于，所述去对齐电路将所述零点值加到所述对齐的量化权重阵列，以产生所述量化权重阵列。7.根据权利要求1所述的深度神经网络处理装置，其特征在于，所述量化权重阵列包含有在8位元整数的范围中具有第一多个数值的第一多个参数。8.根据权利要求7所述的深度神经网络处理装置，其特征在于，所述第一多个参数对应于在实数的范围中具有第二多个数值的第二多个参数。9.根据权利要求8所述的深度神经网络处理装置，其特征在于，所述零点值包含有在所述第二多个数值中的数值0映射的在所述第一多个数值中的第三数值。10.根据权利要求1所述的深度神经网络处理装置，其特征在于，所述编码树包含有霍夫曼树(Huffman tree)，或者所述尺度包含有正实数。11.一种解压缩(decompressing)方法，其特征在于，包括：接收多个二元码(binary code)、编码树(coding tree)、零点值(zero
‑
point value)及尺度(scale)；根据所述多个二元码及所述编码树，产生对齐的(aligned)量化权重阵列(quantized weight array)；
根据所述对...

【专利技术属性】
技术研发人员：黄浚锋，刘镕瑄，林昭文，
申请(专利权)人：聚晶半导体股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人