面向深度概率网络的高效量化方法技术

技术编号：37048394 阅读：11 留言：0更新日期：2023-03-29 19:26

本发明专利技术涉及一种面向深度概率网络的高效量化方法，通过混合量化、结构重构和类型优化来实现深度概率网络的高效量化。首先，针对有向无环图结构将图的各个节点进行聚类并根据聚类类别特点分配不同精度的算数类型，利用分配的算数类型对各个节点进行初步的量化，获得初步量化的深度概率网络；其次，对初步量化的深度概率网络进行多输入节点的结构重构，根据输入的权重将多输入节点的重构为一个只包含两输入节点的二叉树网络，对重构结构进行权重参数重构；最后，基于功耗分析和网络精度分析的算数类型搜索方法，来优化所有节点的算数类型。方法能够在维持深度概率网络的模型精度的前提条件下，大幅度减小模型计算量、降低计算复杂度、节省系统能耗。节省系统能耗。节省系统能耗。

全部详细技术资料下载

【技术实现步骤摘要】
with High
‑
Level Synthesis[C]ACM Transactions on Reconfigurable Technology and Systems(TRETS)(2022).

技术实现思路

[0010]针对深度概率网络在边缘设备上的部署问题，提出了一种面向深度概率网络的高效量化方法。
[0011]本专利技术的技术方案为：一种面向深度概率网络的高效量化方法，具体包括如下步骤：
[0012]1)针对深度概率网络结构为有向无环图，将图的各个节点进行聚类，获得各个群簇，并根据各个群簇聚类类别特点分配不同精度的算数类型，利用分配的算数类型对各个节点进行初步的量化，获得初步量化的深度概率网络；
[0013]2)对初步量化的深度概率网络进行多输入节点的结构重构，即根据输入的权重将多输入节点的重构为一个只包含两输入节点的二叉树网络，实现各个群簇的分支聚类重构；重构后的二叉树网络调整权重参数，实现参数重构；
[0014]3)使用基于优化策略的算数类型搜索方法，对量化方案进行优化。
[0015]进一步，所述步骤1)具体实现方法：
[0016]1.1)按照网络中各个节点的深度，对所有节点进行分层，将整个网络划分为若干个群簇；
[0017]1.2)按照双精度浮点的算数类型，使用数据集数据执行模型的推理，并记录网络中所有群簇的数据动态范围，然后对各个群簇的数据分布进行统计分析；
[0018]1.3)根据群簇整体的数据范围和各个节点各自的数据范围，动态调整各个节点...

【技术保护点】

【技术特征摘要】
1.一种面向深度概率网络的高效量化方法，其特征在于，具体包括如下步骤：1)针对深度概率网络结构为有向无环图，将图的各个节点进行聚类，获得各个群簇，并根据各个群簇聚类类别特点分配不同精度的算数类型，利用分配的算数类型对各个节点进行初步的量化，获得初步量化的深度概率网络；2)对初步量化的深度概率网络进行多输入节点的结构重构，即根据输入的权重将多输入节点的重构为一个只包含两输入节点的二叉树网络，实现各个群簇的分支聚类重构；重构后的二叉树网络调整权重参数，实现参数重构；3)使用基于优化策略的算数类型搜索方法，对量化方案进行优化。2.根据权利要求1所述面向深度概率网络的高效量化方法，其特征在于，所述步骤1)具体实现方法：1.1)按照网络中各个节点的深度，对所有节点进行分层，将整个网络划分为若干个群簇；1.2)按照双精度浮点的算数类型，使用数据集数据执行模型的推理，并记录网络中所有群簇的数据动态范围，然后对各个群簇的数据分布进行统计分析；1.3)根据群簇整体的数据范围和各个节点各自的数据范围，动态调整各个节点的群簇所属关系，缩小各个群簇的数据分布范围；1.4)根据各个群簇调整后的数据分布特征，为其指定合适的算数类型；1.5)根据所指定的算数类型，对各个节点进行初步的量化。3.根据权利要求2所述面向深度概率网络的高效量化方法，其特征在于，所述步骤2)具体实现方法：2.1)对多输入节点的各个输入分支的权重大小取以二为底的对数并将结果向下取整，然后根据该指标将输入分支划分为多个群簇，并将该指标...

【专利技术属性】
技术研发人员：张申，刘心哲，哈亚军，
申请(专利权)人：上海科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人