一种用于实现张量链式分解运算的设备和方法技术

技术编号：38430759 阅读：34 留言：0更新日期：2023-08-07 11:27

本发明专利技术涉及一种用于对卷积神经网络的卷积层实现张量链式分解运算的设备。该设备接收包括第一数量的通道的输入数据，并对输入数据执行1x1卷积，以获得多个数据组，其中，所述多个数据组包括第二数量的通道。该设备还对所述多个数据组执行分组卷积，以获得包括第三数量的通道的中间数据。此外，该设备对中间数据执行1x1卷积，以获得包括第四数量的通道的输出数据。数据。数据。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】一种用于实现张量链式分解运算的设备和方法

[0001]本专利技术大体上涉及数据处理领域，尤其涉及卷积神经网络。公开了一种用于对卷积神经网络的卷积层实现张量链式分解运算的设备和方法。例如，该设备和方法可以执行硬件友好的张量链式分解运算，这可以加速卷积神经网络的操作。

技术介绍

[0002]一般来说，深度学习是一种训练神经网络执行任务的机器学习技术。神经网络可以是卷积神经网络。例如，卷积神经网络可以学习如何执行任务，例如，与计算机视觉、自然语言处理、语音识别等相关的分类任务。
[0003]传统的卷积神经网络实现了不同的准确度。此外，希望找到能够实现一定准确度的卷积神经网络来解决特定问题。然而，当使用更深层卷积神经网络时，例如，为了进一步提高准确度，这些卷积神经网络在浮点运算(floating point operation，FLOP)方面可能会变得更慢，并且在用户设备中操作时可能会变得甚至更慢。例如，对于包含具有512个特征图的卷积层的卷积神经网络，计算可能需要多达115次MFLOP运算，因此这些卷积层可能会显著降低推理时间。
[0004]提出了将张量分解作为一种降低计算成本的技术。张量分解技术是一类将高维张量表示为一系列低成本操作的方法，以便减少张量参数的数量并压缩数据。
[0005]传统的张量分解方法可以基于张量链式分解，该分解用于数据压缩，即，降低原始张量大小与压缩大小的比率。
[0006]然而，当传统的张量链式分解应用于卷积神经网络的卷积层时，仍然不能克服上述所有问题。
专...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于对卷积神经网络CNN的卷积层实现张量链式分解运算的设备(100)，其特征在于，所述设备(100)用于：接收包括第一数量的通道的输入数据(110)；对所述输入数据(110)执行1x1卷积，以获得多个数据组(120)，其中，所述多个数据组(120)包括第二数量的通道；对所述多个数据组(120)执行分组卷积，以获得包括第三数量的通道的中间数据(130)；对所述中间数据(130)执行1x1卷积，以获得包括第四数量的通道的输出数据(140)。2.根据权利要求1所述的设备(100)，其特征在于，基于在所述多个数据组(120)之间共享的共享核，执行所述分组卷积。3.根据权利要求1或2所述的设备(100)，其特征在于，基于所述多个数据组(120)中数据组的数量，确定所述第三数量的通道。4.根据权利要求3所述的设备(100)，其特征在于，基于所述设备(100)的一个或多个硬件特性，进一步确定所述第三数量的通道。5.根据权利要求1至4中任一项所述的设备(100)，其特征在于，每个数据组(221、222、223)包括第五数量的通道，基于所述第三数量的通道和所述第五数量的通道，确定所述第二数量的通道。6.根据权利要求1至5中任一项所述的设备(100)，其特征在于，还用于：获得包括第一数量的卷积层的CNN，其中，每个卷积层与相应的第一排序数相关联；基于所述CNN的训练，提供包括第二数量的卷积层和第三数量的分解卷积层的分解CNN；其中，所述第一数量等于所述第二数量和所述第三数量的总和，每个分解卷积层与相应的第二排序数相关联。7.根据权利要求6所述的设备(100)，其特征在于，还用于对于所述CNN的卷积层，确定基于以下内容计算的加权对：加权后的卷积层，其中，所述加权后的卷积层是通过将第一加权可训练参数分配给所述卷积层而获得的；加权后的分解卷积层，其中，所述加权后的分解...

【专利技术属性】
技术研发人员：弗拉基米尔，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人