Systems, methods, and computer media for efficiently implementing convolution neural networks in hardware are disclosed. Memory is configured to store sparse frequency domain representations of convolutive weighted kernels. The time domain to frequency domain converter is configured to generate the frequency domain representation of the input image. The feature extractor is configured to access memory and extracts features by the processor based on the sparse frequency representation of the convolution weighted kernel and the frequency domain representation of the input image. The feature extractor includes the convolution layer and the contigo layer. The classifier is configured to determine whether the input image contains interested objects based on the extracted features. Various types of memory can be used to store different information, thus storing information dense data in faster (for example, faster access time) memory and storing sparse data in slower memory.
【技术实现步骤摘要】
【国外来华专利技术】硬件高效的深度卷积神经网络
技术介绍
神经网络实现了在某种程度上基于动物中枢神经系统的计算方法。神经网络可以用于可以应用机器学习的基于人工智能方法中,这些方法可以用于例如语音识别、图像识别/物体检测和其他领域。神经网络由互连的“神经元”组成,这些神经元基于输入值和阈值进行决策。卷积神经网络是一类神经网络,其通常涉及三个计算阶段:卷积层、全连层和分类器。虽然卷积神经网络与更加局限的基于建模的机器学习方法相比表现良好,但是以硬件实现卷积神经网络导致高能源和计算复杂度成本。例如,卷积层通常涉及高计算复杂度,并且全连层通常涉及高存储器存储成本。这些因素尤其阻碍了卷积神经网络在功率受限设备(诸如可穿戴设备和移动设备)中的实现。
技术实现思路
本文中描述的示例涉及深度卷积神经网络的硬件高效实现。存储器可以被配置为存储卷积加权内核的稀疏频域表示。时域到频域转换器可以被配置为通过处理器生成输入图像的频域表示。输入图像可以是由相机捕获的视频帧或图像。特征提取器可以被配置为访问存储器,并且通过处理器基于卷积加权内核的稀疏频域表示和输入图像的频域表示来提取特征。分类器可以被配置为通过处理器基于提取的特征来确定输入图像是否包含感兴趣对象。在一些示例中,不同存储器类型的多个存储器用于存储不同的信息,从而使得在较快(例如,较快的存取时间)且能耗较高的存储器中存储信息稠密的数据并且在较慢(但是能耗较低)的存储器中存储稀疏数据。例如,可以使用较慢的存储器类型(或较低能耗的存储器类型)来存储卷积加权内核的频域表示的稀疏矩阵,并且可以使用一个或多个较快的存储器类型来存储卷积加权内核的频域表示的稠密矩阵 ...
【技术保护点】
1.一种卷积神经网络系统,包括:一个或多个处理器;存储器,所述存储器被配置为存储卷积加权内核的稀疏频域表示;时域到频域转换器,所述时域到频域转换器被配置为通过所述一个或多个处理器生成输入图像的频域表示;特征提取器,所述特征提取器被配置为通过所述一个或多个处理器:访问所述存储器,以及至少部分基于所述卷积加权内核的所述稀疏频域表示和所述输入图像的所述频域表示来提取多个特征;以及分类器,所述分类器被配置为:由所述一个或多个处理器基于经提取的所述多个特征来确定所述输入图像是否包含感兴趣对象。
【技术特征摘要】
【国外来华专利技术】2015.11.05 US 14/934,0161.一种卷积神经网络系统,包括:一个或多个处理器;存储器,所述存储器被配置为存储卷积加权内核的稀疏频域表示;时域到频域转换器,所述时域到频域转换器被配置为通过所述一个或多个处理器生成输入图像的频域表示;特征提取器,所述特征提取器被配置为通过所述一个或多个处理器:访问所述存储器,以及至少部分基于所述卷积加权内核的所述稀疏频域表示和所述输入图像的所述频域表示来提取多个特征;以及分类器,所述分类器被配置为:由所述一个或多个处理器基于经提取的所述多个特征来确定所述输入图像是否包含感兴趣对象。2.根据权利要求1所述的系统,其中所述特征提取器包括多个卷积层和多个全连层。3.根据权利要求2所述的系统,其中所述存储器是第一存储器类型的第一存储器,并且所述系统还包括第二存储器,所述第二存储器被配置为存储所述多个全连层的系数,其中所述第二存储器是第二存储器类型,并且其中所述第一存储器类型具有比所述第二存储器类型的存取时间或能耗更慢的存取时间或更低的能耗。4.根据权利要求3所述的系统,其中所述第一存储器类型是DRAM,并且其中所述第二存储器类型是SRAM。5.根据权利要求3所述的系统,还包括第三存储器,所述第三存储器被配置为存储输入图像系数,其中所述第三存储器是第三存储器类型,并且具有在所述第一存储器类型的所述存取时间或能耗与所述第二存储器类型的所述存取时间或能耗之间的存取时间或能耗。6.根据权利要求2所述的系统,其中所述卷积加权内核的稀疏频域表示包括稠密矩阵和一个或多个稀疏矩阵,并且其中所述多个卷积层中的第一卷积层被配置为:将所述输入图像的所述频域表示与所述一个或多个稀疏矩阵相乘,并且对所述相乘的结果应用非线性函数。7.根据权利要求6所述的系统,其中所述非线性函数是频域函数。8.根据权利要求6所述的系统,其中所述多个卷积层中的第二卷积层被配置为:将所述第一卷积层的频域输出与所述一个或多个稀疏矩阵相乘,并且对所述相乘的结果应用非线性函数。9.根据权利要求2所述的系统,其中所述卷积加...
【专利技术属性】
技术研发人员:M·肖艾布,刘劼,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。