【技术实现步骤摘要】
本专利技术涉及一种处理器,特别涉及一种提升人工神经网络的运算效能与效率的处理器。本申请案主张下列的美国临时申请案的国际优先权。这些优先权案的全文并入本案以供参考。本申请案关联于下列同时提出申请的美国申请案。这些关联申请案的全文并入本案以供参考。
技术介绍
近年来,人工神经网络(artificialneuralnetworks,ANN)重新吸引了人们的注意。这些研究通常被称为深度学习(deeplearning)、计算机学习(computerlearning)等类似术语。通用处理器运算能力的提升也推升了人们在数十年后的现在对于人工神经网络的兴趣。人工神经网络近期的应用包括语言与影像辨识等。对于提升人工神经网络的运算效能与效率的需求似乎正在增加。
技术实现思路
有鉴于此,本专利技术提供一种处理器。此处理器包括多个功能单元与一执行单元。其中,多个功能单元用以攫取与译码一架构程序的架构指令,此架构指令属于处理器的一架构指令集。执行单元包括一第一存储器,一第二存储器,多个处理单元与一缓存器。其中,第一存储器用以装载数据,第一存储器以列配置,各列具有一地址。第二存储器用以装载一非架构程序的非架构指令,此非架构指令属于一个不同于前述架构指令集的非架构指令集。多个处理单元用以执行非架构程序指令,从第一存储器读取数据,对来自第一存储器的数据执行运算以产生结果,以及将结果写入第一存储器。缓存器用以装载指示非架构程序执行进度的信息。其中,第一存储器并可由架构程序进行读取与写入。其中,缓存器内的信息可由架构程序读取而使架构程序能够使用此信息以决定对第一存储器写入数据的列地址或是从第一 ...
【技术保护点】
一种处理器,其特征在于,包括:多个功能单元,用以攫取与译码一架构程序的架构指令,该架构指令属于该处理器的一架构指令集;以及一执行单元,包括:一第一存储器,用以装载数据,该第一存储器以列配置,各该列具有一地址;一第二存储器,用以装载一非架构程序的非架构指令,该非架构指令属于一个不同于该架构指令集的非架构指令集;多个处理单元,用以执行该非架构程序指令从该第一存储器读取数据,对来自该第一存储器的该数据执行运算以产生结果,以及将该结果写入该第一存储器;以及一缓存器,用以装载指示该非架构程序执行进度的信息;其中,该第一存储器并可由该架构程序进行读取与写入;其中,该缓存器内的该信息可由该架构程序读取而使该架构程序能够使用该信息以决定对该第一存储器写入数据的该列地址或是从该第一存储器读取数据的该列地址。
【技术特征摘要】
2015.10.08 US 62/239,254;2015.12.02 US 62/262,104;1.一种处理器,其特征在于,包括:多个功能单元,用以攫取与译码一架构程序的架构指令,该架构指令属于该处理器的一架构指令集;以及一执行单元,包括:一第一存储器,用以装载数据,该第一存储器以列配置,各该列具有一地址;一第二存储器,用以装载一非架构程序的非架构指令,该非架构指令属于一个不同于该架构指令集的非架构指令集;多个处理单元,用以执行该非架构程序指令从该第一存储器读取数据,对来自该第一存储器的该数据执行运算以产生结果,以及将该结果写入该第一存储器;以及一缓存器,用以装载指示该非架构程序执行进度的信息;其中,该第一存储器并可由该架构程序进行读取与写入;其中,该缓存器内的该信息可由该架构程序读取而使该架构程序能够使用该信息以决定对该第一存储器写入数据的该列地址或是从该第一存储器读取数据的该列地址。2.根据权利要求1所述的处理器,其特征在于,装载于该缓存器的该信息包括该第一存储器中该非架构程序最近写入的一列地址。3.根据权利要求1所述的处理器,其特征在于,装载于该缓存器的该信息包括该第一存储器中该非架构程序最近读取的一列地址。4.根据权利要求1所述的处理器,其特征在于,该执行单元还包括一第三存储器,用以装载数据,该第三存储器以列配置,各该列具有一地址,该第三存储器可由该多个处理单元与该架构程序进行读取与写入,并且,装载于该缓存器的该信息包括该第三存储器中该非架构程序最近写入的一列地址。5.根据权利要求1所述的处理器,其特征在于,该执行单元还包括一第三存储器,用以装载数据,该第三存储器以列配置,各该列具有一地址,该第三存储器可由该多个处理单元与该架构程序进行读取与写入,并且,装载于该缓存器的该信息包括该第三存储器中该非架构程序最近读取的一列地址。6.根据权利要求1所述的处理器,其特征在于,还包括:一程序计数器,指定当前攫取以供该多个执行单元执行使用的该非架构程序的一非架构指令所在的该第二存储器的一地址;其中,装载于该缓存器的该信息包括该程序计数器的一数值。7.根据权利要求1所述的处理器,其特征在于,还包括:一循环计数器,其数值指示该非架构程序的一循环还会执行的次数;其中,该缓存器装载的该信息包括该循环计数器的该数值。8.根据权利要求1所述的处理器,其特征在于,该非架构指令集包括一非架构指令,对从该第一存储器读取的该数据执行一指定次数的运算;其中,该执行单元还包括一迭代次数计数器,其数值指示该非架构指令指定的该运算还会执行的次数,并且,该缓存器装载的该信息包括该迭代次数计数器的该数值。9.根据权利要求1所述的处理器,其特征在于,还包括:多个架构缓存器,可由该架构指令集的架构指令进行存取;其中,该缓存器内装载的该信息可由该架构程序读入该些架构缓存器。10.根据权利要求1所述的处理器,其特征在于,还包括:多个架构缓存器,可由该架构指令集的架构指令进行存取;其中,该处理器用以因应该架构指令集的一架构指令的执行,将数据于该些架构缓存器与该第一存储器间进行传递。11.根据权利要求1所述的处理器,其特征在于,该第二存储器内可透过该架构指令集的一架构指令的执行写入该非架构指令。12.根据权利要求1所述的处理器,其特征在于,还包括:一定序器,从该第二存储器攫取该非架构程序指令并将其译码以产生控制文字以控制该多个处理单元执行该非架构程序指令。13.根据权利要求12所述的处理器,其特征在于,该定序器更新该缓存器内的该信息。14.根据权利要求1所述的处理器,其特征在于,该多个处理单元用以对从该第一存储器接收的该数据执行算术运算以累加数值并对该数值执行启动函数以产生写入该第一存储器的该结果。15.根据权利要求1所述的处理器,其特征在于,该多个处理...
【专利技术属性】
技术研发人员:G·葛兰·亨利,泰瑞·派克斯,
申请(专利权)人:上海兆芯集成电路有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。