适应处理器以处理大量不同的数据格式,包括从第一存储装置载入第一格式的数据字;在它到达运算单元之前,将第一格式的数据字重新排序为与运算单元的自然顺序相容的第二格式;以及向量处理运算单元中的数据字。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种在存储装置和运算单元之间实现的可置换地址模式处理器及方法。
技术介绍
早先的计算机或处理器仅仅具有一个计算单元,因此,例如在一个像素具有八位(字节)时每次进行一个像素的图像处理。随着图像尺寸的不断增长,出现了对于高性能高密度流水线的向量处理处理器的需要。向量处理器是可以在一个指令中在整个向量上操作的处理器。单指令多数据(SIMD)是面向向量的处理的另一形式,面向向量的处理可以在像素级应用并行。该方法适合于不依赖于前一操作结果的图像操作。由于SIMD处理器可以在不同的数据组上并行解决类似的问题,因此它可以被表征为比单个计算单元处理器快n倍,这里n是SIMD中的计算单元的数目。对于SIMD操作,存储器读取必须每个周期将数据给到每个计算单元或利用n速度的优点。典型地,例如,在32位(四个字节)机器中,在来自存储器的两条总线上载入数据到两个32位(四个字节)寄存器中的行中,该字节处于四个相邻的列中,每个字节具有与其相关的计算单元。然后,在一个周期中,单个指令可以指示所有计算单元以其自然(native)模式对寄存器字节中的数据逐字节地执行相同的操作,并在存储器中存储该32位结果。在2D图像处理应用中,例如,其对于垂直边缘过滤具有很好的效果。但是对于在列中存储数据的水平边缘过滤来说,在可以开始操作之前,必须加载所有的寄存器,以及在完成之后,不得不每次一个字节地存储结果。这是费时且低效的,以及随着计算单元数码的增加而变得更加严重。在适应“小字节序”(little endian)和“大字节序”(big endian)-->数据类型时,SIMD或向量处理机器也遇到问题。“小字节序”和“大字节序”涉及的是多字节类型中哪些字节是最高有效位,并描述在处理器存储器中存储字节序列的顺序。在小字节序的系统中,在最低的存储器地址(第一),存储该序列中的最低有效字节。“大字节序”相反:它在最低存储器地址存储中存储该序列中的最有效字节。当前,系统对从用户界面到操作系统到加密到低层信号处理的所有层级提供服务。这些导致“混合字节序”应用,因为通常较高层级的用户界面和操作系统使用“小字节序”,而信号处理和加密使用“大字节序”。因此在处理数据之前,程序员必须提供指令以从一种变换为另一种,或配置该处理,以利用它给出的数据形式来工作。SIMD操作中遇到的另一问题是,该数据为了算法中的下一个步骤而实际上已被扩展或调换或置换。在该数据处于由算法中的下一步骤调用的格式之前,这需要单独的步骤,涉及到流水线停滞。
技术实现思路
因此,本专利技术的目的是提供一种具有可置换地址模式的改进的处理器和方法。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,其提高诸如SIMD的面向向量的处理器的效率。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,在运算单元之外在地址模式中实现置换,由此避免管线停滞。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,其可以统一数据表现(presentation),由此统一问题的解决方案,减小编程工作和投放市场的时间。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,可以统一数据表现,由此统一问题的解决方案,利用更多算术单元和更快的存储结果。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处-->理器和方法,可以在负载上置换该数据,以其自然的形式有效地利用算术单元,并随后在存储时置换回其初始形式,使得负载、解决方案和存储操作更快和更有效。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,容易适合于混合字节序模式。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,能够快速、容易和有效地重新排序计算操作之间的数据。本专利技术的再一目的是提供具有可置换地址模式的这种改进的处理器和方法,为了快速、容易的处理,能够使任意形式的数据重新排序为机器的自然域(domain)形式,然后如果希望,重新排序回其初始形式。本专利技术源于如下认识,通过从存储装置加载数据字,并在它到达运算单元之前将它重新排序为与面向向量的运算单元的自然顺序相容的格式,以及对该运算单元中的数据字进行向量处理,处理器和方法可以处理大量不同的数据格式。参见美国专利号5,961,628,Nguyen等人的名称为LOAD AND STORE UNIT FOR A VECTORPROCESSOR,和VECTOR VS.SUPERSCALAR AND VLIWARCHITECTURES FOR EMBEDDED MULTIMEDLABENCHMARKS,作者Christoforos Kozyrakis和David Patterson,在the Proceedingsof the 35th International SymposiumonMicroarchitecture,Istanbul,Turkey,November 2002,11 pages,在此通过这些参考文献将其全部引入。但是,在其他实施例中,该主题专利技术不必实现所有这些目的,以及由此权利要求不应该限于能实现这些目的的结构或方法。本专利技术的特点在于具有可置换地址模式的处理器,包括具有寄存器堆的运算单元。互连寄存器堆与存储装置的至少一个加载总线和至少一个存储总线。以及至少一个总线中的置换电路,用于重新排序在该寄存器堆和存储装置之间传送的字的数据元。在优选实施例中,该加载和存储总线可以包括置换电路。可以有-->两个加载总线,其每一个可以包括置换电路。该置换电路可以包括用于重新排序在该寄存器堆和存储装置之间传送的字的数据元和/或调换电路,用于重新排序在该寄存器堆和存储装置之间传送的字的数据元。该寄存器堆可以包括至少一个寄存器。该映射电路可以包括至少一个映射寄存器。该映射寄存器可以包括用于每个数据元的字段。该映射寄存器可以从运算单元加载。该映射寄存器可以用大字节序、小字节序映射缺省地加载。该数据元可以是字节。本专利技术的特点使处理器适应于处理大量不同的数据格式的方法,包括从存储装置加载具有字的数据寄存器,在它到达运算单元数据寄存器堆之前将它重新排序为与面向向量的运算单元的自然顺序相容的第二格式,以及向量处理所述运算单元中的数据寄存器。在优选实施例中,该向量处理的结果可以被存储在第二数据寄存器装置中。该存储结果可以被重新排序为第一格式。该第二存储装置和第一存储装置可以被包括在相同的存储器中。附图说明从优选实施例的以下描述和附图,所属领域的技术人员将想到其他目的、特点和优点,其中:图1是根据本专利技术具有可置换地址模式的处理器的示意性框图;图2是图1的处理器的更详细的视图;图3是根据本专利技术的大字节序载入映射的示意图;图4是根据本专利技术的小字节序载入映射的示意图;图5是根据本专利技术的另一载入映射的示意图;图6是根据本专利技术的存储映射的示意图;图7是根据本专利技术的调换的示意图;图8A-C图示了本专利技术对于图像边缘过滤的应用;图9是根据本专利技术的映射电路的更详细示意图;图10是根据本专利技术的调换电路的更详细示意图;以及图11是根据本专利技术的方法的流程图。-->具体实施方式除了下面公开的优选实施例或实施例以外,本专利技术可以是其他实施例和能够用多种方式实施或进行。因此本文档来自技高网...
【技术保护点】
一种具有可置换地址模式的处理器,包括: 包括寄存器堆的运算单元; 互连所述寄存器堆与存储装置的至少一条加载总线和至少一条存储总线;以及 至少一条所述总线中的置换电路,用于重新排序在所述寄存器堆和存储装置之间传送的字的数据元。
【技术特征摘要】
【国外来华专利技术】US 2006-3-6 11/368,8791、一种具有可置换地址模式的处理器,包括:包括寄存器堆的运算单元;互连所述寄存器堆与存储装置的至少一条加载总线和至少一条存储总线;以及至少一条所述总线中的置换电路,用于重新排序在所述寄存器堆和存储装置之间传送的字的数据元。2.如权利要求1的处理器,其中每个所述加载和存储总线包括所述置换电路。3.如权利要求1的处理器,其中存在两条加载总线,以及其每一个都包括置换电路。4.如权利要求1的处理器,其中所述置换电路包括映射电路,用于重新排序在所述寄存器堆和存储装置之间传送的字的数据元。5.如权利要求1的处理器,其中所述置换电路包括调换电路,所述调换电路用于重新排序在所述寄存器堆和存储装置之间传送的字的数据元。6.如权利要求4的处理器,其中所述寄存器单元包括至少一个寄存器。7.如权利要求5的处理器,其中所述寄存器堆包括至少一个寄...
【专利技术属性】
技术研发人员:J威尔逊,JA卡布罗特斯基,Y斯坦恩,CJ普伦德加斯特,GM尤克纳,CM梅尔,JA海登,
申请(专利权)人:阿纳洛格装置公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。