基于封装内查找表的可编程处理器制造技术

技术编号:16557044 阅读:41 留言:0更新日期:2017-11-14 16:41
为实现计算的编程,本发明专利技术提出一种基于封装内查找表的可编程处理器。它含有一逻辑芯片和一可编程存储芯片,它们位于同一封装中。可编程存储芯片含有一查找表电路(LUT),逻辑芯片含有一算术逻辑电路(ALC)。根据用户需求,LUT存储所需函数的相关数据。ALC对该函数相关数据进行算术运算。

Programmable processor based on internal look up table

In order to realize the programming of calculation, this paper proposes a programmable processor based on the built-in look-up table. It contains a logic chip and a programmable memory chip, which are located in the same package. The programmable memory chip contains a look-up table circuit (LUT), and the logic chip contains an arithmetic logic circuit (ALC). According to user requirements, LUT stores the data required for the function. ALC performs arithmetic operations on the related data of the function.

【技术实现步骤摘要】
基于封装内查找表的可编程处理器
本专利技术涉及集成电路领域,更确切地说,涉及处理器。
技术介绍
传统处理器采用基于逻辑的计算(logic-basedcomputation,简称为LBC),它主要通过逻辑电路(如与非门等)来计算。逻辑电路适合实现算术运算(如加法、减法和乘法),但对于非算术函数(如初等函数、特殊函数等)无能为力。非算术函数的高速高效实现面临巨大的挑战。在传统处理器中,仅少量基本非算术函数(如基本代数函数、基本超越函数)能通过硬件直接实现,这些函数被称为内置函数(built-infunctions)。内置函数一般通过算术运算和查找表的组合来实现。实现内置函数的例子很多,例如:美国专利US5,954,787(专利技术人:Eun;授权日:1999年9月21日)披露了一种利用查找表实现正弦/余弦(sine/cosine)函数的方法;美国专利US9,207,910(专利技术人:Azadet;授权日:2015年12月8日)披露了一种利用查找表实现幂函数的方法。图1A具体描述了内置函数的一种实现方法。传统处理器00X通常含有逻辑电路100X和存储电路200X。逻辑电路100X含有算术逻辑单元(ALU),它用于实现算术运算。存储电路200X含有查找表电路(LUT)。为了达到足够的计算精度,需将代表内置函数的多项式展开到足够高的阶数。这时,LUT200X存储多项式系数,ALU100X计算相应的多项式。由于ALU100X和LUT200X并肩排列在同一平面上(均形成在衬底00S中),这种集成是一种二维集成。二维集成对处理器的制造工艺要求较高。存储电路200X由存储晶体管构成,逻辑电路100X由逻辑晶体管构成。熟悉本专业的人士都知道,存储晶体管和逻辑晶体管的性能指标有很大不同。比如说,存储晶体管更注重降低漏电流,而逻辑晶体管更注重增加导通电流。在同一衬底上00S的同一表面上同时形成高性能的存储晶体管和逻辑晶体管对于制造工艺来说是一种挑战。二维集成还会限制计算密度和计算复杂度的进一步发展。计算正向更高的计算密度和更大的计算复杂度发展。计算密度是指单位芯片面积的计算能力(如每秒的浮点数运算次数),它是平行计算的一个重要指标。计算复杂度是指内置函数的种类和数量,它是科学计算的一个重要指标。由于采用二维集成,LUT200X的存在将增加传统处理器00X的芯片面积,降低其计算密度,这对平行计算不利。同时,在传统处理器00X的设计过程中,由于ALU100X是传统处理器00X的核心部件并占用了大部分芯片面积,故LUT200X能利用的芯片面积有限。因此,传统处理器00X仅支持少量内置函数。图1B列出英特尔公司的Itanium处理器(IA-64)能实现的所有内置超越函数(参考Harrison等所著《TheComputationofTranscendentalFunctionsontheIA-64Architecture》,IntelTechnicalJournal,Q4,1999年)。IA-64处理器共支持7种超越函数,每种超越函数使用了相对较小的查找表(从0到24kb),并需要进行相对较多的泰勒级数(5阶到22阶)计算。基于LBC的处理器00X有一个缺陷。由于实现不同内置函数使用的逻辑电路完全不同,处理器00X是完全定制的,不能通用。换句话说,一旦处理器00X的设计完成,它只能实现一套预先定义的内置函数。很明显,用户希望用同一硬件实现不同计算,即实现计算的编程。这可以从现场可编程门阵列(FPGA)中得到启发。FPGA能实现逻辑的编程。美国专利4,870,302(专利技术人:Freeman;授权日:1989年9月26日)披露了一种FPGA。它含有多个可编程逻辑单元(configurablelogicelement)和可编程连接(configurableinterconnect)。目前,FPGA只能实现逻辑的编程,即同一硬件在设置信号控制下选择性地实现不同的逻辑。遗憾的是,FPGA尚无法实现计算的编程,即同一硬件在设置信号控制下选择性地实现不同的计算(即实现不同的函数)。
技术实现思路
本专利技术的主要目的是实现计算的编程。本专利技术的另一目的是实现计算的现场编程。本专利技术的另一目的是实现可重构计算。本专利技术的主要目的是实现多变量函数的编程。本专利技术的另一目的是提供一种能实现更高计算复杂度的可编程处理器。本专利技术的另一目的是提供一种能实现更高计算密度的可编程处理器。本专利技术的另一目的是提供一种计算能力更灵活、更强大的现场可编程门阵列。为了实现这些以及别的目的,本专利技术提出一种基于封装内查找表(in-packageLUT,简称为IP-LUT)的可编程处理器(IP-LUT可编程处理器)。IP-LUT可编程处理器含有至少一逻辑芯片和一可编程存储芯片。其中,逻辑芯片含有至少一算术逻辑电路(arithmeticlogiccircuit,简称为ALC),故逻辑芯片又被称为ALC芯片;可编程存储芯片含有至少一查找表电路(look-uptablecircuit,简称为LUT),故存储芯片又被称为LUT芯片。LUT存储一函数的相关数据(如该函数的一查找表),ALC对该函数相关数据进行算术运算。ALC芯片和LUT芯片位于同一封装中,它们之间通过芯片间连接进行电耦合。由于与ALC位于同一封装中,LUT又被称为封装内查找表电路(IP-LUT)。此外,由于IP-LUT是可编程的,因此可根据用户需求在IP-LUT中写入所需函数的相关数据,以实现计算的编程。IP-LUT可编程处理器采用“基于存储的计算”(memory-basedcomputation,简称为MBC),它主要通过查表来实现计算。IP-LUT可编程处理器中IP-LUT的存储容量远高于传统处理器的LUT。虽然大多数MBC仍需要进行算术运算,通过使用较大的IP-LUT作为计算的出发点,MBC仅需使用较少的多项式展开(如泰勒级数展开)。在MBC中,大部分计算通过IP-LUT完成,少部分计算通过ALC实现。IP-LUT可编程处理器的使用分两个阶段:设置阶段和计算阶段。在设置阶段,在IP-LUT中写入所需函数的相关数据;在计算阶段,通过在IP-LUT中查找函数相关数据来实现计算。IP-LUT可编程处理器能实现现场编程和可重构计算。对于现场编程,可在使用现场将所需函数的相关数据写入IP-LUT,则IP-LUT可编程处理器可在使用现场实现所需的函数。对于可重构计算,不同时段在IP-LUT中写入不同函数的不同相关数据(如不同函数的查找表),则IP-LUT可编程处理器可实现不同函数。例如,在第一时段,IP-LUT存储第一函数的相关数据;在第二时段,IP-LUT存储第二函数的相关数据。这种将ALC芯片和LUT芯片相互堆叠在同一封装的集成方式被称为2.5维集成。2.5维集成能提高计算密度和计算复杂度。采用传统的二维集成,传统处理器00X的面积是ALU100X和LUT200X之和。采用2.5维集成后,LUT从边上移到顶上,IP-LUT可编程处理器变小,计算密度加强。此外,传统处理器00X中LUT200X的总容量小于100kb,而IP-LUT可编程处理器中IP-LUT的总容量可达到100Gb;单个IP-LUT可编程处理器就可支持上万个内置函数(包括多本文档来自技高网
...
基于封装内查找表的可编程处理器

【技术保护点】
一种可编程处理器(300),其特征在于含有:一可编程存储芯片(200),该可编程存储芯片(200)含有至少一查找表电路(170),可根据用户需求在该查找表电路(170)中写入一函数的相关数据;一逻辑芯片(100),该逻辑芯片(100)含有至少一算术逻辑电路(180),该算术逻辑电路(180)对该查找表电路(170)中读出的数据进行算术运算;多个将该可编程存储芯片(200)和该逻辑芯片(100)耦合的芯片间连接(160);该可编程存储芯片(200)和该逻辑芯片(100)位于同一封装(130)内。

【技术特征摘要】
2016.05.06 CN 2016103016458;2017.05.05 CN 201710311.一种可编程处理器(300),其特征在于含有:一可编程存储芯片(200),该可编程存储芯片(200)含有至少一查找表电路(170),可根据用户需求在该查找表电路(170)中写入一函数的相关数据;一逻辑芯片(100),该逻辑芯片(100)含有至少一算术逻辑电路(180),该算术逻辑电路(180)对该查找表电路(170)中读出的数据进行算术运算;多个将该可编程存储芯片(200)和该逻辑芯片(100)耦合的芯片间连接(160);该可编程存储芯片(200)和该逻辑芯片(100)位于同一封装(130)内。2.根据权利要求1所述的可编程处理器(300),其特征在于:该可编程存储芯片(200)为一可重复编程存储器。3.根据权利要求2所述的可编程处理器(300),其特征在于:在不同时段,该查找表电路(170)存储不同函数的不同相关数据。4.根据权利要求1所述的可编程处理器(300),其特征还在于:所述可编程处理器(300)是一可编程门阵列...

【专利技术属性】
技术研发人员:张国飙
申请(专利权)人:成都海存艾匹科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1