【技术实现步骤摘要】
一种向量处理器及相关数据访存方法
[0001]本专利技术涉及计算机
,尤其涉及一种向量处理器及相关数据访存方法。
技术介绍
[0002]随着各个领域的数据规模以及复杂度的不断增加,对处理器计算能力、处理性能的要求也越来越高。向量处理器系统(Vector Processor System,VPS),是面向向量型并行计算,以流水线结构为主的并行处理系统。采用先行控制和重叠操作技术、运算流水线、交叉访问的并行存储器等并行处理结构,对提高运算速度有重要作用。
[0003]其中,向量处理器是一种能够实现直接操作一维数组(向量)指令集的中央处理器,例如向量处理器可同时执行一条向量指令中所包含的多个操作请求。在向量处理器中多个处理单元可共享同一套取址、译码、地址计算和访存等控制部件,进而能够以较低的硬件开销充分开发应用程序的并行性。目前,如何为向量处理器提供高效灵活的数据供给支持是其充分发挥运算能力的表征。向量访存单元是向量处理器中用于从存储器中读数据或向存储器写入数据的单元。向量访存单元可通过地址计算单元计算得到访问存储器的地址,然后高带宽将数据在存储器和向量寄存器中搬移。但是在实际应用中发现,向量处理器访问存储器操作一般会消耗较长时间,从而降低向量处理器性能。因此,如何提升向量处理器访存数据性能是亟待解决的问题。
技术实现思路
[0004]本专利技术实施例提供一种向量处理器及相关数据访存方法,以提升向量处理器访存数据的性能。
[0005]第一方面,本专利技术实施例提供了一种向量处理器,其特 ...
【技术保护点】
【技术特征摘要】
1.一种向量处理器,其特征在于,包括:向量访存单元,所述向量访存单元与存储器耦合,所述存储器包括多个存储块Block;所述向量访存单元,用于:接收访存指令;所述访存指令包括N个访存请求;N为大于0的整数;根据所述N个访存请求分别得到N个访存请求地址;确定所述N个访存请求地址所属的地址范围在所述多个Block中所对应的M个Block;M为大于0且小于或等于N的整数;生成与所述M个Block对应的M个总线请求,并向所述存储器发送所述M个总线请求。2.如权利要求1所述的向量处理器,其特征在于,所述向量访存单元包括地址运算单元和请求融合单元;所述向量访存单元,具体用于:通过所述地址运算单元接收所述访存指令;所述访存指令包括所述N个访存请求;根据所述N个访存请求分别得到N个访存请求地址,并向所述请求融合单元发送所述N个访存请求地址;通过所述请求融合单元接收所述地址运算单元发送的所述N个访存请求地址,并确定所述N个访存请求地址所属的地址范围在所述多个Block中所对应的所述M个Block;生成与所述M个Block对应的所述M个总线请求,并向所述存储器发送所述M个总线请求。3.如权利要求2所述的向量处理器,其特征在于,所述地址运算单元包括L个地址运算器;每个所述地址运算器每个时钟周期基于一个所述访存请求得到一个所述访存请求地址;L为大于1的整数。4.如权利要求3所述的向量处理器,其特征在于,所述向量访存单元,具体用于:通过所述地址运算单元,将所述N个访存请求划分为S个请求集合;S为大于1的整数;每个所述请求集合包括的所述访存请求小于或等于L个;分别根据所述S个请求集合得到S个访存请求地址集合;每个所述访存请求地址集合包括对应的请求集合中包括的访存请求的请求地址。5.如权利要求4所述的向量处理器,其特征在于,S为N/L向上取整的数。6.如权利要求4或5所述的向量处理器,其特征在于,所述向量访存单元还包括数据寄存器;所述向量访存单元,具体用于:通过所述地址运算单元计算所述S个请求集合中的第i个请求集合所对应的第i个访存请求地址集合,并向所述数据寄存器发送所述第i个访存请求地址集合;i=0,1,2
……
S;通过所述数据寄存器接收所述地址运算单元发送的所述第i个访存请求地址集合,并存储所述第i个访存请求地址集合。7.如权利要求6所述的向量处理器,其特征在于,所述向量访存单元,具体用于:当所述数据寄存器中存储了S个所述访存请求地址集合,通过所述数据寄存器向所述请求融合单元发送所述S个访存请求地址集合;通过所述请求融合单元接收所述数据寄存器发送的所述S个访存请求地址集合;所述S个访存请求地址集合中包括所述N个访存请求地址。8.如权利要求1
‑
7任意一项所述的向量处理器,其特征在于,所述向量处理器还包括向量寄存器堆;所述N个访存请求为N个读数据请求;所述向量访存单元,还用于:分别接收所述存储器基于所述M个总线请求反馈的所述M个Block中存储的数据;基于所述M个Block中存储的数据,分别将所述N个读数据请求所对应的数据写入至所
述向量寄存器。9.一种数据访存方法,其特征在于,应用于向量处理器;所述向量处理器包括向量访存单元,所述向量访存单元与存储器耦合,所述存储器包括多个存储块Block;所述方法包括:通过所述向量访存单元接收访存指令;所述访存指令包括N个访存请求;N为大于0的整数;根据所述N个访存请求分别得到N个访存请求地址;确定所述N个访存请求地址所属的地址范围在所述多个Block中所对应的M个Block;M为大于0且小于或等于N的整数;生成与所述M个Block...
【专利技术属性】
技术研发人员:崔鲁平,
申请(专利权)人:睿思芯科深圳技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。