System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多核和资源复用的向量处理器制造技术_技高网

一种基于多核和资源复用的向量处理器制造技术

技术编号:40010753 阅读:16 留言:0更新日期:2024-01-16 15:14
本申请提供一种基于多核和资源复用的向量处理器,包括一个处理核心M和一到多个处理核心S,所述处理核心均可同时执行标量指令。处理核心M用于译码向量指令,将向量指令派发到处理核心S上执行,并追踪已派发的向量指令的执行状态。处理核心S在复用现有计算逻辑的基础上,接收出了核心M派发的向量指令并在向量寄存器的一部分上执行指令。本申请还提供一种执行向量指令的方法,基于上述向量处理器。本申请在复用多核心处理器架构中已有的执行单元的基础上,通过额外添加一组向量寄存器以及少量向量指令相关的控制逻辑,在保证低硬件开销下,实现对向量指令的高效执行。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,尤其涉及一种在多核心处理器基础上,通过资源复用的方式,实现低硬件开销的向量处理器。


技术介绍

1、近年来,随着移动互联网以及物联网技术的高速发展,终端设备可以获取、收集到的数据规模逐步增长。数据规模的增长为之前主流的云计算模式的实时性和可用性带来了挑战。边缘计算通过在靠近数据源头的终端设备上提供智能服务的方式,在大数据处理的时代下,有效应对了云计算模型难以解决的云中心负载、数据传输、以及用户隐私保护等问题。因此,随着边缘计算的兴起,数据处理从云转移到终端设备是一种必然趋势。终端设备的计算需求量随之增加,也需要终端设备在有限硬件资源下提供更多的算力。

2、另一方面,现代处理器开始引入向量运算指令来进一步加速运算。向量运算指令即为令处理器对向量进行运算的指令,其中包括向量的加减、内积等操作。这一类指令通过共享硬件控制逻辑,开发出计算的数据级并行能力,实现高数据吞吐量的计算能力。这种特性使得向量运算指令在边缘计算领域有着广阔的应用前景。

3、目前,市面上的边缘计算设备通常会通过多核心处理器的方式来实现一定限度的任务级并行能力,但是很少有设备将向量运算能力引入到处理器中。究其原因是实现向量计算指令需要的硬件开销较大,为芯片的设计制造带来了很大的成本压力。基于上述情况,本专利技术提出一种在多核心处理器基础上,通过资源复用的方式,实现低硬件开销的向量处理器。


技术实现思路

1、本专利技术提供了一种在多核心处理器基础上,通过资源复用的方式,实现低硬件开销的向量处理器,以解决边缘计算场景下,现有处理器受限于较大的硬件开销而无法引入向量处理指令来加速运算的问题。

2、第一方面,本专利技术提供一种处理核心m,该处理核心用于译码向量指令并追踪其执行状态,同时该处理核心也可执行标量指令,该处理核心包括:存储器、指令译码单元、指令执行单元、向量指令追踪单元以及寄存器单元;

3、所述存储器,用于存储参与运算的数据以及指令;

4、所述指令译码单元,用于从存储器中获取标量指令或是向量指令,从指令中译码需要执行的操作以及操作对应的参数;所述标量指令和向量指令相对,表示对单个数据进行运算的指令;

5、所述指令执行单元,用于根据指令译码单元译码的指令,从寄存器单元中获取参与运算的数据,对于标量指令进行运算,并将运算结果存储到寄存器单元中,对于向量指令,则将运算分派到向量指令追踪单元进行执行;

6、所述向量指令追踪单元,用于向后续第二方面所述的处理核心s分派向量指令,并追踪指令执行状态,确保向量指令成功被所有处理核心s成功执行;

7、所述寄存器单元,用于存储参与标量指令执行的数据。

8、第二方面,本专利技术提供一种处理核心s,该处理核心用于根据上述第一方面所述的处理核心m译码后的向量指令执行运算,同时该处理核心也可执行标量指令,该处理核心包括:存储器、标量指令译码单元、指令选择单元、指令执行单元、标量寄存器单元和向量寄存器单元;

9、所述存储器,用于存储参与运算的数据以及标量指令;

10、所述标量指令译码单元,用于从存储器中获取标量指令,从指令中译码需要执行的操作以及操作对应的参数;

11、所述指令选择单元,用于从译码后的标量指令以及上述第一方面所述的处理核心m中向量指令追踪单元分派的向量指令之间选择最终需要执行的指令;

12、所述指令执行单元,用于根据指令选择单元选择的指令,从标量寄存器单元或是向量寄存器单元中获取参与运算的数据,进行运算,并将运算结果存储到标量寄存器单元或是向量寄存器单元中;

13、所述标量寄存器单元,用于存储参与标量指令执行的数据;

14、所述向量寄存器单元,用于存储参与向量指令执行的数据,向量寄存器单元与标量寄存器单元复用同一套获取数据时的旁路逻辑。

15、第三方面,本专利技术提供一种向量处理器,该向量处理器包括一个上述第一方面所述的处理核心m,以及一到多个上述第二方面所述的处理核心s。

16、第四方面,本专利技术提供一种执行向量指令的方法,基于上述第三方面所述的向量处理器,包括:

17、上述第一方面所述的处理核心m从存储器中获取向量指令i并译码;

18、处理核心m的指令执行单元将译码后的向量指令i分派到向量指令追踪单元;

19、向量指令追踪单元将译码后的向量指令i分派到所有上述第二方面所述的处理核心s1~sn;

20、处理核心s1~sn的指令选择单元各自选择译码后的向量指令i,开始执行;

21、上述第一方面所述的处理核心m确认所有上述第二方面所述的处理核心s1~sn均已经开始执行向量指令i,向量指令执行状态追踪单元开始追踪s1~sn的向量指令i执行状态;

22、上述第二方面所述的处理核心s1~sn分别执行向量指令i,从向量寄存器中获取运算所需的数据并执行运算;

23、上述第一方面所述的处理核心m确认所有上述第二方面所述的处理核心s1~sn对向量指令i均已执行完毕,并提交向量指令i的执行状态,其目的是对外标记该指令已经成功执行。

24、可以看出,通过本专利技术提供的向量处理器,可以在复用多核心处理器架构中已有的指令执行单元的基础上,通过额外添加一组向量寄存器以及少量向量指令相关的控制逻辑,可以在实现了高效执行向量指令的同时,减少大部分硬件开销。

本文档来自技高网...

【技术保护点】

1.一种基于多核和资源复用的向量处理器,用于提供一组向量寄存器,并针对这组向量寄存器做运算,其特征在于,包括:

2.根据权利要求1所述的处理核心M,其特征在于,包括:

3.根据权利要求1所述的处理核心S,其特征在于,包括:

4.一种执行向量指令的方法,基于权利要求1所述的向量处理器,其特征在于,包括:

【技术特征摘要】

1.一种基于多核和资源复用的向量处理器,用于提供一组向量寄存器,并针对这组向量寄存器做运算,其特征在于,包括:

2.根据权利要求1所述的处理核心m,其特征在于...

【专利技术属性】
技术研发人员:周锋于海鑫许睿琦
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1