基于GPDSP的可扩展多核处理器、加速卡及计算机制造技术

技术编号:37428878 阅读:7 留言:0更新日期:2023-04-30 09:49
本发明专利技术公开了一种基于GPDSP的可扩展多核处理器、加速卡及计算机,本发明专利技术的可扩展多核智能处理包括相互连接的片外存储体和GPDSP芯粒,GPDSP芯粒包括多个CPU核、多个DSP核、多层次互联结构和芯粒间高速互联接口,DSP核用于执行面向智能计算的加速任务,多个CPU核、多个DSP核、芯粒间高速互联接口与多层次互联结构相连,芯粒间高速互联接口用于多个GPDSP芯粒之间的相互连接。本发明专利技术能够高效支持智能计算,具有优秀的可扩展能力以及可根据需要方便进行算力动态裁剪以实现按需设计、避免算力浪费,大大降低了顶层设计复杂度,具有扩展性好、灵活度高、通信效率高、通信延迟低的优点。通信延迟低的优点。通信延迟低的优点。

【技术实现步骤摘要】
基于GPDSP的可扩展多核处理器、加速卡及计算机


[0001]本专利技术涉及微处理器
,具体涉及一种基于GPDSP的可扩展多核处理器、加速卡及计算机。

技术介绍

[0002]智能计算已经成为推动科学技术发展进步的重要引擎之一,其蓬勃发展的态势对智能处理器的算力需求、通用性和灵活性支持、以及功耗限制等多个方面提出了严苛的要求,使得智能处理器设计面临十分严峻的挑战。同时包含通用CPU和多核DSP的General Purpose DigitalSignal Processor (GPDSP)在提供超高算力的同时,具备较好的通用性支持以及低功耗特点,能够为智能处理器提供较为有力的架构支撑。尽管具备较大的潜力,采用GPDSP进行智能计算支撑时仍然面临以下几个方面的挑战:1)算力可裁剪定制挑战,智能计算领域针对训练、推理等不同场景往往具有不同的算力需求,而单一形态的GPDSP无法有效提供算力的动态裁剪适配能力,芯粒集成技术的发展为算力扩展提供了较为理想的解决思路,但是能够与GPDSP架构高效协同联动的高带宽芯粒集成接口设计仍然是一个亟待解决的开放问题;2)GPDSP芯粒间片上存储的高效共享挑战,GPDSP架构中具有包括共享阵列存储体以及片内共享存储阵列在内的多个片上存储空间,片上存储空间的高效利用对于提升系统效率具有决定性影响,因此在芯粒集成的背景下,在多GPDSP芯粒之间的片上存储共享方面取得突破,才能缓解片外存储瓶颈,有效提升对以数据量大著称的智能计算应用的支持效率和力度;3)GPDSP芯粒内部数据一致性支持挑战,GPDSP内部同时包含CPU和DSP,高效的智能计算任务处理需要GPDSP提供CPU和DSP之间高效的数据一致性支持,改支持既需要保持CPU和DSP之间的独立性,实现数据局部性的深度挖掘,又需要充分考虑智能处理的计算特征,创新数据一致性方案,以降低智能处理系统的硬件开销和总体功耗,从而提升基于GPGPU的智能处理器的总体性能,使之更好的服务于智能计算任务。综上所述,如何在GPDSP架构的基础上,通过芯粒级的可扩展设计、芯粒间的片上存储高效共享机制以及芯粒内高效的数据一致性支持技术,设计一种高效的多核智能处理器,已经成为智能处理器设计领域的一项亟待解决的关键技术问题。

技术实现思路

[0003]本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种基于GPDSP的可扩展多核处理器、加速卡及计算机,本专利技术能够高效支持智能计算,具有优秀的可扩展能力以及可根据需要方便进行算力动态裁剪以实现按需设计、避免算力浪费,大大降低了顶层设计复杂度,具有扩展性好、灵活度高、通信效率高、通信延迟低的优点。
[0004]为了解决上述技术问题,本专利技术采用的技术方案为:一种基于GPDSP的可扩展多核智能处理器,包括相互连接的片外存储体和GPDSP芯粒,所述GPDSP芯粒包括多个CPU核、多个DSP核、多层次互联结构和芯粒间高速互联接口,其中CPU核用于提供包括操作系统支持、任务调度管理在内的通用处理、DSP核用于执行面向
智能计算的加速任务,所述多个CPU核、多个DSP核、芯粒间高速互联接口与多层次互联结构相连,所述芯粒间高速互联接口用于多个GPDSP芯粒之间的相互连接。
[0005]可选地,所述GPDSP芯粒的数量为多个,且多个GPDSP芯粒之间通过芯粒间高速互联接口两两相互连接,使得任意两个GPDSP芯粒之间通过芯粒间高速互联接口直接连接。
[0006]可选地,所述GPDSP芯粒还包括共享阵列存储体,所述共享阵列存储体与多层次互联结构相连,以用于作为本GPDSP芯粒的数据缓冲,以及本GPDSP芯粒和其它GPDSP芯粒之间的数据共享存储器。
[0007]可选地,所述共享阵列存储体包括可配置的程序员不可见的缓冲部分、程序员可见的共享部分以及共享访问控制器,所述程序员不可见的缓冲部分和程序员可见的共享部分被配置为两者共同占用全部空间,或者两者其一占用全部空间、另一空间大小为零,所述共享访问控制器用于允许本GPDSP芯粒外的其它GPDSP芯粒访问程序员可见的共享部分、禁止本GPDSP芯粒外的其它GPDSP芯粒访问程序员不可见的缓冲部分。
[0008]可选地,所述共享访问控制器还包括权限配置寄存器,用于存储程序员可见的共享部分允许访问的其它GPDSP芯粒的ID,当本GPDSP芯粒外的其它GPDSP芯粒访问程序员可见的共享部分时,所述共享访问控制器首先根据权限配置寄存器中允许的GPDSP芯粒的ID与当前请求访问的GPDSP芯粒的ID进行匹配,当且仅当两者匹配时才允许当前请求访问的GPDSP芯粒访问程序员可见的共享部分。
[0009]可选地,所述GPDSP芯粒中每一个CPU核均连接有对应的私有缓冲。
[0010]可选地,所述GPDSP芯粒还包括硬件强Cache一致性控制模块以用于实现各个CPU核的私有缓冲内的新数据在片外存储体中对应的存储空间的更新,实现该CPU核分别与本GPDSP芯粒中的DSP核、其它CPU核,以及其它GPDSP芯粒中的CPU核、DSP核的数据交互。
[0011]可选地,所述GPDSP芯粒还包括可显式配置的弱Cache一致性控制模块以用于实现各个DSP核所产生数据在片外存储体中对应的存储空间的更新,实现该DSP核分别与本GPDSP芯粒中的CPU核、其它DSP核,以及其它GPDSP芯粒中的CPU核、DSP核的数据交互。
[0012]此外,本专利技术还提供一种计算加速卡,包括加速卡本体以及安装在加速卡本体上的处理器,该处理器为前述的基于GPDSP的可扩展多核智能处理器。
[0013]此外,本专利技术还提供一种计算机,包括相互连接的处理器和存储器,该处理器为前述的基于GPDSP的可扩展多核智能处理器。
[0014]和现有技术相比,本专利技术主要具有下述优点:1、本专利技术基于GPDSP的可扩展多核智能处理器包括相互连接的片外存储体和GPDSP芯粒,所述多个GPDSP芯粒之间通过芯粒间高速互联接口相连并与片外存储体相连形成了一种多核可扩展处理器结构,在设计时可方便实现算力的灵活可裁剪和可配置,本专利技术能够充分挖掘GPDSP在智能处理领域所蕴含的超高算力支撑和超低功耗开销,通过高速互联接口的芯粒集成进一步增强了以计算场景具体需求为出发点的算力动态裁剪能力,有效避免了当前智能处理器存在的算力浪费情况,在满足多种智能应用场景需求的前提下,消除了针对不同场景的定制化和碎片化设计问题,实现以谱系化设计模式和组合式扩展机制为基础的高效智能处理器研发模式,从而大大降低了芯粒间的顶层设计复杂度,极大加速了智能芯片的时序收敛过程,对于设计更大规模的智能处理器芯片提供了较强的可扩展性技术支撑,有效缓解了智能处理器规模扩展与设计复杂度以及实用效率之间的矛盾。
[0015]2、本专利技术基于GPDSP的可扩展多核智能处理器的GPDSP芯粒包括多个CPU核、多个DSP核、多层次互联结构和芯粒间高速互联接口,其中CPU核用于提供包括操作系统支持、任务调度管理在内的通用处理、DSP核用于执行面向智能计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GPDSP的可扩展多核智能处理器,其特征在于,包括相互连接的片外存储体(1)和GPDSP芯粒(2),所述GPDSP芯粒(2)包括多个CPU核(21)、多个DSP核(22)、多层次互联结构(23)和芯粒间高速互联接口(24),其中CPU核(21)用于提供包括操作系统支持、任务调度管理在内的通用处理、DSP核(22)用于执行面向智能计算的加速任务,所述多个CPU核(21)、多个DSP核(22)、芯粒间高速互联接口(24)与多层次互联结构(23)相连,所述芯粒间高速互联接口(24)用于多个GPDSP芯粒(2)之间的相互连接。2.根据权利要求1所述的基于GPDSP的可扩展多核智能处理器,其特征在于,所述GPDSP芯粒(2)的数量为多个,且多个GPDSP芯粒(2)之间通过芯粒间高速互联接口(24)两两相互连接,使得任意两个GPDSP芯粒(2)之间通过芯粒间高速互联接口(24)直接连接。3.根据权利要求2所述的基于GPDSP的可扩展多核智能处理器,其特征在于,所述GPDSP芯粒(2)还包括共享阵列存储体(25),所述共享阵列存储体(25)与多层次互联结构(23)相连,以用于作为本GPDSP芯粒(2)的数据缓冲,以及本GPDSP芯粒(2)和其它GPDSP芯粒(2)之间的数据共享存储器。4.根据权利要求3所述的基于GPDSP的可扩展多核智能处理器,其特征在于,所述共享阵列存储体(25)包括可配置的程序员不可见的缓冲部分、程序员可见的共享部分以及共享访问控制器,所述程序员不可见的缓冲部分和程序员可见的共享部分被配置为两者共同占用全部空间,或者两者其一占用全部空间、另一空间大小为零,所述共享访问控制器用于允许本GPDSP芯粒(2)外的其它GPDSP芯粒(2)访问程序员可见的共享部分、禁止本GPDSP芯粒(2)外的其它GPDSP芯粒(2)访问程序员不可见的缓冲部分。5.根据权利要求1所述的基于GPDSP的可扩展多核智能处理器,其特征在于,所述...

【专利技术属性】
技术研发人员:郭阳王耀华刘胜陈海燕雷元武刘仲鲁建壮扈啸陈胜刚李晨刘畅张洋曹壮
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1