处理器、缓存处理方法及电子设备技术

技术编号:24353033 阅读:36 留言:0更新日期:2020-06-03 01:59
本申请实施例提供一种处理器、缓存处理方法及电子设备,其中处理器包括缓存和检测装置,所述缓存包括多个缓存行;所述检测装置用于在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行。本申请实施例提供的处理器、缓存处理方法及电子设备,可以在多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行,提高缓存的可靠性,并且,以缓存行为粒度进行隔离,保证了某一个或几个缓存行出现问题时,也不影响处理器的整体使用,有效提高了处理器的性能。

Processor, cache processing method and electronic equipment

【技术实现步骤摘要】
处理器、缓存处理方法及电子设备
本申请涉及计算机
,尤其涉及一种处理器、缓存处理方法及电子设备。
技术介绍
现代数据中心中,服务器的可靠性时刻影响着业务的稳定性,任何不可预知的宕机都会导致业务的中断,为公司带来不可挽回的损失。通过对业内数据中心中大量宕机数据的分析,发现CPU(CentralProcessingUnit,中央处理器)内部的Cache(高速缓冲存储器)、TLB(TranslationLookasideBuffer,转换检测缓冲区)错误导致的宕机比例在一半以上。而针对CPU内部的Cache和TLB,业内并没有提供一个很好的隔离机制,来提升CPU内部Cache和TLB的可靠性,降低因其引起的系统故障。
技术实现思路
有鉴于此,本申请实施例提供一种处理器、缓存处理方法及电子设备,以提高处理器的可靠性。第一方面,本申请实施例提供一种处理器,包括:缓存和检测装置;所述缓存包括多个缓存行;所述检测装置用于在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行。第二方面,本申请实施例提供一种缓存处理方法,包括:获取多个缓存行中的至少一个缓存行发生的错误信息;若所述错误信息满足预设条件,则隔离所述至少一个缓存行。第三方面,本申请实施例提供一种电子设备,包括第一方面中的处理器。本申请实施例提供的处理器、缓存处理方法及电子设备,包括缓存和检测装置,所述缓存可以包括多个缓存行,所述检测装置可以在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行,提高缓存的可靠性,并且,以缓存行为粒度进行隔离,保证了某一个或几个缓存行出现问题时,也不影响处理器的整体使用,有效提高了处理器的性能。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的处理器的结构框图;图2为本申请实施例提供的处理器的一种Cache架构示意图;图3为本申请实施例提供的一种处理器的结构示意图;图4为本申请实施例提供的处理器中的Cache存储空间示意图;图5为本申请实施例提供的处理器的巡检逻辑示意图;图6为本申请实施例提供的另一种处理器的结构示意图;图7为本申请实施例提供的一种缓存处理方法的流程示意图;图8为本申请实施例提供的一种数据处理方法的流程示意图;图9为本申请实施例提供的一种数据处理装置的结构示意图;图10为本申请实施例提供的一种电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。处理器是计算机的运算核心和控制核心,主要包括算术逻辑运算单元和缓存等部件。其中,所述缓存可以包括多个缓存行,本申请实施例主要用于对处理器中的缓存行进行监测。图1为本申请实施例提供的处理器的结构框图。如图1所示,本申请实施例中的处理器可以包括:缓存11和检测装置12。所述缓存11可以包括多个缓存行;所述检测装置12可以用于在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行。其中,所述处理器可以为中央处理器或者其它任意类型的处理器。所述缓存11可以是指高速缓存或其它任意类型的缓存,例如,Cache或TLB等。以下为了便于描述,以所述缓存11为Cache、缓存行为CacheLine(高速缓冲存储器行)为例来对本申请实施例进行详细说明。具体的,Cache可以包括多个CacheLine,所述检测装置12可以在任一CacheLine发生的错误满足预设条件时,隔离所述CacheLine。图2为本申请实施例提供的处理器的一种Cache架构示意图。如图2所示,处理器可以包括一个或多个CPUDie(中央处理器裸片),每个CPUDie可以包括一个或多个CPUCore(中央处理器核)。每个CPUCore都可以配置有Cache,Cache是位于CPU执行单元和DRAM(DynamicRandomAccessMemory,主存储器)之间的存储器,规模较小,但速度很高,通常由SRAM(StaticRandomAccessMemory,静态存储器)组成。CPU的速度远高于内存,当CPU直接从内存中存取数据时要等待一定时间周期,而Cache则可以保存CPU刚用过或循环使用的一部分数据,如果CPU需要再次使用该部分数据时可从Cache中直接调用,这样就避免了重复存取数据,减少了CPU的等待时间,因而提高了系统的效率。所述Cache可以有多种类型。可选的,Cache的类型可以包括:第一级指令Cache(Level-1InstructionCache,L1ICache,也称L1指令Cache),用于缓存CPU指令,属于只读型缓存,一般每个CPUCore都有一组L1ICache;第一级数据Cache(Level-1DataCache,L1DCache,也称L1数据Cache),用于缓存CPU访问数据,速度最快,容量最小,一本文档来自技高网...

【技术保护点】
1.一种处理器,其特征在于,包括:缓存和检测装置;/n所述缓存包括多个缓存行;/n所述检测装置用于在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行。/n

【技术特征摘要】
1.一种处理器,其特征在于,包括:缓存和检测装置;
所述缓存包括多个缓存行;
所述检测装置用于在所述多个缓存行中的至少一个缓存行发生的错误满足预设条件时,隔离所述至少一个缓存行。


2.根据权利要求1所述的处理器,其特征在于,所述检测装置具体用于:
若任一缓存行发生可纠正错误的次数大于对应的阈值,或者,所述缓存行发生不可纠正错误,则隔离所述缓存行。


3.根据权利要求1所述的处理器,其特征在于,缓存行包括:可纠正错误CE域和在线Online位;
所述CE域用于存储缓存行发生可纠正错误的次数;
所述Online位用于表示缓存行是否被隔离。


4.根据权利要求3所述的处理器,其特征在于,所述检测装置具体用于:若检测到缓存行出现可纠正的错误,则将CE域的值加1,并判断CE域的值是否大于对应的阈值,若大于,则更新所述缓存行的Online位。


5.根据权利要求3所述的处理器,其特征在于,缓存行还包括:身份标识ID域;
所述ID域用于存储缓存行的ID信息。


6.根据权利要求5所述的处理器,其特征在于,所述检测装置还用于:
在缓存行没有被访问时,通过缓存行的ID信息,在缓存行中写入数据,并对数据进行校验。


7.根据权利要求4所述的处理器,其特征在于,还包括:硬件检测机制MCA装置;
所述检测装置还用于在缓存行被隔离后,将向MCA装置发送所述缓存行的隔离信息;
所述MCA装置用于根据缓存行的隔离信息对缓存进行监控。


8.根据权利要求7所述的处理器,其特征在于,所述MCA装置具体用于:若被隔离的缓存行的数量大于对应的极限值,则上报操作系统。


9.根据权利要求1-8中任一项所述的处理器,其特征在于,所述缓存包括高速缓冲存储器Cache和/或转换检测缓冲区TLB;
所述缓存行为高速缓冲存储器行CacheLine或转换检测缓冲区行TLBLine。


10.根据权利要求9所述的处理器,其特征在于,所述处理器包括一个或多个中央处理器裸片CPUDie,所述CPUDie包括一个或多个中央处理器核CPUCore;
所述缓存有多种类型;每个CPUCore对应配置有至少一种类型的所述缓存以及一所述检测装置。


11.根据权利要求10所述的处理器,其特征在于,所述Cache的类型包括第一级指令Cache、第一级数据Cache、第二级Cache和最后一级Cache...

【专利技术属性】
技术研发人员:宋文俊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1