图形处理器中异常核的检测方法、检测装置和电子设备制造方法及图纸

技术编号:36932902 阅读:19 留言:0更新日期:2023-03-22 18:55
本申请实施例公开了图形处理器中异常硬件的检测方法、装置和电子设备,可以有效地避免图形处理器运行时硬件处理单元出现异常导致阻塞,并且在硬件处理单元恢复正常时及时使其重新恢复工作状态,提高图形处理器的任务处理效率。检测方法包括:当图形处理器上电时,对图形处理器进行初始化;若初始化正常,控制主控制核使用测试用例数据,周期性检测图形处理器中硬件处理单元是否运行异常,其中测试用例数据用于检测硬件处理单元的运行状态;若硬件处理单元运行异常,控制主控制核暂停向硬件处理单元进行任务派发;当在后续的任一个周期内检测到硬件处理单元运行恢复正常时,控制主控制核重新恢复向硬件处理单元进行任务派发。制核重新恢复向硬件处理单元进行任务派发。制核重新恢复向硬件处理单元进行任务派发。

【技术实现步骤摘要】
图形处理器中异常核的检测方法、检测装置和电子设备


[0001]本申请涉及微电子
,尤其涉及图形处理器中异常硬件的检测方法、检测装置和电子设备。

技术介绍

[0002]在图形处理
,图形处理器(graphics processing unit,GPU)正在承担着处理庞大数据的角色,处理数据的能力正在不断加强。GPU采用的测试方案经过封测厂的自动化测试设备(automatic test equipment,ATE)测试,功能测试,可靠性测试等一系列测试环节。
[0003]在目前的测试环节中,大多数缺陷检查环节中,主要通过透视和外观对GPU进行筛选,并没有对GPU的功能特性进行检测。使得通过测试后的GPU,由于使用环境或者软件问题,导致GPU运行时硬件处理单元出现异常,无法完成当前任务,在该硬件处理单元(即异常核)形成阻塞。

技术实现思路

[0004]基于此,有必要针对上述问题,本申请提出了图形处理器中异常核的检测方法、装置和电子设备,可以有效地避免图形处理器运行时硬件处理单元出现异常导致阻塞,并且在硬件处理单元恢复正常时及时使其重新恢复工作状态,提高图形处理器的任务处理效率。容易理解,出现异常的硬件处理单元即为异常核。
[0005]第一方面,本申请提供了一种图形处理器中异常核的检测方法,图形处理器中包括主控制核和硬件处理单元,检测方法包括:当图形处理器上电时,对图形处理器进行初始化;若初始化正常,控制主控制核使用测试用例数据,周期性检测图形处理器中硬件处理单元是否运行异常,其中测试用例数据用于检测硬件处理单元的运行状态;若硬件处理单元运行异常,控制主控制核暂停向硬件处理单元进行任务派发;当在后续的任一个周期内检测到硬件处理单元运行恢复正常时,控制主控制核重新恢复向硬件处理单元进行任务派发。
[0006]可选的,在第一方面的一些实现方式中,为硬件处理单元设置有异常标志;检测方法还包括:当硬件处理单元运行异常时,控制主控制核将硬件处理单元的异常标志标记为异常;当硬件处理单元运行恢复正常时,控制主控制核将硬件处理单元的异常标志标记为正常。
[0007]可选的,在第一方面的一些实现方式中,测试用例数据包括:整体测试用例数据和单独测试用例数据;其中整体测试用例数据为不区分硬件处理单元类型,能测试所有类型的硬件处理单元;单独测试用例数据为针对某种硬件处理单元类型设计,只能测试某一类
型的硬件处理单元。
[0008]可选的,在第一方面的一些实现方式中,图形处理器中还包括:派发器、决策器和结果比较器;控制主控制核使用测试用例数据,周期性检测图形处理器中硬件处理单元是否运行异常,包括:控制主控制核将测试用例数据优先调度至派发器;控制派发器根据测试用例数据向硬件处理单元派发请求任务,将请求任务对应的请求任务索引表发送至决策器,将请求任务对应的任务正确结果发送至结果比较器;控制硬件处理单元根据测试用例数据处理请求任务,并将得到的任务处理结果发送至结果比较器;控制结果比较器根据任务正确结果和任务处理结果进行比较,得到对比结果,并将对比结果发送至决策器;控制决策器根据对比结果确定硬件处理单元是否异常,并更新请求任务索引表。
[0009]可选的,在第一方面的一些实现方式中,控制决策器根据对比结果确定硬件处理单元是否异常,包括:若对比结果为相等,确定硬件处理单元运行正常;若对比结果为不相等,确定硬件处理单元运行异常。
[0010]可选的,在第一方面的一些实现方式中,控制主控制核使用测试用例数据,周期性检测图形处理器中硬件处理单元是否运行异常之前,还包括:控制主控制核向主机处理器CPU发送的数据请求信号,获取测试用例数据,其中测试用例数据为存储在CPU侧可以动态调用的数据;或者,控制主控制核获取检测固件的内存地址,其中测试用例数据被打包在检测固件中,检测固件被加载至图形处理器的内存中。
[0011]可选的,在第一方面的一些实现方式中,当测试用例数据被打包在检测固件中时,检测固件被加载至图形处理器的内存中的加载方式包括:PCI通道加载、JTAG通道加载和Flash上电加载。
[0012]第二方面,本申请提供了一种图形处理器中异常硬件的检测装置,图形处理器中包括主控制核和硬件处理单元;检测装置包括:初始化模块、异常检测模块和任务派发模块;初始化模块用于:当图形处理器上电时,对图形处理器进行初始化;异常检测模块用于:若初始化正常,控制主控制核使用测试用例数据,周期性检测图形处理器中硬件处理单元是否运行异常,其中测试用例数据用于检测硬件处理单元的运行状态;任务派发模块用于:若硬件处理单元运行异常,控制主控制核暂停向硬件处理单元进行任务派发;任务派发模块还用于:当在后续的任一个周期内检测到硬件处理单元运行恢复正常时,控制主控制核重新恢复向硬件处理单元进行任务派发。
[0013]第三方面,本申请提供了一种电子设备,包括:存储器和处理器,其中存储器上存储有可执行代码;当可执行代码被处理器所调用时,使得电子设备执行如第一方面及其实现方式中
任一项所述的图形处理器中异常硬件的检测方法中的步骤。
[0014]第四方面,本申请提供了一种计算机可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器所调用时,使得电子设备执行如第一方面及其实现方式中任一项所述的图形处理器中异常硬件的检测方法中的步骤。
[0015]本申请提供的技术方案具有以下有益效果:在本申请技术方案中,通过控制主控制核使用测试用例数据,周期性检测所述图形处理器中硬件处理单元是否运行异常;若异常,控制主控制核暂停向硬件处理单元进行任务派发,可以及时发现硬件处理单元的异常情况,及时暂停向异常的硬件处理单元进行任务派发,当异常的硬件处理单元在下一次在后续的任一个周期内检测到硬件处理单元运行恢复正常时,重新恢复向硬件处理单元进行任务派发,可以有效地避免图形处理器运行时硬件处理单元出现异常导致阻塞,并且在硬件处理单元恢复正常时及时使其重新恢复工作状态,提高图形处理器的任务处理效率。
[0016]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0017]通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
[0018]图1为本申请实施例的一个应用场景示意图;图2为本申请实施例中图形处理器中异常硬件的检测方法的一个流程示意图;图3为本申请实施例中图形处理器中异常硬件的检测装置的一个结构示意图;图4为本申请实施例中电子设备的一个结构示意图。
具体实施方式
[0019]下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图形处理器中异常硬件的检测方法,其特征在于,所述图形处理器中包括主控制核和硬件处理单元;所述检测方法包括:当图形处理器上电时,对所述图形处理器进行初始化;若初始化正常,控制所述主控制核使用测试用例数据,周期性检测所述图形处理器中硬件处理单元是否运行异常,其中所述测试用例数据用于检测所述硬件处理单元的运行状态;若所述硬件处理单元运行异常,控制所述主控制核暂停向所述硬件处理单元进行任务派发;当在后续的任一个周期内检测到所述硬件处理单元运行恢复正常时,控制所述主控制核重新恢复向所述硬件处理单元进行任务派发。2.根据权利要求1所述的检测方法,其特征在于,为所述硬件处理单元设置有异常标志;所述检测方法还包括:当所述硬件处理单元运行异常时,控制所述主控制核将所述硬件处理单元的异常标志标记为异常;当所述硬件处理单元运行恢复正常时,控制所述主控制核将所述硬件处理单元的异常标志标记为正常。3.根据权利要求1所述的检测方法,其特征在于,所述测试用例数据包括:整体测试用例数据和单独测试用例数据;其中所述整体测试用例数据为不区分硬件处理单元类型,能测试所有类型的所述硬件处理单元;所述单独测试用例数据为针对某种硬件处理单元类型设计,只能测试某一类型的所述硬件处理单元。4.根据权利要求1所述的检测方法,其特征在于,所述图形处理器中还包括:派发器、决策器和结果比较器;所述控制所述主控制核使用测试用例数据,周期性检测所述图形处理器中硬件处理单元是否运行异常,包括:控制所述主控制核将所述测试用例数据优先调度至所述派发器;控制所述派发器根据所述测试用例数据向所述硬件处理单元派发请求任务,将所述请求任务对应的请求任务索引表发送至所述决策器,将所述请求任务对应的任务正确结果发送至所述结果比较器;控制所述硬件处理单元根据所述测试用例数据处理所述请求任务,并将得到的任务处理结果发送至所述结果比较器;控制所述结果比较器根据所述任务正确结果和所述任务处理结果进行比较,得到对比结果,并将所述对比结果发送至所述决策器;控制所述决策器根据所述对比结果确定所述硬件处理单元是否异常,并更新所述请求任务索引表。5.根据权利要求4所述的检测方法,其特征在于,所述控制所述决策器根据所述对比结果...

【专利技术属性】
技术研发人员:江靖华梁存旭张坚
申请(专利权)人:深流微智能科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1