System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及数据通信领域,尤其涉及一种图形处理器异常检测方法、系统、介质及电子设备。
技术介绍
1、近年来,随着电子信息技术的发展,图形处理器(graphics processing unit,即gpu)加速计算机的运行速度的功能变得越来越重要,gpu加速计算是指同时利用gpu和cpu,加快科学、分析、工程、消费和企业应用程序的运行速度。gpu加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到gpu,同时仍由cpu运行其余程序代码。从用户的角度来看,应用程序的运行速度显著提升。
2、相关技术一般将gpu设备异常或错误状态的日志信息写入到闪存存储器中保存,后续运维人员可以通过工具从闪存存储器中读取日志信息,还原异常或错误发生场景,导致无法及时反馈系统的异常或错误状态。
技术实现思路
1、本申请提供一种图形处理器异常检测方法、系统、介质及电子设备,以部分解决现有技术存在的上述问题。
2、本申请采用下述技术方案:
3、本申请提供图形处理器异常检测方法,应用于图形处理器设备,包括:
4、响应于图形处理器异常,生成跨进程通信消息;
5、将所述跨进程通信消息存储至系统管理控制单元的缓存中;
6、响应于满足预设条件,向主机侧发送指示消息,所述指示消息用于使所述主机侧从所述缓存中获取所述跨进程通信消息。
7、可选地,生成跨进程通信消息,具体包括:
8、获取所述图形处理器异常对应
9、根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,生成跨进程通信消息。
10、可选地,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
11、按照系统管理控制单元的缓存的存储顺序,将所述跨进程通信消息,顺序存储至所述系统管理控制单元的缓存中,并确定所述跨进程通信消息对应的存储地址。
12、可选地,向主机侧发送指示消息,具体包括:
13、根据所述跨进程通信消息对应的存储地址得到指示消息,并向主机侧发送所述指示消息。
14、可选地,响应于满足预设条件,向主机侧发送指示消息,具体包括:
15、当存储所述跨进程通信消息的所述缓存剩余的内存空间到达预设的空间大小时,确定满足预设条件,所述系统管理控制单元向主机侧发送指示消息。
16、可选地,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
17、响应于所述缓存剩余的内存空间小于预设的空间大小,则将所述跨进程通信消息存入暂存内存区,并响应于所述缓存中跨进程通信消息被获取后,将所述暂存内存区存储的跨进程通信消息存入所述缓存;
18、响应于所述缓存剩余的内存空间不小于预设的空间大小,将所述跨进程通信消息存储至系统管理控制单元的缓存中。
19、可选地,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,生成跨进程通信消息,具体包括:
20、根据所述异常日志数据,确定所述图形处理器异常的异常等级;
21、根据所述异常等级、所述异常发生时间戳、所述异常单元以及所述异常日志数据,生成跨进程通信消息;
22、其中,所述异常等级用于指示所述主机侧对所述跨进程通信消息的处理方式。
23、本申请提供图形处理器异常检测方法,所述方法应用于主机侧,包括:
24、接收图形处理器设备发送的指示消息,其中,所述指示消息是所述图形处理器设备响应于满足预设条件向所述主机侧发送的;
25、从系统管理控制单元的缓存获取跨进程通信消息,并根据所述跨进程通信消息,进行对应处理。
26、可选地,从系统管理控制单元的缓存获取跨进程通信消息,具体包括:
27、根据所述指示消息,确定系统管理控制单元的缓存的存储地址;
28、根据所述缓存的存储地址,按照所述系统管理控制单元的缓存的存储顺序,依次获取各跨进程通信消息。
29、可选地,根据所述跨进程通信消息,进行对应处理,具体包括:
30、对获取到的所述跨进程通信消息进行分析,确定所述图形处理器异常对应的异常发生时间戳、异常单元、异常日志数据以及异常等级;
31、确定所述异常等级对应的处理方式,并按照确定出的处理方式,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,进行对应处理。
32、可选地,按照确定出的处理方式,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,进行对应处理,具体包括:
33、当根据所述异常等级确定所述跨进程通信消息为重要等级的跨进程通信消息时,停止向所述图形处理器下发任务,再根据所述异常发生时间戳、所述异常单元以及所述异常日志数据记录异常日志。
34、本申请提供图形处理器异常检测系统,所述系统包括:图形处理器设备和主机侧,所述图形处理设备中的系统管理控制单元至少包括:异常检测模块、异常上报模块以及缓存,其中:
35、所述异常检测模块,响应于所述图形处理器异常,生成跨进程通信消息,将所述跨进程通信消息存储至所述缓存中;
36、所述异常上报模块,响应于满足预设条件,向所述主机侧发送指示消息;
37、所述主机侧,接收所述异常上报模块发送的指示消息,从所述缓存获取跨进程通信消息,并根据所述跨进程通信消息,进行对应处理。
38、本说明书提供的计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图形处理器异常检测方法。
39、本说明书提供的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图形处理器异常检测方法。
40、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
41、在本说明书提供的一种图形处理器异常检测方法中,响应于图形处理器异常,生成跨进程通信消息,并存储至系统管理控制单元的缓存中。响应于满足预设条件,向主机侧发送指示消息,使主机侧从缓存中获取跨进程通信消息,并根据获取的跨进程通信消息进行对应处理。
42、从上述方法中可以看出,可基于图形处理器异常,生成跨进程通信消息,并存储至缓存,直至满足预设条件,通知主机侧读取缓存中跨进程通信消息并分析处理,能够及时反映图形处理器异常,使得运维人员能及时处理异常。
本文档来自技高网...【技术保护点】
1.一种图形处理器异常检测方法,其特征在于,所述方法应用于图形处理器设备,包括:
2.如权利要求1所述方法,其特征在于,生成跨进程通信消息,具体包括:
3.如权利要求1所述方法,其特征在于,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
4.如权利要求3所述方法,其特征在于,向主机侧发送指示消息,具体包括:
5.如权利要求1所述方法,其特征在于,响应于满足预设条件,向主机侧发送指示消息,具体包括:
6.如权利要求5所述方法,其特征在于,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
7.如权利要求2所述方法,其特征在于,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,生成跨进程通信消息,具体包括:
8.一种图形处理器异常检测方法,其特征在于,所述方法应用于主机侧,包括:
9.如权利要求8所述方法,其特征在于,从系统管理控制单元的缓存获取跨进程通信消息,具体包括:
10.如权利要求8所述方法,其特征在于,根据所述跨进程通信消息,进行对
11.如权利要求10所述方法,其特征在于,按照确定出的处理方式,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,进行对应处理,具体包括:
12.一种图形处理器异常检测系统,其特征在于,所述系统包括:图形处理器设备和主机侧,所述图形处理设备中的系统管理控制单元至少包括:异常检测模块、异常上报模块以及缓存,其中:
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~11任一项所述的方法。
14.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~11任一项所述的方法。
...【技术特征摘要】
1.一种图形处理器异常检测方法,其特征在于,所述方法应用于图形处理器设备,包括:
2.如权利要求1所述方法,其特征在于,生成跨进程通信消息,具体包括:
3.如权利要求1所述方法,其特征在于,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
4.如权利要求3所述方法,其特征在于,向主机侧发送指示消息,具体包括:
5.如权利要求1所述方法,其特征在于,响应于满足预设条件,向主机侧发送指示消息,具体包括:
6.如权利要求5所述方法,其特征在于,将所述跨进程通信消息存储至系统管理控制单元的缓存中,具体包括:
7.如权利要求2所述方法,其特征在于,根据所述异常发生时间戳、所述异常单元以及所述异常日志数据,生成跨进程通信消息,具体包括:
8.一种图形处理器异常检测方法,其特征在于,所述方法应用于主机侧,包括:
9.如权利要求8所述方法,其...
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:摩尔线程智能科技成都有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。