System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于嵌入式AI的国产CPU服务器故障诊断系统及方法技术方案_技高网

一种基于嵌入式AI的国产CPU服务器故障诊断系统及方法技术方案

技术编号:43617725 阅读:3 留言:0更新日期:2024-12-11 14:59
本发明专利技术公开了一种基于嵌入式AI的国产CPU服务器故障诊断系统及方法,涉及国产服务器技术领域,包括:低功耗嵌入式系统级芯片SOC,所述SOC芯片集成有神经网络处理单元,用于接收并分析服务器串口输出的报错信息;数据采集程序,用于从服务器的调试串口读取报错信息,并存储至SOC芯片的存储器中;预处理模块,用于对采集到的报错信息进行预处理,以供机器学习模型处理;基于自然语言处理技术的机器学习模型,用于对预处理后的报错信息进行分析,识别异常情况;与BMC之间的通信接口,用于传输分析结果;故障预警模块,实现故障预警功能。本发明专利技术能够为用户提供即时且直观的报错信息,使服务器的故障处理更简便、迅速。

【技术实现步骤摘要】

本专利技术涉及计算机故障诊断,具体地说是一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法。


技术介绍

1、基于飞腾、龙芯处理器的服务器,在启动、运行过程中,会通过调试串口输出大量的调试信息,用于指示服务器各部分硬件的运行状态。在已有的技术方案中,会通过bmc(基板管理控制器)收集这些串口信息,并进行存储,用户可以随时查看。该方案可以做到在服务器出现故障时,收集报错信息进行分析,但是存在如下缺点:

2、日志可读性差:只有专业人员才能进行分析。

3、分析工作量大:服务器长时间工作,会积累大量的日志,需要较长时间才能完成分析。

4、缺少故障预警功能:无法在日常使用过程中,及时发现串口日志的异常,只能在出现故障时,通过日志分析故障原因。

5、服务器对运行可靠性有很高的要求。在这个大数据的时代,一旦服务器功能出现问题,后果不堪设想,因此,提升故障检测方法的效率,缩短故障发现时间,对快速修复故障具有重要的意义。


技术实现思路

1、本专利技术的技术任务是针对以上不足之处,提供一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法,能够为用户提供即时且直观的报错信息,使服务器的故障处理更简便、迅速。

2、本专利技术解决其技术问题所采用的技术方案是:

3、一种基于嵌入式ai的国产cpu服务器故障诊断系统,该系统包括:

4、低功耗嵌入式系统级芯片soc,所述soc芯片集成有神经网络处理单元(npu),用于接收并分析服务器串口输出的报错信息;

5、数据采集程序,用于从服务器的调试串口读取报错信息,并存储至soc芯片的存储器中;

6、预处理模块,用于对采集到的报错信息进行预处理,以供机器学习模型处理;

7、基于自然语言处理(nlp)技术的机器学习模型,用于对预处理后的报错信息进行分析,识别异常情况;

8、与bmc之间的通信接口,用于传输分析结果;

9、故障预警模块,用于结合bmc采集的数据,实时监测服务器状态,实现故障预警功能。

10、所述soc选自低成本、高能效的芯片,具备足够的处理能力和存储空间,以及npu,以支持ai分析工具的运行;所述机器学习模型通过训练,能够自动识别报错信息中的异常模式,提供直观、及时的故障描述信息,便于非专业用户理解;所述故障预警模块能够实时监控服务器运行状态,当检测到潜在故障时,立即生成预警信息,提高故障响应速度。

11、进一步的,预处理模块包括:

12、文本清洗算法,用于去除无关字符,以确保数据质量;

13、标准化算法,用于统一数据格式;

14、分词算法,用于将报错信息分解成可分析的单元。

15、进一步的,所述基于自然语言处理(nlp)技术的机器学习模型,为基于transformer的模型。

16、进一步的,所述与bmc之间的通信接口,通过uart或i2c方式实现。

17、进一步的,所述bmc采集的数据包括电压、电流、温度数据。

18、本专利技术还要求保护一种基于嵌入式ai的国产cpu服务器故障诊断方法,该方法的实现包括:

19、s1、从服务器串口读取报错信息;

20、s2、对报错信息进行预处理,包括文本清洗、标准化、分词;

21、s3、使用基于自然语言处理(nlp)技术的机器学习模型对预处理后的信息进行分析,识别异常情况;

22、s4、结合bmc采集的服务器运行参数,包括电压、电流、温度,进行综合分析,确定故障类型;

23、s5、提供直观、及时的故障描述信息,改善服务器故障诊断的用户体验。

24、进一步的,该方法的实现还包括:

25、当服务器正常运行时,持续监控日志信息,实现故障预警功能,提前预防潜在故障的发生。

26、进一步的,所述服务器包括基于国产飞腾、龙芯处理器的服务器;服务器具有嵌入式系统级芯片soc,所述soc芯片集成有神经网络处理单元(npu),用于接收并分析服务器串口输出的报错信息。

27、本专利技术还要求保护一种实现国产cpu服务器故障诊断的装置,包括:至少一个存储器和至少一个处理器;

28、所述至少一个存储器,用于存储机器可读程序;

29、所述至少一个处理器,用于调用所述机器可读程序,实现上述的方法。

30、本专利技术还要求保护一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,能够实现上述的方法。

31、本专利技术的一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法与现有技术相比,具有以下有益效果:

32、本专利技术通过在bmc上增加一套离线的,基于低功耗嵌入式soc的ai分析工具,对通过服务器串口输出的报错信息进行实时分析,对比与正常启动时的差异,并且对差异项目进行智能分析,结合bmc采集的电压、电流、温度等数据,为用户提供直观、及时的故障描述信息,改善服务器故障诊断系统的用户体验。

33、本专利技术结合了嵌入式系统开发、机器学习和自然语言处理技术。随着嵌入式系统处理能力的提升和ai模型的不断优化,这种方案是完全可行的,并且在实际应用中具有很高的价值。

本文档来自技高网...

【技术保护点】

1.一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,该系统包括:

2.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,预处理模块包括:

3.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述基于自然语言处理技术的机器学习模型,为基于Transformer的模型。

4.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述与BMC之间的通信接口,通过UART或I2C方式实现。

5.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述BMC采集的数据包括电压、电流、温度数据。

6.一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,该方法的实现包括:

7.根据权利要求6所述的一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,该方法的实现还包括:

8.根据权利要求7所述的一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,所述服务器包括基于国产飞腾、龙芯处理器的服务器;服务器具有嵌入式系统级芯片SOC,所述SOC芯片集成有神经网络处理单元,用于接收并分析服务器串口输出的报错信息。

9.一种实现国产CPU服务器故障诊断的装置,其特征在于,包括:至少一个存储器和至少一个处理器;

10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,能够实现权利要求6至8任一项所述的方法。

...

【技术特征摘要】

1.一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,该系统包括:

2.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,预处理模块包括:

3.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述基于自然语言处理技术的机器学习模型,为基于transformer的模型。

4.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述与bmc之间的通信接口,通过uart或i2c方式实现。

5.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述bmc采集的数据包括电压、电流、温度数据。

6.一种基于嵌入式ai的...

【专利技术属性】
技术研发人员:何孟宁贾国强潘凯
申请(专利权)人:西安超越申泰信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1