System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机故障诊断,具体地说是一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法。
技术介绍
1、基于飞腾、龙芯处理器的服务器,在启动、运行过程中,会通过调试串口输出大量的调试信息,用于指示服务器各部分硬件的运行状态。在已有的技术方案中,会通过bmc(基板管理控制器)收集这些串口信息,并进行存储,用户可以随时查看。该方案可以做到在服务器出现故障时,收集报错信息进行分析,但是存在如下缺点:
2、日志可读性差:只有专业人员才能进行分析。
3、分析工作量大:服务器长时间工作,会积累大量的日志,需要较长时间才能完成分析。
4、缺少故障预警功能:无法在日常使用过程中,及时发现串口日志的异常,只能在出现故障时,通过日志分析故障原因。
5、服务器对运行可靠性有很高的要求。在这个大数据的时代,一旦服务器功能出现问题,后果不堪设想,因此,提升故障检测方法的效率,缩短故障发现时间,对快速修复故障具有重要的意义。
技术实现思路
1、本专利技术的技术任务是针对以上不足之处,提供一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法,能够为用户提供即时且直观的报错信息,使服务器的故障处理更简便、迅速。
2、本专利技术解决其技术问题所采用的技术方案是:
3、一种基于嵌入式ai的国产cpu服务器故障诊断系统,该系统包括:
4、低功耗嵌入式系统级芯片soc,所述soc芯片集成有神经网络处理单元(npu),用于接收并分
5、数据采集程序,用于从服务器的调试串口读取报错信息,并存储至soc芯片的存储器中;
6、预处理模块,用于对采集到的报错信息进行预处理,以供机器学习模型处理;
7、基于自然语言处理(nlp)技术的机器学习模型,用于对预处理后的报错信息进行分析,识别异常情况;
8、与bmc之间的通信接口,用于传输分析结果;
9、故障预警模块,用于结合bmc采集的数据,实时监测服务器状态,实现故障预警功能。
10、所述soc选自低成本、高能效的芯片,具备足够的处理能力和存储空间,以及npu,以支持ai分析工具的运行;所述机器学习模型通过训练,能够自动识别报错信息中的异常模式,提供直观、及时的故障描述信息,便于非专业用户理解;所述故障预警模块能够实时监控服务器运行状态,当检测到潜在故障时,立即生成预警信息,提高故障响应速度。
11、进一步的,预处理模块包括:
12、文本清洗算法,用于去除无关字符,以确保数据质量;
13、标准化算法,用于统一数据格式;
14、分词算法,用于将报错信息分解成可分析的单元。
15、进一步的,所述基于自然语言处理(nlp)技术的机器学习模型,为基于transformer的模型。
16、进一步的,所述与bmc之间的通信接口,通过uart或i2c方式实现。
17、进一步的,所述bmc采集的数据包括电压、电流、温度数据。
18、本专利技术还要求保护一种基于嵌入式ai的国产cpu服务器故障诊断方法,该方法的实现包括:
19、s1、从服务器串口读取报错信息;
20、s2、对报错信息进行预处理,包括文本清洗、标准化、分词;
21、s3、使用基于自然语言处理(nlp)技术的机器学习模型对预处理后的信息进行分析,识别异常情况;
22、s4、结合bmc采集的服务器运行参数,包括电压、电流、温度,进行综合分析,确定故障类型;
23、s5、提供直观、及时的故障描述信息,改善服务器故障诊断的用户体验。
24、进一步的,该方法的实现还包括:
25、当服务器正常运行时,持续监控日志信息,实现故障预警功能,提前预防潜在故障的发生。
26、进一步的,所述服务器包括基于国产飞腾、龙芯处理器的服务器;服务器具有嵌入式系统级芯片soc,所述soc芯片集成有神经网络处理单元(npu),用于接收并分析服务器串口输出的报错信息。
27、本专利技术还要求保护一种实现国产cpu服务器故障诊断的装置,包括:至少一个存储器和至少一个处理器;
28、所述至少一个存储器,用于存储机器可读程序;
29、所述至少一个处理器,用于调用所述机器可读程序,实现上述的方法。
30、本专利技术还要求保护一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,能够实现上述的方法。
31、本专利技术的一种基于嵌入式ai的国产cpu服务器故障诊断系统及方法与现有技术相比,具有以下有益效果:
32、本专利技术通过在bmc上增加一套离线的,基于低功耗嵌入式soc的ai分析工具,对通过服务器串口输出的报错信息进行实时分析,对比与正常启动时的差异,并且对差异项目进行智能分析,结合bmc采集的电压、电流、温度等数据,为用户提供直观、及时的故障描述信息,改善服务器故障诊断系统的用户体验。
33、本专利技术结合了嵌入式系统开发、机器学习和自然语言处理技术。随着嵌入式系统处理能力的提升和ai模型的不断优化,这种方案是完全可行的,并且在实际应用中具有很高的价值。
本文档来自技高网...【技术保护点】
1.一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,该系统包括:
2.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,预处理模块包括:
3.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述基于自然语言处理技术的机器学习模型,为基于Transformer的模型。
4.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述与BMC之间的通信接口,通过UART或I2C方式实现。
5.根据权利要求1所述的一种基于嵌入式AI的国产CPU服务器故障诊断系统,其特征在于,所述BMC采集的数据包括电压、电流、温度数据。
6.一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,该方法的实现包括:
7.根据权利要求6所述的一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,该方法的实现还包括:
8.根据权利要求7所述的一种基于嵌入式AI的国产CPU服务器故障诊断方法,其特征在于,所
9.一种实现国产CPU服务器故障诊断的装置,其特征在于,包括:至少一个存储器和至少一个处理器;
10.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,能够实现权利要求6至8任一项所述的方法。
...【技术特征摘要】
1.一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,该系统包括:
2.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,预处理模块包括:
3.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述基于自然语言处理技术的机器学习模型,为基于transformer的模型。
4.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述与bmc之间的通信接口,通过uart或i2c方式实现。
5.根据权利要求1所述的一种基于嵌入式ai的国产cpu服务器故障诊断系统,其特征在于,所述bmc采集的数据包括电压、电流、温度数据。
6.一种基于嵌入式ai的...
【专利技术属性】
技术研发人员:何孟宁,贾国强,潘凯,
申请(专利权)人:西安超越申泰信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。