System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及监控运维,尤其涉及一种ai视觉分析业务的自动化监控运维方法及相关装置。
技术介绍
1、目前,ai视觉技术已在各行各业得到广泛应用,并已出现大量对ai视觉算法进行统一管理和自动化训练的集算力、算法、平台于一体的ai视频分析系统。这些ai视频分析系统日均提供超过5亿次ai视觉分析计算服务,因此其系统稳定性和可靠性关系着ai视觉分析服务的服务质量。
2、为提高系统稳定性和可靠性,除持续优化系统架构和系统性能外,降低故障发生频率、缩小故障影响范围和降低故障恢复时间是提高系统稳定性和可靠性的重要手段之一,这就要求在系统的监控运维过程中能够及时发现并处理系统故障。
3、目前,现有的一些实现方式依赖于专业的技术人员进行故障分析、故障排查和故障处理。以投诉较多的ai视觉原子能力响应超时问题以及第三方平台在订阅ai视觉原子能力后长时间未收到算法分析检测结果为例。在出现前述问题后,系统的维护管理往往依赖于专业技术人员进行故障分析,并分析该问题是否由接口服务调用响应超时、网络故障导致ai视觉算法解析视频流异常、ai视觉算法服务自身故障等因素导致。但是,考虑到故障原因种类繁多,若采用人工方式进行故障排查定位和故障处理,则会导致运维成本高、效率低下且容易出错的问题。同时,随着业务规模的不断扩大和系统复杂度的不断增加,这对系统稳定性和可靠性提出了越来越高的要求,使得人工监控运维方式难以满足早发现、准定位和快交付的实际需求。
4、为解决上述问题,现有技术提出了一种对产品集中监控的自动化运维方法,通过设置产品检测点
5、然而,现有的自动化监控运维方案在故障处理效率和准确性上仍有不足。
技术实现思路
1、本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中故障处理效率低和故障处理准确性低的技术缺陷。
2、第一方面,本申请实施例提供了一种ai视觉分析业务的自动化监控运维方法,包括:
3、响应于故障排查接口被调用或自动巡查结果为异常,判断ai中台是否生成针对目标ai视觉分析业务的目标告警数据;其中,所述目标ai视觉分析业务为需要进行故障排查的ai视觉分析业务;
4、若所述ai中台生成所述目标告警数据,则根据所述目标ai视觉分析业务的订阅信息和推送日志进行故障定位,并得到故障定位结果;
5、若所述ai中台未生成所述目标告警数据,则根据所述ai中台的任务详情、目标设备状态和所述目标ai视觉分析业务所对应的目标算法状态进行故障定位,并得到所述故障定位结果;其中,所述目标设备状态为用于运行所述目标ai视觉分析业务的设备的状态;
6、根据所述故障定位结果生成故障排查结果并推送。
7、第二方面,本申请实施例提供了一种ai视觉分析业务的自动化监控运维装置,包括:
8、判断模块,用于响应于故障排查接口被调用或自动巡查结果为异常,判断ai中台是否生成针对目标ai视觉分析业务的目标告警数据;其中,所述目标ai视觉分析业务为需要进行故障排查的ai视觉分析业务;
9、第一故障定位模块,用于若所述ai中台生成所述目标告警数据,则根据所述目标ai视觉分析业务的订阅信息和推送日志进行故障定位,并得到故障定位结果;
10、第二故障定位模块,用于若所述ai中台未生成所述目标告警数据,则根据所述ai中台的任务详情、目标设备状态和所述目标ai视觉分析业务所对应的目标算法状态进行故障定位,并得到所述故障定位结果;其中,所述目标设备状态为用于运行所述目标ai视觉分析业务的设备的状态;
11、推送模块,用于根据所述故障定位结果生成故障排查结果并推送。
12、在本申请一些实施例提供的一种ai视觉分析业务的自动化监控运维方法及相关装置中,提供了强制启动故障排查流程的接口,当自动化巡检未产生告警时,运维人员或技术人员可通过调用该接口强制启动分析故障的自动排查流程,并可接收到以同步或异步的方式返回的故障排查结果。如此,无需运维或者研发人员手动登录系统环境并根据自动巡检的流程手动逐一确认,从而可提高故障处理效率和故障处理准确性。
13、同时,本申请可依据ai中台是否生成目标告警数据,选用目标ai视觉分析业务的订阅信息和推送日志进行故障定位,或者选用ai中台的任务详情、目标设备状态和目标ai视觉分析业务所对应的目标算法状态进行故障定位,从而可得到准确的故障定位结果,并可进一步提高故障处理的准确性。
本文档来自技高网...【技术保护点】
1.一种AI视觉分析业务的自动化监控运维方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标AI视觉分析业务的订阅信息和推送日志进行故障定位,并得到故障定位结果,包括:
3.根据权利要求1所述的方法,其特征在于,所述任务详情包括由AI平台生成的针对于所述目标AI视觉分析业务的目标任务状态;
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述采集所述AI视觉分析业务的指标数据,包括:
6.根据权利要求4所述的方法,其特征在于,所述根据所述指标数据进行自动化巡查,并得到所述自动巡查结果,包括:
7.根据权利要求4所述的方法,其特征在于,所述根据所述指标数据进行自动化巡查,并得到所述自动巡查结果,包括:
8.根据权利要求6或7所述的方法,其特征在于,所述根据所述故障定位结果生成故障排查结果并推送,包括:
9.根据权利要求4所述的方法,其特征在于,所述指标数据包括指标值、指标来源设备的设备标识和所述目标AI
10.一种AI视觉分析业务的自动化监控运维装置,其特征在于,包括:
...【技术特征摘要】
1.一种ai视觉分析业务的自动化监控运维方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标ai视觉分析业务的订阅信息和推送日志进行故障定位,并得到故障定位结果,包括:
3.根据权利要求1所述的方法,其特征在于,所述任务详情包括由ai平台生成的针对于所述目标ai视觉分析业务的目标任务状态;
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述采集所述ai视觉分析业务的指标数据,包括:
6.根据权利要求4所述的...
【专利技术属性】
技术研发人员:王宁洲,陈龙,曾力,陈海洋,王艺,
申请(专利权)人:天翼视联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。