样本数据生成制造技术

技术编号:39842775 阅读:14 留言:0更新日期:2023-12-29 16:33
本说明书实施例提供了一种样本数据生成

【技术实现步骤摘要】
样本数据生成、模型训练、异常运行原因确定方法及装置


[0001]本文件涉及计算机
,尤其涉及一种样本数据生成

模型训练

异常运行原因确定方法及装置


技术介绍

[0002]通过确定应用程序的异常运行原因,可以指导开发人员进一步优化应用程序

现有技术中可以借助于自动化的原因分析系统,定位应用程序的异常运行原因,然而该原因分析系统依赖于海量同类异常的数据,对于偶发的应用程序异常,由于缺少同类异常的数据,因此导致该原因分析系统定位原因的准确率降低


技术实现思路

[0003]本说明书实施例提供了一种样本数据生成

模型训练

异常运行原因确定方法及装置,针对偶发的应用程序异常,不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因,提高了确定应用程序的异常运行原因的准确率

[0004]第一方面,本说明书实施例提供了一种样本数据生成方法,包括:
[0005]通过目标应用程序对应的自动化归因模型,确定所述目标应用程序的至少一个异常运行原因,对至少一个所述异常运行原因进行分类,得到异常运行原因类型;
[0006]从所述目标应用程序的历史异常运行数据中,获取所述异常运行原因类型对应的异常运行数据,并确定所述异常运行数据在预设的运行数据指标项下的数据指标值;
[0007]确定所述异常运行原因类型和所述数据指标值之间的对应关系,根据所述对应关系,将所述异常运行原因类型和所述数据指标值作为模型训练样本数据

[0008]第二方面,本说明书实施例提供了一种模型训练方法,包括:
[0009]获取如上述第一方面所述的方法生成的模型训练样本数据;
[0010]利用所述模型训练样本数据,训练预先搭建的神经网络结构直至收敛,将训练收敛的所述神经网络结构,作为所述目标应用程序的异常运行原因确定模型;
[0011]其中,所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重

[0012]第三方面,本说明书实施例提供了一种异常运行原因确定方法,包括:
[0013]获取如上述第二方面所述的方法所训练的所述目标应用程序的异常运行原因确定模型,以及,获取所述目标应用程序的待分析异常运行数据;
[0014]确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值;
[0015]通过所述异常运行原因确定模型对所述待分析数据指标值进行处理,根据处理结果,确定所述目标应用程序的异常运行原因类型

[0016]第四方面,本说明书实施例提供了一种样本数据生成装置,包括:
[0017]原因分类单元,用于通过目标应用程序对应的自动化归因模型,确定所述目标应用程序的至少一个异常运行原因,对至少一个所述异常运行原因进行分类,得到异常运行
原因类型;
[0018]指标确定单元,用于从所述目标应用程序的历史异常运行数据中,获取所述异常运行原因类型对应的异常运行数据,并确定所述异常运行数据在预设的运行数据指标项下的数据指标值;
[0019]样本生成单元,用于确定所述异常运行原因类型和所述数据指标值之间的对应关系,根据所述对应关系,将所述异常运行原因类型和所述数据指标值作为模型训练样本数据

[0020]第五方面,本说明书实施例提供了一种模型训练装置,包括:
[0021]样本获取单元,用于获取如上述第四方面所述的装置生成的模型训练样本数据;
[0022]模型训练单元,用于利用所述模型训练样本数据,训练预先搭建的神经网络结构直至收敛,将训练收敛的所述神经网络结构,作为所述目标应用程序的异常运行原因确定模型;
[0023]其中,所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重

[0024]第六方面,本说明书实施例提供了一种异常运行原因确定装置,包括:
[0025]模型获取单元,用于获取如上述第五方面所述的装置所训练的所述目标应用程序的异常运行原因确定模型,以及,获取所述目标应用程序的待分析异常运行数据;
[0026]数据确定单元,用于确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值;
[0027]原因分析单元,用于通过所述异常运行原因确定模型对所述待分析数据指标值进行处理,根据处理结果,确定所述目标应用程序的异常运行原因类型

[0028]第七方面,本说明书实施例提供了一种电子设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现上述第一方面所述的方法的步骤,或者,实现上述第二方面所述的方法的步骤,或者,实现上述第三方面所述的方法的步骤

[0029]第八方面,本说明书实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现上述第一方面所述的方法的步骤,或者,实现上述第二方面所述的方法的步骤,或者,实现上述第三方面所述的方法的步骤

[0030]通过本说明书一个或多个实施例,将应用程序的异常运行原因类型和应用程序的异常运行数据在预先确定的运行数据指标项下的数据指标值,作为模型训练样本数据,该异常运行原因类型和该数据指标值之间具有对应关系,通过该模型训练样本数据训练应用程序的异常运行原因确定模型,通过该异常运行原因确定模型确定应用程序的异常运行原因

由于利用生成的模型训练样本数据训练模型并通过模型分析应用程序的异常运行原因时,充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系,因此针对偶发的应用程序异常,不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因,提高了确定应用程序的异常运行原因的准确率

附图说明
[0031]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
[0032]图1为本说明书一实施例提供的样本数据生成方法的流程示意图;
[0033]图2为本说明书一实施例提供的模型训练方法的流程示意图;
[0034]图3为本说明书一实施例提供的异常运行原因确定方法的流程示意图;
[0035]图4为本说明书一实施例提供的样本数据生成装置的结构示意图;
[0036]图5为本说明书一实施例提供的模型训练装置的结构示意图;
...

【技术保护点】

【技术特征摘要】
1.
一种样本数据生成方法,其特征在于,包括:通过目标应用程序对应的自动化归因模型,确定所述目标应用程序的至少一个异常运行原因,对至少一个所述异常运行原因进行分类,得到异常运行原因类型;从所述目标应用程序的历史异常运行数据中,获取所述异常运行原因类型对应的异常运行数据,并确定所述异常运行数据在预设的运行数据指标项下的数据指标值;确定所述异常运行原因类型和所述数据指标值之间的对应关系,根据所述对应关系,将所述异常运行原因类型和所述数据指标值作为模型训练样本数据
。2.
根据权利要求1所述的方法,其特征在于,通过目标应用程序对应的自动化归因模型,确定所述目标应用程序的异常运行原因,包括:通过所述自动化归因模型中的各个归因节点对所述目标应用程序进行异常运行归因,得到所述目标应用程序的异常运行原因;其中,每个所述归因节点对应一预定异常运行原因;所述目标应用程序的异常运行原因包括所述预定异常运行原因
。3.
根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述目标应用程序的标识

所述目标应用程序的版本号

所述目标应用程序所适配的操作系统的标识

所述目标应用程序所适配的操作系统的版本号中的至少一项;根据获取的信息,为所述目标应用程序配置所述运行数据指标项
。4.
根据权利要求1所述的方法,其特征在于,从所述目标应用程序的历史异常运行数据中,获取所述异常运行原因类型对应的异常运行数据,包括:通过所述自动化归因模型中的各个归因节点对所述历史异常运行数据进行异常运行归因,以在所述历史异常运行数据中确定与每个所述归因节点所对应的预定异常运行原因相对应的数据;其中,每个所述归因节点对应一预定异常运行原因;根据每个所述归因节点所对应的预定异常运行原因,在各个所述归因节点中确定对应于所述异常运行原因类型的目标归因节点,将所述历史异常运行数据中与所述目标归因节点所对应的预定异常运行原因相对应的数据,作为所述异常运行原因类型对应的异常运行数据
。5.
根据权利要求1所述的方法,其特征在于,所述运行数据指标项包括以下项中的至少一个:所述目标应用程序所在的用户终端的虚拟内存级别;所述目标应用程序所在的用户终端的操作系统版本信息;所述目标应用程序的运行数据中按照预设异常信号生成规则生成并记录的异常信号;所述目标应用程序的线程数量级别;所述目标应用程序崩溃前出现预设异常的次数;所述目标应用程序的异常堆栈类型
。6.
根据权利要求5所述的方法,其特征在于,确定所述异常运行数据在所述运行数据指标项下的数据指标值,包括:通过自动化脚本的方式,自动确定所述异常运行数据在所述运行数据指标项下的数据指标值
。7.
根据权利要求6所述的方法,其特征在于,通过自动化脚本的方式,自动确定所述异
常运行数据在所述运行数据指标项下的数据指标值,包括以下方式中的至少一种:从所述异常运行数据中提取所述用户终端的虚拟内存大小,根据所述虚拟内存大小,确定所述虚拟内存级别;从所述异常运行数据中提取所述操作系统版本信息;从所述异常运行数据中提取所述异常信号;从所述异常运行数据中提取所述目标应用程序的线程数量,根据所述线程数量,确定所述线程数量级别;根据所述异常运行数据中记录的所述目标应用程序的异常运行日志,确定所述目标应用程序崩溃前出现预设异常的次数;从所述异常运行数据中提取所述目标应用程序的异常堆栈关键字,根据所述异常堆栈关键字,确定所述异常堆栈类型
。8.
根据权利要求1所述的方法,其特征在于,确定所述异常运行原因类型和所述数据指标值之间的对应关系,包括:获取所述异常运行原因类型与所述异常运行数据之间的对应关系,和,所述异常运行数据与所述数据指标值之间的从属关系;根据所述异常运行原因类型与所述异常运行数据之间的对应关系,和,所述异常运行数据与所述数据指标值之间的从属关系,确定所述异常运行原因类型与所述数据指标值之间的对应关系
。9.
根据权利要求1所述的方法,其特征在于,所述异常运行原因类型包括以下类型中的至少一种:所述目标应用程序所在的用户终端的运行内存小于预设最小值;所述目标应用程序的文件描述符超出预设最大值;所述目标应用程序的线程数量多于预设最大数量;所述目标应用程序存在空指针异常;所述目标应用程序存在野指针引起内存异常访问...

【专利技术属性】
技术研发人员:陈海东朱星鑫
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1