关联规则提取方法、装置、设备及存储介质制造方法及图纸

技术编号:37713510 阅读:12 留言:0更新日期:2023-06-02 00:07
本申请提供一种关联规则提取方法、装置、设备及存储介质。该方法包括:根据第一预设告警属性的不同属性值,将原始告警数据集划分为多个原始告警数据子集;根据预设时间窗和预设步长,从各原始告警数据子集中划分出多个初始告警数据集;根据预先存储的多个预设告警属性与数字标识映射关系,将各初始告警数据集中的各预设告警属性修改为对应的数字标识,获得各原始告警数据子集的多个标识化告警数据集;采用预设关联规则提取算法,从多个标识化告警数据集中提取存在关联规则的告警信息组合;告警信息组合由两个或三个告警信息组成。本申请的方案,能够减小提取关联规则的计算复杂度,提高提取关联规则的效率。高提取关联规则的效率。高提取关联规则的效率。

【技术实现步骤摘要】
关联规则提取方法、装置、设备及存储介质


[0001]本申请涉及通信技术,尤其涉及一种关联规则提取方法、装置、设备及存储介质。

技术介绍

[0002]假设I是项的集合,数据库D中包括多个事务,每个事务为I的非空子集。对于包括两个项的关联规则,其在D中的支持度是指在两个项同时出现在D的一个事务中的概率,其在D中的置信度是指两个项中的一项在一件事务中出现后,另一项在同一件事务中出现的概率。
[0003]关联规则是否有价值,需要通过关联规则的支持度和置信度来确定。对于运营商告警信息,有价值的关联规则可以用于对设备故障进行预警或预测。关联规则的支持度和置信度的计算,需要遍历数据库,确定出各个项的频次和各个关联规则的频次。因此,对于数据量越大的数据库,提取出关联规则的计算复杂度越高、效率越低。而运营商告警信息的平均字符长度超过60,种类多达上万,随着告警信息的数量和种类的增加,现有服务器难以从告警信息中提取出中有价值的关联规则。
[0004]综上,现有的关联规则提取方法,存在计算复杂度高、计算效率低,进而难以从告警数据中提取出有价值的关联规则的问题。

技术实现思路

[0005]本申请提供一种关联规则提取方法、装置、设备及存储介质,用以解决现有技术中关联规则提取方法的计算复杂度高、计算效率低,难以从告警数据中提取出有价值的关联规则的问题。
[0006]根据本申请的第一方面,提供一种关联规则提取方法,包括:
[0007]根据第一预设告警属性的不同属性值,将原始告警数据集划分为多个原始告警数据子集;
[0008]根据预设时间窗和预设步长,从各原始告警数据子集中划分出多个初始告警数据集;所述初始告警数据集包括多个初始告警信息,所述初始告警信息包括多个预设告警属性;
[0009]根据预先存储的多个预设告警属性与数字标识映射关系,将各初始告警数据集中的各预设告警属性修改为对应的数字标识,获得各原始告警数据子集的多个标识化告警数据集;
[0010]采用预设关联规则提取算法,从多个标识化告警数据集中提取存在关联规则的告警信息组合;所述告警信息组合由两个或三个告警信息组成。
[0011]作为一种可选的实施方式,所述原始告警数据集包括多个原始告警信息,所述原始告警信息包括多个预设告警属性,所述第一预设告警属性为多个预设告警属性中的一个;
[0012]所述根据第一预设告警属性的不同属性值,将原始告警数据集划分为多个原始告
警数据子集,包括:
[0013]将第一预设告警属性的属性值相同的原始告警信息划分为同一个原始告警数据子集。
[0014]作为一种可选的实施方式,所述原始告警信息还包括告警发生时间和告警取消时间;
[0015]所述根据预设时间窗和预设步长,从各原始告警数据子集中划分出多个初始告警数据集,包括:
[0016]按照预设时间窗和预设步长,在各原始告警数据子集上进行滑窗,划分出多个初始告警时间段;
[0017]将各初始告警时间段内,满足预设条件的原始告警信息确定为各初始告警数据集中的初始告警信息;所述预设条件为告警发生时间在初始告警时间段之内,且告警取消时间在初始告警时间段之外。
[0018]作为一种可选的实施方式,所述多个预设告警属性与数字标识映射关系中包括:各预设告警属性的多个属性值对应的数字标识;
[0019]所述根据预先存储的多个预设告警属性与数字标识映射关系,将各初始告警数据集中的各预设告警属性修改为对应的数字标识,获得各原始告警数据子集的多个标识化告警数据集,包括:
[0020]对于每一个初始告警信息的每一个预设告警属性,在所述预设告警属性与数字标识映射关系中查询该预设告警属性的属性值对应的数字标识;
[0021]将该预设告警属性的属性值修改为对应的数字标识;
[0022]遍历各初始告警信息的各预设告警属性,获得各原始告警数据子集的多个标识化告警数据集。
[0023]作为一种可选的实施方式,所述标识化告警数据集中包括多个告警标识,所述告警标识由初始告警信息的各预设告警属性对应的数字标识组成;
[0024]所述采用预设关联规则提取算法,从多个标识化告警数据集中提取存在关联规则的告警信息组合,包括:
[0025]计算各告警标识组合在各原始告警数据子集中的合并频数;所述合并频数为各原始告警数据子集中包括各告警标识组合的标识化告警数据集的个数;所述告警标识组合由两个或三个告警标识组成;
[0026]根据各告警标识组合的所述合并频数、各原始告警数据子集中标识化告警数据集的数量、以及原始告警数据子集的数量,计算各告警标识组合在各原始告警数据子集中的关联支持度,以及各告警标识组合在原始告警数据集中的关联置信度;
[0027]根据各告警标识组合的所述关联支持度,以及各告警标识组合的所述关联置信度,确定存在关联规则的告警标识组合;
[0028]根据所述多个预设告警属性与数字标识映射关系,将所述告警标识组合中的两个或三个告警标识修改为对应的告警信息,获得存在关联规则的告警信息组合。
[0029]作为一种可选的实施方式,所述计算各告警标识组合的合并频数,包括:
[0030]遍历各标识化告警数据集中的各告警标识,确定各告警标识组合在各标识化告警数据集中是否出现;
[0031]若确定告警标识组合在标识化告警数据集中出现,则将告警标识组合在标识化告警数据集中的合并频数确定为1;若确定告警标识组合在标识化告警数据集中未出现,则将告警标识组合在标识化告警数据集中的合并频数确定为0;
[0032]将各告警标识组合在属于同一原始告警数据子集的多个标识化告警数据集中的合并频数之和确定为各告警标识组合在各原始告警数据子集中的合并频数。
[0033]作为一种可选的实施方式,所述根据各告警标识的所述合并频数、各原始告警数据子集中标识化告警数据集的数量、以及原始告警数据子集的数量,计算各告警标识组合在各原始告警数据子集中的关联支持度,以及各告警标识组合在原始告警数据集中的关联置信度,包括:
[0034]将各告警标识组合在各原始告警数据子集中的合并频数与各原始告警数据子集中标识化告警数据集的数量的比值,确定为各告警标识组合在各原始告警数据子集中的关联支持度;
[0035]根据各告警标识组合在各原始告警数据子集中的合并频数不为零的数量与原始告警数据子集的数量的比值,确定为各告警标识组合在原始告警数据集中的关联置信度。
[0036]作为一种可选的实施方式,所述根据各告警标识组合的所述关联支持度,以及各告警标识组合的所述关联置信度,确定存在关联规则的告警标识组合,包括:
[0037]获取各告警标识组合的预设权重;
[0038]采用预设权重对各告警标识组合的所述关联支持度进行加权计算;
[0039]将加权计算后的所述关联支持度大于或等于预设支持度、且所述关联置信度大于或等于预设置信度的告警标识组合确定为候选标识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关联规则提取方法,其特征在于,包括:根据第一预设告警属性的不同属性值,将原始告警数据集划分为多个原始告警数据子集;根据预设时间窗和预设步长,从各原始告警数据子集中划分出多个初始告警数据集;所述初始告警数据集包括多个初始告警信息,所述初始告警信息包括多个预设告警属性;根据预先存储的多个预设告警属性与数字标识映射关系,将各初始告警数据集中的各预设告警属性修改为对应的数字标识,获得各原始告警数据子集的多个标识化告警数据集;采用预设关联规则提取算法,从多个标识化告警数据集中提取存在关联规则的告警信息组合;所述告警信息组合由两个或三个告警信息组成。2.根据权利要求1所述的方法,其特征在于,所述原始告警数据集包括多个原始告警信息,所述原始告警信息包括多个预设告警属性,所述第一预设告警属性为多个预设告警属性中的一个;所述根据第一预设告警属性的不同属性值,将原始告警数据集划分为多个原始告警数据子集,包括:将第一预设告警属性的属性值相同的原始告警信息划分为同一个原始告警数据子集。3.根据权利要求2所述的方法,其特征在于,所述原始告警信息还包括告警发生时间和告警取消时间;所述根据预设时间窗和预设步长,从各原始告警数据子集中划分出多个初始告警数据集,包括:按照预设时间窗和预设步长,在各原始告警数据子集上进行滑窗,划分出多个初始告警时间段;将各初始告警时间段内,满足预设条件的原始告警信息确定为各初始告警数据集中的初始告警信息;所述预设条件为告警发生时间在初始告警时间段之内,且告警取消时间在初始告警时间段之外。4.根据权利要求1所述的方法,其特征在于,所述多个预设告警属性与数字标识映射关系中包括:各预设告警属性的多个属性值对应的数字标识;所述根据预先存储的多个预设告警属性与数字标识映射关系,将各初始告警数据集中的各预设告警属性修改为对应的数字标识,获得各原始告警数据子集的多个标识化告警数据集,包括:对于每一个初始告警信息的每一个预设告警属性,在所述预设告警属性与数字标识映射关系中查询该预设告警属性的属性值对应的数字标识;将该预设告警属性的属性值修改为对应的数字标识;遍历各初始告警信息的各预设告警属性,获得各原始告警数据子集的多个标识化告警数据集。5.根据权利要求1所述的方法,其特征在于,所述标识化告警数据集中包括多个告警标识,所述告警标识由初始告警信息的各预设告警属性对应的数字标识组成;所述采用预设关联规则提取算法,从多个标识化告警数据集中提取存在关联规则的告警信息组合,包括:
计算各告警标识组合在各原始告警数据子集中的合并频数;所述合并频数为各原始告警数据子集中包括各告警标识组合的标识化告警数据集的个数;所述告警标识组合由两个或三个告警标识组成;根据各告警标识组合的所述合并频数、各原始告警数据子集中标识化告警数据集的数量、以及原始告警数据子集的数量,计算各告警标识组合在各原始告警数据子集中的关联支持度,以及各告警标识组合在原始告警数据集中的关联置信度;根据各告警标识组合的所述关联支持度,以及各告警标识组合的所述关联置信度,确定存在关联规则的告警标识组合;根据所述多个预设告警属性与数字标识映射关系,将所述告警标识组合中的两个或三个告警标识修改为对应的告警信息,获得存在关联规则的告警信息组合。6.根据权利要求5所述的方法,其特征在于,所述计算各告警标识组合的合并频数,包括:遍历各标识化告警数据集中的各告警标识,确定各告警标识组合在各标识化告...

【专利技术属性】
技术研发人员:朱宏邓程徐新星侍晶晶宋文杰夏明宇兰婷
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1