数据处理方法、装置及设备制造方法及图纸

技术编号:30696021 阅读:31 留言:0更新日期:2021-11-06 09:31
本申请实施例提供一种数据处理方法、装置及设备,该方法包括:获取多个停机账号的特征信息,所述特征信息包括所述账号对应的用户行为信息和所述账号对应的资费信息;根据所述多个停机账号的特征信息对所述多个停机账号进行聚类处理,得到第一聚类结果;对每个账号对应的特征信息进行异常识别处理,得到每个账号的账号状态,所述账号状态为正常状态或者异常状态;根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号;通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号,所述目标账号为异常停机账号。可以快速的确定异常停机账号,提高了确定异常停机账号的效率。机账号的效率。机账号的效率。

【技术实现步骤摘要】
数据处理方法、装置及设备


[0001]本申请涉及电信
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]电信业务运营支撑系统(Business&Operation Support System,BOSS)用于向终端设备(例如,手机等)提供服务。终端设备中可以安装用户身份识别(Subscriber Identification Module,SIM)卡,每个SIM卡有其对应的账号,当BOSS异常时,终端设备中SIM卡对应的账号可能会发生异常停机。
[0003]在相关技术中,通常采用如下方式检测是否存在账号异常停机:获取预设时段内,发生停机的账号的数量。若预设时段内发生停机的账号的数量大于预设阈值,则确定存在账号异常停机。在确定存在账号异常停机时,通常需要人为排查,以确定发生异常停机账号。然而,在上述过程中,通常需要在大量账号异常停机之后,才能人为进行排查以确定异常停机账号,该过程耗时较长,导致确定异常停机账号的效率较差。

技术实现思路

[0004]本申请涉及一种数据处理方法、装置及设备,可以快速的确定异常停机账号,提高了确定异常停机账号的效率。
[0005]第一方面,本申请实施例提供一种数据处理方法,包括:
[0006]获取多个停机账号的特征信息,所述特征信息包括所述账号对应的用户行为信息和所述账号对应的资费信息;
[0007]根据所述多个停机账号的特征信息对所述多个停机账号进行聚类处理,得到第一聚类结果;
[0008]对每个账号对应的特征信息进行异常识别处理,得到每个账号的账号状态,所述账号状态为正常状态或者异常状态;
[0009]根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号,所述第一账号为疑似异常停机账号;
[0010]通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号,所述目标账号为异常停机账号。
[0011]在一种可能的实施方式中,根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号,包括:
[0012]根据所述第一聚类结果,在所述多个停机账号中确定多个第二账号,所述第二账号为疑似异常停机账号;
[0013]将所述多个停机账号中,账号状态为异常状态的账号确定为所述多个第三账号,所述第三账号为疑似异常停机账号;
[0014]根据所述多个第二账号和所述多个第三账号,确定所述多个第一账号。
[0015]在一种可能的实施方式中,所述第一聚类结果中包括多个聚类集合,每个聚类集
合中包括所述多个停机账号中的至少一个账号;根据所述第一聚类结果,在所述多个停机账号中确定多个第二账号,包括:
[0016]根据所述多个聚类集合,在所述多个停机账号中确定多个第四账号,所述第四账号不属于任意一个聚类集合;
[0017]确定每个聚类集合的聚类中心;
[0018]针对任意一个第四账号,获取所述第四账号与每个聚类中心之间的距离;
[0019]将所述多个第四账号中与每个聚类中心之间的距离均大于或等于第一阈值的账号确定为所述多个第二账号。
[0020]在一种可能的实施方式中,根据所述多个第二账号和所述多个第三账号,确定所述多个第一账号,包括:
[0021]将所述多个第二账号和所述多个第三账号中相同的账号,确定为所述多个第一账号;或者,
[0022]确定所述多个第一账号包括所述多个第二账号和所述多个第三账号。
[0023]在一种可能的实施方式中,针对所述多个停机账号中的任意一个账号;对所述账号对应的特征信息进行异常识别处理,得到所述账号对应的账号状态,包括:
[0024]按照时间先后顺序,对所述账号对应的特征信息进行排序得到特征序列;
[0025]获取预设序列集合,所述预设序列集合中包括多个预设序列;
[0026]若所述预设序列集合中包括所述特征序列,则确定所述账号状态为正常状态;
[0027]若所述预设序列集合中不包括所述特征序列,则确定所述账号状态为异常状态。
[0028]在一种可能的实施方式中,通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号,包括:
[0029]通过所述第一模型对每个第一账号的特征信息进行处理,以得到每个第一账号对应的账号类型,所述账号类型为未停机类型、正常停机类型或者异常停机类型;
[0030]将账号类型为异常停机类型的账号确定为所述至少一个目标账号。
[0031]在一种可能的实施方式中,通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号之前,还包括:
[0032]获取多组训练样本,每组训练样本中包括样本特征信息和样本账号类型,所述样本账号类型为未停机类型、正常停机类型或者异常停机类型;
[0033]通过所述多组训练样本对初始模型进行训练,得到所述第一模型。
[0034]在一种可能的实施方式中,获取多个停机账号的特征信息,还包括:
[0035]获取所述多个停机账号的账号信息;
[0036]对所述账号信息进行选择处理、清洗处理、以及量化计算,得到所述特征信息。
[0037]第二方面,本申请实施例提供一种数据处理装置,包括获取模块、聚类处理模块、异常识别处理模块、第一确定模块和第二确定模块,其中,
[0038]所述获取模块用于,获取多个停机账号的特征信息,所述特征信息包括所述账号对应的用户行为信息和所述账号对应的资费信息;
[0039]所述聚类处理模块用于,根据所述多个停机账号的特征信息对所述多个停机账号进行聚类处理,得到第一聚类结果;
[0040]所述异常识别处理模块用于,对每个账号对应的特征信息进行异常识别处理,得
到每个账号的账号状态,所述账号状态为正常状态或者异常状态;
[0041]所述第一确定模块用于,根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号,所述第一账号为疑似异常停机账号;
[0042]所述第二确定模块用于通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号,所述目标账号为异常停机账号。
[0043]在一种可能的实施方式中,所述第一确定模块具体用于:
[0044]根据所述第一聚类结果,在所述多个停机账号中确定多个第二账号,所述第二账号为疑似异常停机账号;
[0045]将所述多个停机账号中,账号状态为异常状态的账号确定为所述多个第三账号,所述第三账号为疑似异常停机账号;
[0046]根据所述多个第二账号和所述多个第三账号,确定所述多个第一账号。
[0047]在一种可能的实施方式中,所述第一聚类结果中包括多个聚类集合,每个聚类集合中包括多个停机账号,所述第一确定模块具体用于:...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取多个停机账号的特征信息,所述特征信息包括所述账号对应的用户行为信息和所述账号对应的资费信息;根据所述多个停机账号的特征信息对所述多个停机账号进行聚类处理,得到第一聚类结果;对每个账号对应的特征信息进行异常识别处理,得到每个账号的账号状态,所述账号状态为正常状态或者异常状态;根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号,所述第一账号为疑似异常停机账号;通过第一模型对多个第一账号的特征信息进行处理,以在所述多个第一账号中确定至少一个目标账号,所述目标账号为异常停机账号。2.根据权利要求1所述的数据处理方法,其特征在于,根据所述第一聚类结果和每个账号对应的账号状态,在所述多个停机账号中确定多个第一账号,包括:根据所述第一聚类结果,在所述多个停机账号中确定多个第二账号,所述第二账号为疑似异常停机账号;将所述多个停机账号中,账号状态为异常状态的账号确定为所述多个第三账号,所述第三账号为疑似异常停机账号;根据所述多个第二账号和所述多个第三账号,确定所述多个第一账号。3.根据权利要求2所述的数据处理方法,其特征在于,所述第一聚类结果中包括多个聚类集合,每个聚类集合中包括所述多个停机账号中的至少一个账号;根据所述第一聚类结果,在所述多个停机账号中确定多个第二账号,包括:根据所述多个聚类集合,在所述多个停机账号中确定多个第四账号,所述第四账号不属于任意一个聚类集合;确定每个聚类集合的聚类中心;针对任意一个第四账号,获取所述第四账号与每个聚类中心之间的距离;将所述多个第四账号中与每个聚类中心之间的距离均大于或等于第一阈值的账号确定为所述多个第二账号。4.根据权利要求2或3所述的数据处理方法,其特征在于,根据所述多个第二账号和所述多个第三账号,确定所述多个第一账号,包括:将所述多个第二账号和所述多个第三账号中相同的账号,确定为所述多个第一账号;或者,确定所述多个第一账号包括所述多个第二账号和所述多个第三账号。5.根据权利要求1

4任一项所述的数据处理方法,其特征在于,针对所述多个停机账号中的任意一个账号;对所述账号对应的特征信息进行异常识别处理,得到所述账号对应的账号状态,包括:按照时间先后顺序,对所述账号对应的特征信息进行排序得到特征序列;获取预设序列集合,所述预设序列集合中包括多个预设序列;若所述预设序列集合中包括所述特征序列,则确定所述账号状态为正常状态;若所述预设序列集合中不包括所述特征序列,则确定所述账号状态为异常状态。
6.根据权利要求1

【专利技术属性】
技术研发人员:赵恒涛崔涛胡艺怀臧林邦高晓兵
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1