【技术实现步骤摘要】
本专利技术涉及计算机应用领域,具体而言,涉及一种信息处理方法及装置。
技术介绍
目前,对垃圾短信的发现主要是依赖于客户举报处理,但是现在垃圾短信的发送手段很隐蔽,通过短信群发器和伪基站等以手机号码的形式群发消息,同时短信的内容也多样化,使得原有的治理方案和识别规则产生误拦、漏拦等问题,无法有针对性的提升垃圾短信监控和识别的能力。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种信息处理方法及装置,以解决上述问题。第一方面,本专利技术实施例提供一种信息处理方法,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。第二方面,本专利技术实施例提供一种信息处理装置,所述装置包括:第一获取模块,用于获取待处理数据,所述待 ...
【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。2.根据权利要求1所述的方法,其特征在于,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量,包括:分别计算各个预设字段下,不同用户类别对应的字段值的差异值;分别计算各个字段对应的信息增益;根据所述差异值以及所述信息增益,从所述多个预设字段中选取预设模型的输入变量。3.根据权利要求1所述的方法,其特征在于,获取待处理数据,所述待处理数据包括多个用户终端手机号及所述各个用户终端手机号分别对应的各个预设字段的值,包括:获取待处理数据,所述待处理数据包括多个用户终端手机号及所述各个用户终端手机号分别对应的第一预设字段集合中各个预设字段的值;对所述待处理数据进行预处理,分别获取所述各个用户终端手机号分别对应的第二预设字段集合中各个预设字段的值。4.根据权利要求1所述的方法,其特征在于,所述预设模型包括神经网络算法模块、决策树算法模型、逻辑回归算法模型。5.根据权利要求1所述的方法,其特征在于,在所述根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准之后,所述方法还包括:获取待验证数据,所述待验证数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别;根据所述筛选标准,分别确定所述待验证数据中各个用户终端手机号的预测号码类别;根据所述预测号码类别与获取到的待验证数据中的用户终端手机号码的号码类别,计算预测的准确率及召回率;当所述准确率小于第一预设阈值或所述召回率小于第二预设阈值时,重新从所述多个预设字段中选取预设模型的输入变量;根据重新确定的输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并...
【专利技术属性】
技术研发人员:李存昌,张鹏程,
申请(专利权)人:成都九鼎瑞信科技股份有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。