信息处理方法及装置制造方法及图纸

技术编号:14384175 阅读:45 留言:0更新日期:2017-01-10 11:34
本发明专利技术实施例提供一种信息处理方法及装置,所述方法包括:获取待处理数据;计算不同号码类别下所述各个预设字段值的分布,根据所述各个分布,选取预设模型的输入变量;根据输入变量及待处理数据,选取一个筛选模型,并获取筛选标准;获取待测试数据;获取待测试用户终端手机号分别属于各个号码类别的概率值;判断待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定待测试用户终端手机号为异常号码类别,并根据所述概率值,确定监控等级。所述方法可以主动的发现待测试用户终端手机号是否为异常号码类别,并且主动进行监控,提升了垃圾短信监控和识别的能力。

【技术实现步骤摘要】

本专利技术涉及计算机应用领域,具体而言,涉及一种信息处理方法及装置
技术介绍
目前,对垃圾短信的发现主要是依赖于客户举报处理,但是现在垃圾短信的发送手段很隐蔽,通过短信群发器和伪基站等以手机号码的形式群发消息,同时短信的内容也多样化,使得原有的治理方案和识别规则产生误拦、漏拦等问题,无法有针对性的提升垃圾短信监控和识别的能力。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种信息处理方法及装置,以解决上述问题。第一方面,本专利技术实施例提供一种信息处理方法,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。第二方面,本专利技术实施例提供一种信息处理装置,所述装置包括:第一获取模块,用于获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算模块,用于计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;选取模块,用于根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;第二获取模块,用于获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;第三获取模块,用于根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断模块,用于判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。与现有技术相比,本专利技术实施例提供的一种信息处理方法及装置,通过获取到不同号码类别对应的数据,并根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准,通过所述筛选标准,就能识别出待测试用户终端手机号是否为异常号码类别,如果是,则可以确定所述待测试用户终端手机号的监控等级。这种方式,使得监控垃圾短信的方式可以不再被动的只依赖于客户举报,而是可以主动的发现待测试用户终端手机号是否为异常号码类别,并且主动进行监控,提升了垃圾短信监控和识别的能力。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1是本专利技术实施例提供的服务器的方框示意图。图2是本专利技术实施例提供的一种信息处理方法的流程图。图3是本专利技术实施例提供的一种信息处理方法的部分流程图。图4是本专利技术实施例提供的一种信息处理方法的部分流程图。图5是本专利技术实施例提供的一种信息处理方法的部分流程图。图6是本专利技术实施例提供的一种信息处理装置的功能模块示意图。图7是本专利技术实施例提供的一种信息处理装置中计算模块的功能模块示意图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性或时间先后。如图1所示,是所述服务器200的方框示意图。所述服务器200包括信息处理装置210、存储器220、存储控制器230、处理器240。所述存储器220、存储控制器230、处理器240各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述信息处理装置210包括至少一个可以软件或固件(firmware)的形式存储于所述存储器中或固化在所述服务端200的操作系统(operatingsystem,OS)中的软件功能模块。所述处理器240用于执行存储器220中存储的可执行模块,例如所述信息处理装置210包括的软件功能模块或计算机程序。其中,存储器220可以是,但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。其中,存储器220用于存储程序,所述处理器240在接收到执行指令后,执行所述程序,前述本专利技术实施例任一实施例揭示的流过程定义的服务端所执行的方法可以应用于处理器中,或者由处理器实现。处理器240可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本专利技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解,图1所示的结构仅为示意,服务器200还可包括比图1中所示更多或者更少的组件,或者具有与本文档来自技高网...
信息处理方法及装置

【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获取待处理数据,所述待处理数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别,所述号码类别包括普遍号码类别或异常号码类别;计算不同号码类别下,所述各个预设字段值的分布,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量;根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准;获取待测试数据,所述待测试数据包括待测试用户终端手机号及所述待测试用户终端手机号对应的多个预设字段的值;根据所述筛选标准,获取所述待测试用户终端手机号分别属于各个号码类别的概率值;判断所述待测试用户终端手机号属于异常号码类别的概率值是否大于预设阈值;如果是,确定所述待测试用户终端手机号为异常号码类别,并根据所述概率值,确定所述待测试用户终端手机号的监控等级。2.根据权利要求1所述的方法,其特征在于,根据所述不同用户类别下,所述各个预设字段值的分布,从所述多个预设字段中选取预设模型的输入变量,包括:分别计算各个预设字段下,不同用户类别对应的字段值的差异值;分别计算各个字段对应的信息增益;根据所述差异值以及所述信息增益,从所述多个预设字段中选取预设模型的输入变量。3.根据权利要求1所述的方法,其特征在于,获取待处理数据,所述待处理数据包括多个用户终端手机号及所述各个用户终端手机号分别对应的各个预设字段的值,包括:获取待处理数据,所述待处理数据包括多个用户终端手机号及所述各个用户终端手机号分别对应的第一预设字段集合中各个预设字段的值;对所述待处理数据进行预处理,分别获取所述各个用户终端手机号分别对应的第二预设字段集合中各个预设字段的值。4.根据权利要求1所述的方法,其特征在于,所述预设模型包括神经网络算法模块、决策树算法模型、逻辑回归算法模型。5.根据权利要求1所述的方法,其特征在于,在所述根据所述输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并获取所述筛选模型对应的筛选标准之后,所述方法还包括:获取待验证数据,所述待验证数据包括多个用户终端手机号、所述各个用户终端手机号分别对应的各个预设字段的值、以及所述用户终端手机号对应的号码类别;根据所述筛选标准,分别确定所述待验证数据中各个用户终端手机号的预测号码类别;根据所述预测号码类别与获取到的待验证数据中的用户终端手机号码的号码类别,计算预测的准确率及召回率;当所述准确率小于第一预设阈值或所述召回率小于第二预设阈值时,重新从所述多个预设字段中选取预设模型的输入变量;根据重新确定的输入变量以及待处理数据,从各个预设模型中选取一个作为筛选模型,并...

【专利技术属性】
技术研发人员:李存昌张鹏程
申请(专利权)人:成都九鼎瑞信科技股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1