一种数据处理方法及服务器技术

技术编号:14903705 阅读:66 留言:0更新日期:2017-03-29 18:57
本发明专利技术公开了一种数据处理方法及服务器,其中,所述方法包括:接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。

Data processing method and server

The invention discloses a data processing method and server, wherein, the method comprises: receiving the request data, get the characteristic variables to be processed from the request data, the variables to be processed with the first attribute; obtain derivative strategies, cross combinations can be combined according to the characteristics of the characteristic variables the derivation strategy needs to be processed, derived variables, the variables have second attributes, the attributes of second compared to the first characteristic attribute is closer to the expected target; obtaining screening strategies according to the screening strategy of the derived variables were selected to obtain the candidate target variables will be; the candidate target variables added for variables storing the pending variable pool in derivative and the strategy according to the screening strategy A round of variable derivation and variable selection, until the desired target is met.

【技术实现步骤摘要】

本专利技术涉及互联网技术,尤其涉及一种数据处理方法及服务器。
技术介绍
随着互联网技术的发展,智能终端的大量普及,数据传输和交互越来越便捷。移动互联网时代的传输和交互比传统的互联网时代更加方便。比如,用户现在可以用手机终端缴水、电或煤气费、购买理财产品等,这些都需要用到移动支付,给人们的生活带来便利的同时,也容易带来数据安全隐患。为了提高安全性,需要对数据进行分析,以从中区分出哪些是会带来数据安全隐患的风险数据。采用现有的风险控制策略进行分析时,由于其自身的局限性,对获取到的原始数据进行分析后得到的大多是弱变量,而弱变量不足以反映出数据所要表达的用户真实意图,也就是说,通过弱变量无法区分出数据中哪些是需要屏蔽或限制的风险数据,即恶意用户触发的数据,很有可能把本无恶意的用户所触发的数据进行了屏蔽或限制,影响到用户正常的使用需求。然而,相关技术中,对于该问题,尚无有效解决方案。
技术实现思路
有鉴于此,本专利技术实施例提供了一种数据处理方法及服务器,至少解决了现有技术存在的问题。本专利技术实施例的技术方案是这样实现的:本专利技术实施例的一种数据处理方法,所述方法包括:接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。上述方案中,所述根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,包括:从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述待处理的特征变量中的至少一个变量间是否具备可组合特征,如果具备可组合特征,则根据所述可组合特征进行交叉组合,得到至少一个特征组合;将所述至少一个特征组合与从所述变量池中获取的变量及备选的训练样本进行指定的特征衍生,得到所述衍生变量。上述方案中,所述将所述至少一个特征组合与从所述变量池中获取的变量及备选的训练样本进行指定的特征衍生,得到所述衍生变量,包括:从用于存储所述至少一个特征组合的特征组合池中随机选择一个第一特征组合;从所述第一特征组合中随机选取指定数量的特征;从所述备选的训练样本中随机选取指定数量的训练样本;根据所述指定数量的特征、所述获取的变量和所述指定数量的训练样本构建新的训练样本;根据所述新的训练样本生成决策树,所述决策树的输出变量为所述衍生变量。上述方案中,根据所述新的训练样本生成决策树,所述决策树的输出变量为所述衍生变量,包括:根据所述新的训练样本同时训练至少一个RDT,将每个RDT的训练作为一个决策树输出,每一个决策树对应一个新的衍生变量。上述方案中,所述方法还包括:所述得到候选的目标变量之后,从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述候选的目标变量是否具备强解释性,如果具备强解释性,则根据所述衍生策略对具备强解释性的目标变量进行可组合特征的交叉组合,得到新的衍生变量。本专利技术实施例的一种服务器,所述服务器包括:接收单元,用于接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;衍生处理单元,用于获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;筛选处理单元,用于获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;多轮迭代单元,用于将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。上述方案中,所述衍生处理单元,进一步用于:从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述待处理的特征变量中的至少一个变量间是否具备可组合特征,如果具备可组合特征,则根据所述可组合特征进行交叉组合,得到至少一个特征组合;将所述至少一个特征组合与从所述变量池中获取的变量及备选的训练样本进行指定的特征衍生,得到所述衍生变量。上述方案中,所述衍生处理单元,进一步用于:从用于存储所述至少一个特征组合的特征组合池中随机选择一个第一特征组合;从所述第一特征组合中随机选取指定数量的特征;从所述备选的训练样本中随机选取指定数量的训练样本;根据所述指定数量的特征、所述获取的变量和所述指定数量的训练样本构建新的训练样本;根据所述新的训练样本生成决策树,所述决策树的输出变量为所述衍生变量。上述方案中,所述衍生处理单元,进一步用于:根据所述新的训练样本同时训练至少一个RDT,将每个RDT的训练作为一个决策树输出,每一个决策树对应一个新的衍生变量。上述方案中,所述服务器还包括:新的衍生变量生成单元,用于:从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述候选的目标变量是否具备强解释性,如果具备强解释性,则根据所述衍生策略对具备强解释性的目标变量进行可组合特征的交叉组合,得到新的衍生变量。本专利技术实施例的数据处理方法包括:接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。采用本专利技术实施例,由于通过衍生策略可以对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求,则数据更趋近需求,通过筛选策略对所述衍生变量进行筛选,得到候选的目标变量,则数据更趋于精确,且缩小了范围,通过所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求,多轮的迭代处理使得数据与目标预期需求相符合,最终,通过多轮的迭代处理得到的数据,能区分出数据中哪些是需要屏蔽或限制的风险数据,以避免请求方把本无恶意的用户所触发的数据进行屏蔽或限制而影响到用户正常的使用需求,同时把恶意的用户所触发的数据进行屏蔽或限制,提高了数据安全性。附图说明图1为本专利技术实施例中进行信息交互的各方硬件实体的示意图;图2为本专利技术实施例一方法实现流程示意图;图3为本专利技术实施例又一方法实现流程示意图;图4为本专利技术实施例一系统架构组成示意图;图5为应用本专利技术实施例一特征衍生的示意图;图6为应用本专利技术实施例又一特征衍生的示意图;图7为应用本专利技术实施例一特征衍生和筛选的示意图;图8为应用本专利技术实施例一防欺诈服务的系统架构组成示意图;图9为应用本本文档来自技高网...

【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:接收请求数据,从所述请求数据中得到待处理的特征变量,所述待处理的特征变量具备第一特征属性;获取衍生策略,根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,所述衍生变量具备第二特征属性,所述第二特征属性相比所述第一特征属性更接近于目标预期需求;获取筛选策略,根据所述筛选策略对所述衍生变量进行筛选,得到候选的目标变量;将候选的目标变量加入用于存储所述待处理的特征变量的变量池,以根据所述衍生策略和所述筛选策略进行下一轮的变量衍生和变量筛选,直至符合目标预期需求。2.根据权利要求1所述的方法,其特征在于,所述根据所述衍生策略对所述待处理的特征变量进行可组合特征的交叉组合,得到衍生变量,包括:从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述待处理的特征变量中的至少一个变量间是否具备可组合特征,如果具备可组合特征,则根据所述可组合特征进行交叉组合,得到至少一个特征组合;将所述至少一个特征组合与从所述变量池中获取的变量及备选的训练样本进行指定的特征衍生,得到所述衍生变量。3.根据权利要求2所述的方法,其特征在于,所述将所述至少一个特征组合与从所述变量池中获取的变量及备选的训练样本进行指定的特征衍生,得到所述衍生变量,包括:从用于存储所述至少一个特征组合的特征组合池中随机选择一个第一特征组合;从所述第一特征组合中随机选取指定数量的特征;从所述备选的训练样本中随机选取指定数量的训练样本;根据所述指定数量的特征、所述获取的变量和所述指定数量的训练样本构建新的训练样本;根据所述新的训练样本生成决策树,所述决策树的输出变量为所述衍生变量。4.根据权利要求3所述的方法,其特征在于,根据所述新的训练样本生成决策树,所述决策树的输出变量为所述衍生变量,包括:根据所述新的训练样本同时训练至少一个RDT,将每个RDT的训练作为一个决策树输出,每一个决策树对应一个新的衍生变量。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:所述得到候选的目标变量之后,从所述衍生策略中提取用于特征分析的经验值;根据所述经验值判断所述候选的目标变量是否具备强解释性,如果具备强解释性,则根据所述衍生策略对具备强解释性...

【专利技术属性】
技术研发人员:韩忠凯
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1