搜索数据的处理方法及装置制造方法及图纸

技术编号:14014714 阅读:48 留言:0更新日期:2016-11-17 20:28
本公开涉及一种搜索数据的处理方法及装置,其中的方法包括:上传在搜索引擎中的第一搜索数据至云数据平台;筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取所述第二搜索数据,以及所述第二搜索数据的标识信息;根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。本公开的有益效果为:通过云数据平台对用户的第一搜索数据进行计算得出该用户的信用权重,从而完成对该该用户的金融行为的分析,很好地通过第一搜索数据实现了用户的金融行为作出评价判断,并且对用户的金融画像方面的刻画也起到了十分重要的作用。

【技术实现步骤摘要】

本公开实施例涉及数据处理
,尤其涉及一种搜索数据的处理方法及装置
技术介绍
在传统金融贷款业务的过程中,银行需要对客户的各种信息(如身份信息、存款贷款、工作信息、每月流水、不动资产等)进行征信协查,这些信息有些可以通过各大银行实现互联的网络数据平台获取,有些却需要银行相关的业务人员预审以及实地查看客户的各个数据信息,花费周期漫长,造成了传统金融贷款的效率低下。而在移动互联网时代,通过移动终端用户的行为对用户信用进行评估,即通过行为金融学的方式评估用户的信用,从而实现终端用户的贷款业务,是目前终端中逐渐成熟的一种方式,跟传统金融贷款比,行为金融贷款不需要太多人工干预,它是根据用户日常生活中的行为在终端中得到的体现,刻画用户的金融画像,进而评估用户的信用实现其信用贷款的方式。用户用户画像一词具有很重要的场景因素,以数据描述和了解客户,人是异常复杂的动物,信息纬度也非常复杂,仅通过外部的数据来进行人物的刻画是十分低端的,信用信息和人口属性为主,强相关信息,忽略弱关联信息,权重值以上的可以作为其用户画像的刻画数据,用户刻画时的几个纬度如人口属性、信用纬度、消费特征、兴趣爱好、社交信息等,画像数据的整理和集中,找到同业务场景中相关的数据,对数据进行分类和标签化,并根据业务需要判断是否需要引入外部数据,如银行信征中心、社交软件等,本公开提供了一种通过对个人的第一搜索数据的处理可得出对应用户的信用评价的方法。而如何使用户行为在终端中的体现转化成确切的数据,从而使这些数据更好地判断用户的信用级别,进而服务于金融风险控制,是目前亟需解决的一个问题。公开内容本公开提供一种搜索数据的处理方法及装置,使得通过用户终端中的第一搜索数据的处理得出对应的行为及其信用评价,从而更好地实现对用户的行为的判断。第一方面,本公开实施例提供了一种搜索数据的处理方法,所述方法包括:上传若干用户在搜索引擎中的第一搜索数据至云数据平台;筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取所述第二搜索数据,以及所述第二搜索数据的标识信息;根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。本公开的实施例提供的技术方案可以包括以下有益效果:通过云数据平台对第一搜索数据进行筛选得出其中权重较大的第二搜索数据以及各第二搜索数据对应的标识信息,通过该标识信息以及第二搜索数据在搜索引擎内出现的第一搜索数据的比重,计算得出信用权重,从而完成对用户的金融行为的分析,无须再花费大量人力物力对该用户的实际金融情形考察,很好地通过第一搜索数据实现了用户的金融行为作出评价判断,并且对用户的金融画像方面的刻画也起到了十分重要的作用。结合另一方面,在另一方面的一种可能的实现方式中,所述上传在搜索引擎中的第一搜索数据至云数据平台之前,包括:获取在各搜索引擎中的浏览数据集合;获取所述浏览数据集合中每项浏览数据的使用频率;比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据;所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。本公开的实施例提供的技术方案可以包括以下有益效果:在将第一搜索数据上传到云数据平台之前,可进一步对搜索引擎中出现的浏览数据进行筛选以得到待上传的第一搜索数据,对于使用频率低于预设使用频率的无作用浏览数据作出丢弃操作,从而使得在第一搜索数据的源头上保证了第一搜索数据的质量。结合另一方面,在另一方面的一种可能的实现方式中,获取所述第二搜索数据,以及所述第二搜索数据的标识信息时,包括:获取每一所述第二搜索数据的出现次数;将出现次数最多的第二搜索数据作为聚类数据;获取所述聚类数据在所述云数据平台中的标识信息。本公开的实施例提供的技术方案可以包括以下有益效果:通过在第二搜索数据中出现次数最多的第二搜索数据作为聚类数据,并且获取该聚类数据在云数据平台上被打上的标识信息,该标识信息为对第二搜索数据的聚类结果作出的标签,该标签能够反应该用户最经常进行的金融行为,进而可反映出该用户金融行为所对应的信用评价。结合另一方面,在另一方面的一种可能的实现方式中,所述上传若干用户在搜索引擎中的第一搜索数据至云数据平台时,包括:获取在搜索引擎中的浏览数据;按照数据属性对各所述浏览数据进行划分,以得到类型权重;将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。本公开的实施例提供的技术方案可以包括以下有益效果:对用户的搜索引擎中出现的浏览数据的另一种筛选方式,通过数据属性对浏览数据进行划分,从而得到类型权重大于预设阈值的浏览数据上传,使得通过较为准确地获取该用户的标识信息,从而更准确地对该用户的金融行为作出信用评价。结合另一方面,在另一方面的一种可能的实现方式中,根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重,包括:根据第一搜索数据判断得出应用场景;根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;根据所述关联比重以及标识信息得到对应的信用权重。本公开的实施例提供的技术方案可以包括以下有益效果:数据关联强度可作为对信用评价的一处常量K,通过该常量K使得得出信用权重时各用户站在同统一的评价标准,从而使得用户的信用权重更为客观,更接近于真实的用户的信用评价。结合另一方面,在另一方面的一种可能的实现方式中,上传在搜索引擎中的第一搜索数据至云数据平台时,包括:获取各所述第一搜索数据的应用场景;对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。本公开的实施例提供的技术方案可以包括以下有益效果:各所述第一搜索数据的应用场景的粗粒度分析,同样地作为对第一搜索数据的一种筛选方式,可以通过一定的筛选规则得出第二搜索数据,通过粗粒度分析的方式可使得所述第一搜索数据能够得到更为准确的分类结果。第二方面,本公开还提供了一种搜索数据的处理装置,其具体的技术方案包括如下:上传模块,被配置用于上传在搜索引擎中的第一搜索数据至云数据平台;筛选模块,被配置用于筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取模块,被配置用于获取所述第二搜索数据,以及所述第二搜索数据的标识信息;权重计算模块,被配置用于根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得的信用权重。结合另一方面,在另一方面的一种可能的实现方式中,所述装置还包括:浏览获取模块,被配置用于获取所述在各搜索引擎中的浏览数据集合;频率获取模块,被配置用于获取所述浏览数据集合中每项浏览数据的使用频率;比较模块,被配置用于比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据,丢弃使用频率小于预设使用频率的浏览数据;其中,所述上传模块中的所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。结合另一方面,在另一方面的一种可能的实现方式中,所述权重计算模块还包括:次数获取模块,被配置用于获取每一所述第二搜索数据的出现次数;聚类数据模块,被配置用于将出现次数最本文档来自技高网...
搜索数据的处理方法及装置

【技术保护点】
一种搜索数据的处理方法,其特征在于,所述方法包括:上传在搜索引擎中的第一搜索数据至云数据平台;筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取所述第二搜索数据,以及所述第二搜索数据的标识信息;根据所述第二搜索数据的标识信息,以及在所述搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

【技术特征摘要】
1.一种搜索数据的处理方法,其特征在于,所述方法包括:上传在搜索引擎中的第一搜索数据至云数据平台;筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取所述第二搜索数据,以及所述第二搜索数据的标识信息;根据所述第二搜索数据的标识信息,以及在所述搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。2.根据权利要求1所述的方法,其特征在于,所述上传在搜索引擎中的第一搜索数据至云数据平台之前,包括:获取在各搜索引擎中的浏览数据集合;获取浏览数据集合中每项浏览数据的使用频率;比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据;所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。3.根据权利要求1所述的方法,其特征在于,获取所述第二搜索数据,以及所述第二搜索数据的标识信息时,包括:获取每一所述第二搜索数据的出现次数;将出现次数最多的第二搜索数据作为聚类数据;获取所述聚类数据在所述云数据平台中的标识信息。4.根据权利要求1所述的方法,其特征在于,所述上传在搜索引擎中的第一搜索数据至云数据平台时,包括:获取在搜索引擎中的浏览数据;按照数据属性对各所述浏览数据进行划分,以得到类型权重;将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。5.根据权利要求4所述的方法,其特征在于,根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重,包括:根据第一搜索数据判断得出应用场景;根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;根据所述关联比重以及标识信息得到对应的信用权重。6.根据权利要求1所述的方法,其特征在于,所述上传在搜索引擎中的第一搜索数据至云数据平台时,包括:获取各所述第一搜索数据的应用场景;对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。7.一种搜索数据的处理装置,其特征在于,所述装置包括:上传模块,被配置用于上传在搜索引擎中的第一搜索数据至云数据平台;筛选模块,被配置用于筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;获取模块,被配置用于获取所述第二搜索数据,以及所述第二搜索数据的标识信息;权重计算模块,被配置用于根据所述第二搜索数据的标识...

【专利技术属性】
技术研发人员:刘铁俊张鹏飞林形省
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1