本发明专利技术公开了一种身份关系数据库的生成方法及装置,该方法包括:采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值和矫正权重值;基于所述场景权重值和矫正权重值,计算所述身份关系的当前综合权重值;将所述身份关系及对应的综合权重值存入身份关系数据库。利用该方法,可以实现身份关系数据库的生成,所生成的身份关系数据库因身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后网民身份的归一化提供了有效的数据关系依据。
【技术实现步骤摘要】
本专利技术涉及计算机应用
,具体涉及一种身份关系数据库的生成方法和装置。
技术介绍
随着计算机和通信技术的发展,网络应用迅速普及,已成为人们生活中不可或缺的部分。与此同时,网络的安全防护也越来越得到人们的重视,由此出现了针对网络安全的网络数据分析,特别是对网民在不同网络应用的行为分析,从而基于分析结果实现网民的网络身份和现实身份一一对应的关系。在实现网络身份与现实身份的对应关系中,建立身份关系知识库是最重要的步骤,因为通过建立的身份关系知识库可以很快将网民的现实身份和真实身份进行匹配。传统的建立身份关系知识库的方法是直接在可靠的数据源中提取可靠的身份关系,基于提取的身份关系可以建立身份关系数据库。由于数据获取的可靠度无法度量,且数据的覆盖范围较窄,更新也很缓慢,从而使建立的身份关系库的可靠性、广泛性、实时性等也受到影响。
技术实现思路
本专利技术实施例提出一种身份关系数据库的方法和装置,以实现高可靠性、高广泛性且可实时更新的网民身份关系数据库的生成。—方面,本专利技术实施例提供了一种身份关系数据库的生成方法,包括:采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt ;基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt =场景权重值WSt*矫正权重值WTt,且0<fft<l ;将所述身份关系及对应的综合权重值存入身份关系数据库。另一方面,本专利技术实施例提供了一种身份关系数据库的生成装置,包括:数据场景形成模块,用于采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;中间值计算模块,用于获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt ;综合权重值计算模块,用于基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值wt,其中,所述身份关系的当前综合权重值wt =场景权重值WSt*矫正权重值WTt,且0〈wt〈l ;身份关系存储模块,用于将所述身份关系及对应的综合权重值存入身份关系数据库。本专利技术实施例中提供的一种身份关系数据库的生成方法及装置,首先根据所采集网络数据的数据来源进行数据场景的划分;然后在不同的数据场景中,获取相应数据场景的身份关系,并计算身份关系的场景权重值和矫正权重值;之后基于场景权重值和矫正权重值计算身份关系的当前综合权重值;最后将身份关系及对应的综合权重值存入身份关系数据库。利用该方法,可以实现身份关系数据库的生成,所生成的身份关系数据库因其中每个身份关系具有确定的权重值,而使数据库具有了高可靠性、高广泛性以及可实时更新的特点,且生成的身份关系数据库为之后实现网民身份的归一化提供了有效的数据关系依据。【附图说明】图1为本专利技术实施例一提供的一种身份关系数据库的生成方法的流程示意图;图2为本专利技术实施例二提供的一种身份关系数据库的生成方法的流程示意图;图3为本专利技术实施例三提供的一种身份关系数据库的生成方法的流程示意图;图4为本专利技术实施例四提供的一种身份关系数据库的生成装置的结构示意图。【具体实施方式】下面结合附图并通过【具体实施方式】来进一步说明本专利技术的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种身份关系数据库的生成方法的流程示意图,本专利技术实施例适用于生成网民身份关系数据库的情况,该方法可以由身份关系数据库的生成装置执行,其中该装置可由软件和/或硬件实现。如图1所示,本专利技术实施例提供的一种身份关系数据库的生成方法,包括如下操作步骤:步骤S101、采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据。在本实施例中,所述网络数据具体可指与网民身份信息相关联的上网数据。示例性的,可以是网民在各种应用程序上的注册帐号、网民注册帐号时相关的邮箱、手机号、身份证等网络数据。在本实施例中,所述数据来源具体指所采集的网络数据的来源,示例性的,可以是采集手机上网的数据、采集固定网络的上网数据、采集网吧的上网数据以及采集宾馆的上网数据等。基于网络数据采集方式的不同将网络数据划分为多个数据场景的网络数据。步骤S102、获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt。在本实施例中,基于数据来源划分数据场景后,需要对每个数据场景中的网络数据进行身份关系的权重计算操作。在权重计算之前需要先对数据场景的网络数据中网民身份相关联的上网数据进行一对一的关联,在数据场景中构成至少一个身份关系。在本实施例中,所述身份关系的场景权重值WSt主要用于衡量网络数据所包含的身份关系在相应数据场景中的可靠度,一般基于场景可靠度影响因子计算求得。所述身份关系的矫正权重值WTt从身份关系本身的可靠度出发,主要用于对身份关系的场景权重值进行矫正,一般基于可靠度矫正因子计算得到。进一步的,所述身份关系包括:网络数据中含有的身份证号、手机号、邮箱以及应用注册帐号中任意两个相关联形成的关系;或,所述身份证号、手机号、邮箱以及应用注册帐号的任一个与网络数据中含有的地址信息或上网设备信息相关联形成的关系。在本实施例中,所述网络数据中含有的地址信息具体为网民进行应用程序注册时填写的居住地的地址信息。所述上网设备信息具体为采集数据时基于不同数来源采集网络数据的上网设备的信息,示例性的,如手机或计算机的物理地址。具体的,数据场景中的身份关系的组成可以是身份证号-手机号、身份证号-邮箱、身份证号-应用注册帐号、手机号-邮箱以及邮箱-应用注册帐号等等两两形成的关系对。步骤S103、基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt =场景权当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种身份关系数据库的生成方法,其特征在于,包括:采集网民上网的网络数据,并对所述网络数据基于数据来源进行划分,形成多个数据场景的网络数据;获取所述数据场景中相应网络数据构成的至少一个身份关系并计算所述至少一个身份关系的场景权重值WSt和矫正权重值WTt;基于所述场景权重值WSt和矫正权重值WTt,计算所述身份关系的当前综合权重值Wt,其中,所述身份关系的当前综合权重值Wt=场景权重值WSt*矫正权重值WTt,且0<Wt<1;将所述身份关系及对应的综合权重值存入身份关系数据库。
【技术特征摘要】
【专利技术属性】
技术研发人员:陶小龙,刘中淼,王宇翔,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。