The invention discloses a method and a device for processing the device identification information. Among them, the processing method comprises the following steps: equipment data acquisition equipment composed of a plurality of devices including samples, samples, equipment records through each device identification algorithm of the equipment identification; acquisition equipment identification equipment sample error error data of the equipment; the number of equipment fault data of the equipment and equipment found in the sample to determine the attribute parameter identification algorithm based on attribute parameter identification algorithm is used to describe the accuracy and stability rate; according to the accuracy and stability rate correction identification algorithm. The utility model solves the technical problem of the low accuracy of the existing technology generation equipment identification, and improves the accuracy and the stability rate of the equipment identification.
【技术实现步骤摘要】
本申请涉及数据处理领域,具体而言,涉及一种设备标识信息的处理方法和装置。
技术介绍
目前在电子商务平台出现欺诈、骗保、炒作、炒信和垃圾账号注册等安全事件越来越多。完成上述的安全事件的操作需要个人电脑(PC机)或者手机移动设备,为了跟踪用户的操作行为,可以通过采集执行操作的设备信息生成设备的唯一标识DeviceID,通过该DeviceID限制用户非法操作,以及事后违法行为定位和追踪,但是为了使DeviceID起到其该有的作用,需要生成的DeviceID的准确率和稳定率非常高。其中,DeviceID是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。为了保证每一个设备生成的DeviceID是唯一的,需要通过采集的设备信息区分采集的设备对象是否为相同设备,以避免同一个设备生成多个DeviceID;也要避免两个不同设备生成相同DeviceID。现有手机的操作系统主要分为IOS(InternetworkingOperatingSystem-Cisco)和Andorid(安卓)两种,对于IOS和Andorid来说,在生成其DeviceID时通过采集到的设备的多个属性数据来确定其ID,而采集到的这些属性数据可能会变化,当同一个设备的部分数据属性发生变化时,基于同样算法生成的该设备的DeviceID可能不同,这样导致生成的设备标识的准确度低,从而无法基于设备标识准确跟踪用户操作行为。针对现有技术生成设备标识的准确度低的问题,目前尚未提出有效的解决方案。
技术实现思路
根据本申请实施例的一个方面,提供了一种设备标识信息的处理方法,该处理方法包括:获取多个设备的设备数据 ...
【技术保护点】
一种设备标识信息的处理方法,其特征在于,包括:获取多个设备的设备数据构成的设备样本,其中,所述设备样本中记录有通过标识算法生成的每个设备的设备标识;获取所述设备样本中所述设备标识有误的错判设备的数据;基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数,其中,所述属性参数用于描述所述标识算法的准确率和稳定率;根据所述准确率和所述稳定率修正所述标识算法。
【技术特征摘要】
1.一种设备标识信息的处理方法,其特征在于,包括:获取多个设备的设备数据构成的设备样本,其中,所述设备样本中记录有通过标识算法生成的每个设备的设备标识;获取所述设备样本中所述设备标识有误的错判设备的数据;基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数,其中,所述属性参数用于描述所述标识算法的准确率和稳定率;根据所述准确率和所述稳定率修正所述标识算法。2.根据权利要求1所述的处理方法,其特征在于,获取所述设备样本中所述设备标识有误的错判设备的数据包括:若所述设备样本中同一设备具有至少两个不同的设备标识,则确认所述同一设备为所述设备标识有误的误判设备,统计所述误判设备的数量;若所述设备样本中同一设备标识对应至少两个不同的设备,则确认所述至少两个不同的设备为所述设备标识有误的漏判设备,统计所述漏判设备的数量,其中,所述错判设备包括所述误判设备和所述漏判设备,所述错判设备的数据包括所述漏判设备的数量和所述误判设备的数量。3.根据权利要求2所述的处理方法,其特征在于,所述设备数据中还记录有设备的设备型号和使用所述设备型号登录终端设备的应用账户的账户名称,其中,在确认所述同一设备为所述设备标识有误的误判设备之前,所述处理方法还包括:若两个设备的所述设备型号和对应的所述账户名称一致,则判定两个设备为所述同一设备;在确认所述至少两个不同的设备为所述设备标识有误的漏判设备之前,所述处理方法还包括:若两个设备的所述设备型号或对应的所述账户名称不一致,则判定两个设备为所述不同的设备。4.根据权利要求2所述的处理方法,其特征在于,基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数包括:获取所述设备样本中的设备总数与所述漏判设备的数量的第一差值,将所述
\t第一差值与所述设备总数的比值作为所述标识算法的准确率;获取所述设备样本中的设备总数与所述误判设备的数量的第二差值,将所述第二差值与所述设备总数的比值作为所述标识算法的稳定率。5.根据权利要求2所述的处理方法,其特征在于,统计所述误判设备的数量包括:统计所述同一设备对应的至少两个所述设备标识的标识数量与所述同一设备的数量的差值,得到所述误判设备的数量;统计所述漏判设备的数量包括:统计对应所述至少两个不同的设备的所述设备标识的标识数量与所述至少两个不同的设备的数量的差值,得到所述漏判设备的数量。6.根据权利要求1所述的处理方法,其特征在于,获取多个设备的设备数据构成的设备样本包括:获取在至少两个时间段采集的设备记录;从所述设备记录中提取同一设备在所述至少两个时间段内均被采集到的所述设备数据,得到所述设备样本。7.根据权利要求1所述的处理方法,其特征在于,根据所述准确率和所述稳定率修正所述标识算法包括:判断所述准确率是否大于等于第一预设阈值、且所述稳定率是否大于等于第二预设阈值;若所述准确率小于所述第一预设阈值、或所述稳定率小于所述第二预设阈值,则修正所述标识算法,直至所述准确率大于等于所述第一预设阈值且所述稳定率大于等于所述第二预设阈值。8.根据权利要求7所述的处理方法,其特征在于,修正所述标识算法包括:修正判断模型中各个属性参数的权重,得到修正后的判断模型;在得到修正后的判断模型之后,所述处理方法还包括:使用所述修正后的判断模型判断是否存在与待生成设备标识的第一设备相同的第二设备,其中,所述第二设备已经具有所述设备标识;若不存在与所述第一设备相同的所述第二设备,则生成所述第一设备的设备
\t标识。9.一种设备标识信息的处理装置,其特征在于,包括:第一获取模块,用于获取多个设...
【专利技术属性】
技术研发人员:李斌松,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。