目标对象确定方法以及装置制造方法及图纸

技术编号:33394182 阅读:11 留言:0更新日期:2022-05-11 23:13
本说明书实施例提供目标对象确定方法以及装置,其中所述目标对象确定方法包括:确定包含初始对象的对象列表,并从对象列表中确定初始对象的目标特征对应的特征数据,根据位图算法对目标特征对应的特征数据进行处理得到数据集,其中,数据集中包括处理后的特征数据,确定目标阈值,并根据目标阈值从数据集中确定目标位图数据,根据目标位图数据从初始对象中确定目标对象。通过使用位图算法,以比特位表示特征数据,降低存储空间,且利用计算机位运算性能极高的天然优势保证计算效率。算性能极高的天然优势保证计算效率。算性能极高的天然优势保证计算效率。

【技术实现步骤摘要】
目标对象确定方法以及装置


[0001]本说明书实施例涉及大数据
,特别涉及一种目标对象确定方法。

技术介绍

[0002]日常的数据处理中有很多需求是基于用户的特征来筛选出对应的用户或者该特征的用户数量,目前较成熟的方案有2种,一种是类似ODPS宽表方案,一种是基于bitmap的方案但是两种方案都有明显的缺陷。
[0003]常见ODPS宽表方案(计算时间为分钟至小时级)。可针对可枚举型特征和数值型不可枚举特征(特征作为列)使用SQL等语法将问题解决,但是当特征超过1000个,宽表方案即不可用,只能做多个表,且查询效率随着数据量增加逐渐变差,存储空间,计算资源也造成大量浪费。
[0004]Bitmap方案(计算时间为秒级)。每个bitmap代表一个特征,bitmap中每个索引位在索引表中对应着一个用户,但是该种方案只能表示可枚举的特征,当特征为数值型,例:用户1消费金额为999元,用户2消费金额为1000元等,如果将每一个数值存储成一个bitmap,将造成海量存储开销,且圈定范围时,不可计算。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了一种目标对象确定方法。本说明书一个或者多个实施例同时涉及一种目标对象确定装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面,提供了一种目标对象确定方法,包括:
[0007]确定包含初始对象的对象列表,并从所述对象列表中确定所述初始对象的目标特征对应的特征数据;
[0008]根据位图算法对所述目标特征对应的特征数据进行处理得到数据集,其中,所述数据集中包括处理后的特征数据;
[0009]确定目标阈值,并根据所述目标阈值从所述数据集中确定目标位图数据;
[0010]根据所述目标位图数据从所述初始对象中确定目标对象。
[0011]根据本说明书实施例的第二方面,提供了一种目标对象确定装置,包括:
[0012]特征确定模块,被配置为确定包含初始对象的对象列表,并从所述对象列表中确定所述初始对象的目标特征对应的特征数据;
[0013]位图算法模块,被配置为根据位图算法对所述目标特征对应的特征数据进行处理得到数据集,其中,所述数据集中包括处理后的特征数据;
[0014]数据确定模块,被配置为确定目标阈值,并根据所述目标阈值从所述数据集中确定目标位图数据;
[0015]对象确定模块,被配置为根据所述目标位图数据从所述初始对象中确定目标对象。
[0016]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0017]存储器和处理器;
[0018]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述目标对象确定方法的步骤。
[0019]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述目标对象确定方法的步骤。
[0020]根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述目标对象确定方法的步骤。
[0021]本说明书的目标对象确定方法包括:确定包含初始对象的对象列表,并从对象列表中确定初始对象的目标特征对应的特征数据,根据位图算法对目标特征对应的特征数据进行处理得到数据集,其中,数据集中包括处理后的特征数据,确定目标阈值,并根据目标阈值从数据集中确定目标位图数据,根据目标位图数据从初始对象中确定目标对象。通过使用位图算法,以比特位表示特征数据,降低存储空间,且利用计算机位运算性能极高的天然优势保证计算效率。
附图说明
[0022]图1是本说明书一个实施例提供的一种目标对象确定方法的流程图;
[0023]图2是本说明书一个实施例提供的一种目标对象确定方法的处理过程流程图;
[0024]图3是本说明书一个实施例提供的一种目标对象确定装置的结构示意图;
[0025]图4是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0026]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0027]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0028]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0029]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0030]Bitmap:也称为位图算法,用一个bit位(0或1)来代表该索引位的对应的元素是否出现。由于采用了bit为单位来存储数据,因此可以大大节省存储空间。
[0031]整型:数据类型为int,在计算机中占用4个字节(byte)的存储空间,范围:

2147483648—2147483647。
[0032]数值特征:泛指特征的值为数值型,即不可逐个枚举或者枚举值过多。
[0033]在本说明书中,提供了一种目标对象确定方法,本说明书同时涉及一种目标对象确定装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0034]参见图1,图1示出了根据本说明书一个实施例提供的一种目标对象确定方法的流程图,具体包括以下步骤。
[0035]步骤102:确定包含初始对象的对象列表,并从所述对象列表中确定所述初始对象的目标特征对应的特征数据。
[0036]其中,所述初始对象可以为用户、商品等对象,例如,初始对象为用户;对象列表可以为记录对象以及对象的数据的列表,例如,对象列表中包括用户的标识和用户的消费金额数据;目标特征可以为用户的数据的特征,例如,目标特征为消费金额或商品类别等特征。
[0037]在实际应用中,在网上购物的场景中,用户数量以及用户的数据非常庞大,想要筛选出想要的用户是一件非常困难的事情,需要先确定出需要的目标特征,再本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象确定方法,包括:确定包含初始对象的对象列表,并从所述对象列表中确定所述初始对象的目标特征对应的特征数据;根据位图算法对所述目标特征对应的特征数据进行处理得到数据集,其中,所述数据集中包括处理后的特征数据;确定目标阈值,并根据所述目标阈值从所述数据集中确定目标位图数据;根据所述目标位图数据从所述初始对象中确定目标对象。2.根据权利要求1所述的方法,所述根据位图算法对所述目标特征对应的特征数据进行处理得到数据集,包括:判断所述目标特征对应的特征数据是否为数值类型;若是,则将所述目标特征对应的特征数据转换为二进制数据,并根据位图算法和所述二进制数据确定位图数据组,若否,则根据所述位图算法和所述目标特征对应的特征数据确定特征位图数据;根据所述位图数据组和所述特征位图数据得到数据集。3.根据权利要求2所述的方法,所述根据位图算法和所述二进制数据确定位图数据组,包括:根据位图算法和所述二进制数据中的第一数值确定第一位图数据组;根据所述位图算法和所述二进制数据中的第二数值确定第二位图数据组。4.根据权利要求3所述的方法,所述根据位图算法和所述二进制数据中的第一数值确定第一位图数据组,包括:根据位图算法选择所述二进制数据的第i位的数值,其中,i的初始值为1,i小于等于所述二进制数据的位的个数;根据所述二进制数据中第i位的数值是否为零确定第i位图数据,使所述i的值自增1,并根据所有位图数据确定第一位图数据组。5.根据权利要求3所述的方法,所述根据所述位图算法和所述二进制数据中的第二数值确定第二位图数据组,包括:根据位图算法选择所述二进制数据的第i位的数值,其中,i的初始值为1,i小于等于所述二进制数据的位的个数;根据所述二进制数据中第i位的数值是否为零确定第i位图数据,使所述i的值自增1,并根据所有位图数据确定第二位图数据组。6.根据权利要求1所述的方法,所述根据所述目标阈值从所述数据集中确定目标位图数据,包括:将所述目标阈值转换为二进制阈值;根据所述二进制阈值从所述数据集中选择目标位图数据。7.根据权利要求6所述的方法,所述根据所述二进制阈值从所述数据集中选择目标位图数据,包括:从所述二进制阈值的第一位二进制数值至所述二进制阈值的最后一位二进制数值进行遍历;将遍历的所述二进制阈值的每一位二进制数值作为一个目标数值,根据每个所述目标
数值从所述数据集中选择一个目标位图数据。8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员:庄鑫
申请(专利权)人:浙江网商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1