The invention provides a data extraction method, a device, an electronic device and a computer readable storage medium, and relates to the field of computer technology. The data extraction method and the device are applied to an electronic device storing a plurality of data to be extracted, each of which corresponds to an index. The data extraction method includes: generating an index lookup interval according to the acquired initial index; obtaining a target index from the index lookup interval; and extracting the said index from the index lookup interval; and The extracted data corresponding to the target index is used as the extracted data; when the number of the extracted data does not meet the preset number, the index search interval is redefined according to the target index. That is to say, according to the index search interval determined at each time of extraction, it ensures the randomness and the difference of the extracted data, avoids creating data duplicates, saves system resources and improves the processing efficiency.
【技术实现步骤摘要】
数据抽取方法、装置、电子设备及计算机可读存储介质
本专利技术涉及计算机
,具体而言,涉及一种数据抽取方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着通信技术的进步,互联网走近人们的生活,并改变着人物的生活方式。随机不重复的数据抽取作为生活中常用的一种抽取机制,在互联网时代,也有了更广泛的应用。例如从一组名单中随机抽取几个不重复的用户作为中奖用户,从几千个汉字中随机抽取几个不相同的汉字等等。相关技术在互联网产品中实现随机不重复抽取时,通过对已存储数据或其对应的索引随机打乱,再按照预设规则进行选取,从而实现随机不重复抽取。但,由于存储方面的限制,对已存储数据或其对应的索引随机打乱时需要创建数据副本,而在数据量大的情况下,创建数据副本对系统资源的占用大,不仅影响抽取效率,还会直接影响设备的正常运行。
技术实现思路
本专利技术实施例提供一种数据抽取方法、装置、电子设备及计算机可读存储介质,以改善上述问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:本专利技术实施例提供一种数据抽取方法,应用于存储有多个待抽取数据的电子设备,每个所述待抽取数据对应一索引,所述数据抽取方法包括:根据获取的起始索引,生成索引查找区间;从所述索引查找区间中获取一目标索引;抽取与所述目标索引对应的所述待抽取数据作为抽中数据;当所述抽中数据的数量未满足预设数量时,依据所述目标索引重新确定所述索引查找区间。本专利技术实施例提供一种数据抽取装置,应用于存储有多个待抽取数据的电子设备,每个所述待抽取数据对应一索引,所述数据抽取装置包括:生成模块,用于根据获取的起始索引,生成索引 ...
【技术保护点】
1.一种数据抽取方法,应用于存储有多个待抽取数据的电子设备,每个所述待抽取数据对应一索引,其特征在于,所述数据抽取方法包括:根据获取的起始索引,生成索引查找区间;从所述索引查找区间中获取一目标索引;抽取与所述目标索引对应的所述待抽取数据作为抽中数据;当所述抽中数据的数量未满足预设数量时,依据所述目标索引重新确定所述索引查找区间。
【技术特征摘要】
1.一种数据抽取方法,应用于存储有多个待抽取数据的电子设备,每个所述待抽取数据对应一索引,其特征在于,所述数据抽取方法包括:根据获取的起始索引,生成索引查找区间;从所述索引查找区间中获取一目标索引;抽取与所述目标索引对应的所述待抽取数据作为抽中数据;当所述抽中数据的数量未满足预设数量时,依据所述目标索引重新确定所述索引查找区间。2.如权利要求1所述的数据抽取方法,其特征在于,所述根据获取的起始索引,生成索引查找区间的步骤包括:确定终止索引;根据所述起始索引和所述终止索引,生成索引查找区间。3.如权利要求2所述的数据抽取方法,其特征在于,所述确定终止索引的步骤包括:获取第一参数及第二参数,其中所述第一参数与可抽取的数据的个数对应,所述第二参数与当前需抽取的数据个数对应;其中所述可抽取的数据不大于所述待抽取数据的个数;根据所述第一参数及第二参数,确定所述索引查找区间的终止索引。4.如权利要求3所述的数据抽取方法,其特征在于,所述根据所述第一参数及第二参数,确定所述索引查找区间的终止索引的步骤包括:当第一次进行数据抽取且所述第一参数和第二参数之间满足sum≤log2left时,根据所述待抽取数据的个数、第二参数及默认值,确定所述索引查找区间的终止索引;其中,所述sum代表第二参数,所述left代表第一参数;当不是第一次进行数据抽取且所述第一参数和第二参数之间满足sum≤log2left时,根据所述待抽取数据的个数、第二参数及前一次数据抽取时获取的所述目标索引,确定所述索引查找区间的终止索引。5.如权利要求3所述的数据抽取方法,其特征在于,所述根据所述第一参数及第二参数,确定所述索引查找区间的终止索引的步骤包括:当所述第一参数和第二参数满足sum>log2left时,根据所述起始索引、第一参数及第二参数,确定所述索引查找区间的终止索引,其中,所述sum代表第二参数,所述left代表第一参数。6.如权利要求2所述的数据抽取方法,其特征在于,所述从所述索引查找区间中获取一目标索引的步骤包括:生成一随机数;根据所述随机数、所述索引查找区间对应的所述起始索引及所述终止索引,计算所述目标索引。7.如权利要求1所述的数据抽取方法,其特征在于,所述数据抽取方法还包括:从重新确定的索引查找区间中获取一目标索引;根据从所述重新确定的索引查找区间中获取的目标索引,抽取对应的所述待抽取数据作为所述抽中数据;重复依据从所述重新确定的索引查找区间中获取的目标索引确定所述索引查找区间,直至所述抽中数据的数量满足预设数量。8.一种数据抽取...
【专利技术属性】
技术研发人员:林万琪,
申请(专利权)人:广州爱九游信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。