本发明专利技术公开了一种号段记录压缩方法,包括:遍历存储的不同号段记录;当遍历到具有相同附加信息的10条号段记录,并且所述10条号段记录中的各个号段除最后一位号码外全部号码均相同时,根据遍历到的所述10条号段记录生成一条新的号段记录,所述新的号段记录的号段为所述10条号段记录中的各个号段的相同号码部分,附加信息为所述10条号段记录中的相同附加信息;以及将生成的新的号段记录存储,并删除遍历到的所述10条号段记录。本发明专利技术公开的号段记录压缩方法解决了现有的号段记录存储方法中存在的数据冗余问题。本发明专利技术还公开了一种号段记录压缩装置。
【技术实现步骤摘要】
本专利技术涉及数据存储
,尤其是涉及一种号段记录压縮方法及其装置。
技术介绍
在很多信息系统中,常用某种ID来标识一类信息,比如,手机号、银行卡号等。通 常,ID的前几位代表了一些特定的含义,比如,手机号138/139代表是移动集团发布的手机 号码;更进一步,1390100代表是移动集团发布的北京地区的手机号码。这里,1390100就 是常说的手机号段。互联网交易系统在进行联机交易的时候,如果使用手机进行付费,就需 要频繁的根据交易用户的手机号码进行分析,来判定用户手机号码的一些附加信息(运营 商、所在区域、使用的业务类型、用户信誉度等)。现有技术中,手机号段的长度固定为7位 数字,而且是保存在数据库中,数据库保存手机号段以及与其相关的信息,号段及其附加信 息构成号段记录。系统每次查询用户手机号码的附加信息时,需要通过截取手机号码的前7 位并查询数据库,与数据库中存储的手机号段进行匹配,以获得手机号码的附加信息。很多 时候,多个相近的号段记录对应的附加信息可能是相同的。例如1390100 1390109都是 北京地区的神州行手机号,附加信息相同,但是需要在数据库中保存10条对应的记录。重 复记录具有相同附加信息的手机号段,导致数据库产生数据冗余,进而可能导致查找效率 低下。
技术实现思路
为了解决现有的号段记录存储方法存在的数据冗余问题,本专利技术实施例提供一种 号段记录压縮方法及其装置。 本专利技术实施例提供了一种号段记录压縮方法,每一号段记录中包括号段及该号段 对应的附加信息,包括 遍历存储的不同号段记录;当遍历到具有相同附加信息的10条号段记录,并且所 述10条号段记录中的各个号段除最后一位号码外全部号码均相同时,根据遍历到的所述 10条号段记录生成一条新的号段记录,所述新的号段记录的号段为所述10条号段记录中 的各个号段的相同号码部分,附加信息为所述10条号段记录中的相同附加信息;以及将生 成的新的号段记录存储,并删除遍历到的所述10条号段记录。 本专利技术实施例提供了一种号段记录压縮装置,包括 遍历比较单元,用于遍历存储的不同号段记录,查找出具有相同附加信息的10条 号段记录,并且所述IO条号段记录中的各个号段除最后一位号码外全部号码均相同; 号段记录生成单元,用于根据遍历比较单元遍历到的所述10条号段记录生成一 条新的号段记录并存储,所述新的号段记录的号段为所述io条号段记录中的各个号段的相同号码部分,附加信息为所述10条号段记录中的相同附加信息; 号段记录存储单元,用于将号段记录生成单元生成的新号段记录存储; 号段记录删除单元,用于删除遍历比较单元遍历到的所述10条号段记录。4 本专利技术实施例提供了一种查询号码附加信息的方法,包括 取出一条存储的没有已比较标识的号段记录; 根据取出的所述号段记录的号段的位数,从待查询号码的高位截取相同的位数作 为待比较号段; 如果所述号段记录的号段与待比较号段相同,则确定待查询号码对应的附加信息 为所述号段记录的附加信息; 如果所述号段记录的号段与待比较号段不相同,则为存储的所述号段记录增加已比较标识,返回继续执行取出号段记录的操作。 本专利技术提供一种查询号码附加信息的装置,包括 号段提取单元,用于取出一条存储的未标记已比较标识的号段记录; 待比较号段截取单元,用于根据号段提取单元取出的所述号段记录的号段的位数,从待查询号码的高位截取与号段提取单元取出的位数相同的位数作为待比较号段; 附加信息确定单元,用于在号段提取单元提取的号段与待比较号段截取单元截取的待比较号段相同时,确定待查询号码对应的附加信息为所述号段记录的附加信息; 标识增加单元,用于在号段提取单元提取的号段与待比较号段截取单元截取的待比较号段不相同时,为存储的所述号段记录增加已比较标识,并触发号段提取单元继续执行取出号段记录的操作。 本专利技术实施例提供的一种号段记录压縮方法及其装置,对现有存储的号段记录进 行压縮处理,减少了存储的冗余数据。并且在进行号码附加信息查找的时候,由于需要匹配 的条目较少,能够有效地提高号段记录的查找效率。附图说明 图1是本专利技术实施例1提供的号段记录压縮方法的流程示意图; 图2是本专利技术实施例2提供的号段记录压縮方法的流程示意图; 图3是本专利技术实施例3提供的查找号码附加信息的方法的流程示意图; 图4是本专利技术实施例4提供的查找号码附加信息的方法的流程示意图; 图5a是本专利技术实施例5提供的号段记录压縮装置的结构示意图; 图5b是本专利技术实施例5提供的号段记录压縮装置的分组单元的结构示意图; 图6是本专利技术实施例6提供的查找号码附加信息的装置的结构示意图。具体实施例方式本专利技术实施例l给出了号段压縮方法,并且将其应用到手机号段压縮中,进行具 体说明,具体流程如图1所示,包括 S101、号段记录包含号段和对应的附加信息,对存储的号段记录,按照号段记录的号段所表示的实数值进行排序处理,可以是按照号段的升序或者降序排列。 手机号段常规被划分为7位数字,通过号段可以区分手机号码的运营商、手机号码的发行地区等附加信息,这些能够被手机号段区分的信息通称为号段对应的附加信息。 对于需要大量处理手机号段对应的附加信息查询的查询系统来说,必然需要在数据库中存 储手机号段以及对应的附加信息,手机号段和附加信息可以作为一个手机号段记录进行存储。 手机号段记录压縮可以减少存储号段记录所占用的存储空间。并且在查询任一手 机号码的相关附加信息时,可以提高查询的效率。 对于手机号段记录的排序这里可以按照升序排列,具体的对于7位的手机号段, 可以按照7位数字对应的自然数数值,采用冒泡法等排序方法,进行排列,得到手机号段记 录的排序结果。 S102、遍历所有号段记录,当10条号段记录的号段中除最后一位其他位都相同, 自然这10条号段值的最后一位分别为0到9的10个数字,并且这10条号段记录所对应的 附加信息完全相同时。生成一条新的号段记录,新的号段记录包含这io个号段中的相同的 位的新号段,新号段与合并前的号段相比少一位,新号段记录的附加信息与原先的10条号 段记录的附加信息相同,并删除原有的这10条号段记录。 对于排列好的顺序的手机号段记录,号段的数值变化应该是基本连续的,如果存 在连续的10条手机号段记录的手机号段前6位数字完全一致,而最末尾的一位数字各不 相同,即最后一位的值为0 9。并且如果这10条连续的记录所对应的附加信息也完全一 致,则可以生成一条新的号段记录,新的号段记录的号段为6位,并且新手机号段记录的附 加信息与这10条手机号段记录的信息保持一致。遍历整个7位手机号段记录的排序结果, 可以将所有能够合并的7位的手机号段记录全部合并。遍历完成后,剩余的7位手机号段 记录为无法压縮合并的手机号段记录,需要保留。新生产的包含6位手机号段的手机号段 记录以及剩余的包含7位手机号段的手机号段记录构成了压縮后的手机号段记录,完成了 一级号段记录的压縮处理。 S103、提取所有新生成的号段记录,重复S101和S102的步骤,直到没有生成新的 号段记录为止。 由于剩余的7位手机号段记录已经无法进行压縮合并处理,所以二级压縮,只需 要对新生产的号段及对应的附加信息进行处理即可,即从6位手机号段压縮成5本文档来自技高网...
【技术保护点】
一种号段记录压缩方法,每一号段记录中包括号段及该号段对应的附加信息,其特征在于,包括:遍历存储的不同号段记录;当遍历到具有相同附加信息的10条号段记录,并且所述10条号段记录中的各个号段除最后一位号码外全部号码均相同时,根据遍历到的所述10条号段记录生成一条新的号段记录,所述新的号段记录的号段为所述10条号段记录中的各个号段的相同号码部分,附加信息为所述10条号段记录中的相同附加信息;以及将生成的新的号段记录存储,并删除遍历到的所述10条号段记录。
【技术特征摘要】
【专利技术属性】
技术研发人员:吴宏强,
申请(专利权)人:联动优势科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。