一种数据分片分布式处理方法、系统、介质和电子设备技术方案

技术编号：22308189 阅读：84 留言：0更新日期：2019-10-16 08:18

本发明专利技术提供一种数据分片分布式处理方法、系统、介质及电子设备，包括：将多个初始化服务器注册到zookeeper集群中；创建所述多个初始化服务器的一致性哈希环；接收单次点击消耗量数据并直接写入mysql关系型数据库；通过所述单次点击消耗量数据中的用户信息及所述一致性哈希环获取距离用户最近的服务器信息；将所述单次点击消耗量数据存储到获取的所述服务器需要处理的redis列表队列中；从服务器的所述redis列表队列中获取所述单次点击消耗量数据，并进行逻辑处理。

A distributed processing method, system, medium and electronic equipment for data fragmentation

全部详细技术资料下载

【技术实现步骤摘要】
一种数据分片分布式处理方法、系统、介质和电子设备
本专利技术涉及分布式数据处理
，具体而言，涉及一种数据分片分布式处理方法、系统、介质和电子设备。
技术介绍
随着云计算、移动互联网和物联网等新一代信息技术的创新和应用普及，人类早已进入了大数据时代，越来越多的企业需要利用对于大数据的分析来协助企业作出决策，而不同于以往仅仅只是利用经验及直觉。因此，企业对于大数据量的分析处理具有很大的需求。分布式数据处理系统(DistributedDataStreamManagementSystem，DDSMS)是可以对数据进行分布式处理的系统。DDSMS可以极大地缩短数据处理时间，提高响应速度，在实际生活中具有极其广泛的用途。一般来说，一个DDSMS具有以下的功能：(1)由于物理存储空间的限制和处理效率的要求，对数据流进行在线处理时，一般只扫描数据一遍；(2)在一定的时间内，能够对数据进行排序，使无序变为有序；(3)对用户而言，传统的DDSMS的程序设计使用户对数据的查询具有很好的实时性；(4)传统的DDSMS在处理数据中，当遇到数据流的数据量巨大已超过系统的承载能力时，随机或者有选择地清除一些数据以缓解系统数据的膨胀；(5)传统的DDSMS对异常数据的处理也提出了一些要求，首先要迅速，同时要合乎实时的要求；(6)及时的数据用户的接口能够为用户提供方便的数据信息查询。基于云计算的大数据统一分析处理方法，可以将海量结构化、非结构化和半结构化数据分布式处理，能解析异构数据的查询分析请求，按照查询分析的数据对象所在位置调度数据处理计算，将数据分析处理计算分布到各数据存储节点...

【技术保护点】
1.一种数据分片分布式处理方法，该方法应用于数据分片分布式处理系统，该系统包括注册模块、创建模块、接收模块、获取模块、存储模块、以及处理模块，其特征在于，该方法包括：步骤1，注册模块将多个初始化服务器注册到zookeeper集群中；步骤2，创建模块创建所述多个初始化服务器的一致性哈希环；步骤3，接收模块接收单次点击消耗量数据并直接写入mysql关系型数据库；步骤4，获取模块通过所述单次点击消耗量数据中的用户信息以及所述一致性哈希环，获取距离用户最近的服务器信息；步骤5，存储模块将所述单次点击消耗量数据存储到获取的所述服务器需要处理的redis列表队列中；步骤6，处理模块从服务器的所述redis列表队列中获取所述单次点击消耗量数据，并进行逻辑处理。

【技术特征摘要】
1.一种数据分片分布式处理方法，该方法应用于数据分片分布式处理系统，该系统包括注册模块、创建模块、接收模块、获取模块、存储模块、以及处理模块，其特征在于，该方法包括：步骤1，注册模块将多个初始化服务器注册到zookeeper集群中；步骤2，创建模块创建所述多个初始化服务器的一致性哈希环；步骤3，接收模块接收单次点击消耗量数据并直接写入mysql关系型数据库；步骤4，获取模块通过所述单次点击消耗量数据中的用户信息以及所述一致性哈希环，获取距离用户最近的服务器信息；步骤5，存储模块将所述单次点击消耗量数据存储到获取的所述服务器需要处理的redis列表队列中；步骤6，处理模块从服务器的所述redis列表队列中获取所述单次点击消耗量数据，并进行逻辑处理。2.根据权利要求1所述的方法，其特征在于，步骤2中，所述创建所述多个初始化服务器的一致性哈希环具体包括：分配M个虚拟节点给N台服务器节点；通过FNV1哈希算法对所述虚拟节点进行哈希计算，得到哈希值；将得到的所述哈希值存储在节点哈希表中，则所述一致性哈希环上就会产生N*M个节点。3.根据权利要求1所述的方法，其特征在于，步骤4中，所述通过所述单次点击消耗量数据中的用户信息以及所述一致性哈希环获取距离用户最近的服务器信息，具体包括：根据所述单次点击消耗量数据中的用户信息，通过FNV1哈希算法计算哈希值；从所述一致性哈希环中查找距离通过FNV1哈希算法计算的哈希值最近的虚拟节点；根据所述最近的虚拟节点信息获取对应的服务器节点。4.根据权利要求1所述的方法，其特征在于，步骤5，所述将所述单次点击消耗量数据存储到获取的所述服务器需要处理的redis列表队列中，具体包括：根据所述服务器的redis列表队列对应的key，将所述单次点击消耗量数据放入所述key对应的列表队列当中。5.根据权利要求1所述的方法，其特征在于，该方法还包括基于所述zoo...

【专利技术属性】
技术研发人员：孙龙宝，
申请(专利权)人：重庆天蓬网络有限公司，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人