【技术实现步骤摘要】
一种数据处理方法、装置、设备及存储介质
[0001]本申请实施例涉及金融科技(Fintech)的数据处理
,涉及但不限于一种数据处理方法、装置、设备及存储介质。
技术介绍
[0002]随着计算机计算的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,然而,由于金融行业的安全性、实时性要求,金融科技也对技术提出了更高的要求。金融科技领域下,随着业务的扩张以及多方向发展,由此产生的业务数据量越来越大。应此而生的分布式数据库、大数据处理技术,都需要将海量的关系模型数据、结构化数据和非结构化数据以某种的方式(维度)将数据进行拆分,以满足数据落地到单个物理机器上(有限的数据存储、计算处理能力)。
[0003]一般情况下,一张表初始只有一个分片,需要对分布式数据库中的数据表进行切分以及对数据打散。其中,对数据表进行分片的方案是采集分片使用情况信息,根据一定策略自动对分片进行拆分。比如当分片达到一定大小后,对数据进行自动切分,产生更多分片后,通过调度将分片均匀到各个分布式节点上,利用分布式多节点处理提高并发能力,避免产生短板效应。
[0004]相关技术中一定的策略一般为基于索引对数据进行切分的方案,要么是按照主键(primary key)索引对数据表中的数据进行打散,要么是按照二级索引的范围或指定点切分对数据表中的数据进行切分。然而,该方式至少存在通用性较差的问题。
技术实现思路
[0005]本申请实施例提供一种数据处理方法、设备及存储介质,以解决相关技术 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取针对数据库中数据表预设的打散参数、所述数据表的目标索引以及所述目标索引对应的索引类型,其中,所述打散参数包括:单个分片包含的分片数据行数和单个桶包含的桶数据行数;基于所述桶数据行数和所述数据表的数据,生成与所述目标索引对应的列直方图,其中,所述列直方图包括多个目标桶;基于所述索引类型、所述分片数据行数和所述列直方图,对所述数据表的数据进行存储分片,并将所述数据表的数据按照所述存储分片进行打散。2.根据权利要求1所述的方法,其特征在于,所述基于所述桶数据行数和所述数据表的数据,生成与所述目标索引对应的列直方图,包括:对所述数据表的数据进行排序,确定所述目标索引对应的每一索引值所在数据行的逻辑行号;基于所述逻辑行号和所述桶数据行数,对所述逻辑行号对应的数据进行桶划分,得到所述逻辑行号对应的数据所在的目标桶;基于所述目标桶中的目标索引对应的索引列的第一最大索引值和第一最小索引值,确定所述目标桶的第一桶边界范围;基于所述目标桶的第一桶边界范围和所述目标桶包含的数据的实际数据行数,生成所述列直方图。3.根据权利要求1所述的方法,其特征在于,所述基于所述索引类型、所述分片数据行数和所述列直方图,对所述数据表的数据进行存储分片,包括:若所述索引类型为单列索引且所述目标索引为唯一索引,按照所述列直方图包括的所述目标桶的桶标识对所述多个目标桶进行排序;基于第一目标桶的第二最小索引值、第二目标桶的第二最大索引值,确定第一分片边界范围;确定所述分片数据行数与所述桶数据行数的比值,为所述单个分片与所述单个桶之间的倍数因子;针对排序后的多个目标桶,将相邻的所述倍数因子个目标桶的第一桶边界范围进行合并,并确定合并后的第一桶边界范围的第三最大索引值;以第一目标桶的第二最小索引值、多个第三最大索引值为切分点,对所述第一分片边界范围内的数据进行存储分片。4.根据权利要求1所述的方法,其特征在于,所述基于所述索引类型、所述分片数据行数和所述列直方图,对所述数据表的数据进行存储分片,包括:若所述索引类型为单列索引且所述目标索引为普通索引,以所述第一桶边界范围为维度,将所述列直方图中具有相同第一桶边界范围的目标桶进行合并,得到第一合并后的目标桶;获取所述第一合并后的目标桶的第二分片边界范围中的第四最大索引值与第四最小索引值是否相同的判断结果,其中,所述第二分片边界范围为所述具有相同第一桶边界范围;若判断结果表征所述第四最大索引值与第四最小索引值不相同,以所述第四最大索引
值或所述第四最小索引值为切分点,对所述第二分片边界范围内的数据进行存储分片。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若判断结果表征所述第四最大索引值与第四最小索引值相同,确定所述第一合并后的目标桶包含的数据的总数据行数与所述分片数据行数的比值,为所述第二分片边界范围所需的第一分片数量;若所述第一分片数量大于分片数量阈值,获取所述目标索引对应的索引列的数据类型,并在所述第四最大索引值中增加与所述数据类型对应的数据位数,得到扩大后的第二分片边界范围,其中,所述扩大后的第二分片边界范围中的第五最大索引值与第五最小索引值不相同;对所述第一分片数量与所述分片数量阈值的比值进行向上取整,得到所述第二分片边界范围的...
【专利技术属性】
技术研发人员:苗青利,胡盼盼,卢道和,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。