【技术实现步骤摘要】
数据分配及其模型训练方法、装置、及计算集群
本专利技术涉及计算机应用
,尤其涉及一种数据分配及其模型训练方法、装置、及计算集群。
技术介绍
在社交网络、商品推荐、线上广告等业务场景中都有大量的大规模图计算需求,如果仅使用一台计算机为用户提供图计算服务势必影响用户体验,这就需要多台计算机共同为用户提供图计算服务,以加快图计算流程,从而形成了计算集群。计算集群,通常包括一个控制节点和多个计算节点,由控制节点向多个计算节点分配数据,以使多个计算节点基于自身资源对分配到的数据执行图计算所需要的数据操作。然而,无论是基于Spark方案的计算集群,还是基于Hadoop方案的计算集群,在进行数据分配时都存在倾斜,进而导致计算集群中计算节点上存在资源分配不均衡的问题,即,某些计算节点分配了大量数据,需要占用大量的资源,而某些计算节点仅分配到少量数据甚至没有分配到数据,直接导致资源浪费。
技术实现思路
为了解决相关技术中存在的数据分配不均衡的问题,本专利技术各实施例提供一种数据分配及其模型训练方法、装置、及计算集群。其中,本专利技术所采用的技术方案为:根据本专利技术实施例的一方面,一种数据分配方法,应用于计算集群,所述计算集群包括控制节点和计算节点,所述方法包括:所述控制节点确定进行图计算需要执行的数据操作,根据所确定的数据操作获取对应的数据总量;将所确定数据操作的操作类型及对应的数据总量输入至深度学习模型,得到所述计算集群中计算节点对应的可占用资源量;根据所确定的数据操作获取键对应的键值对,由所述键对应的键值对计算所述键的键值对数量;基于所述键的键值对数量和所述计算集群 ...
【技术保护点】
1.一种数据分配方法,其特征在于,应用于计算集群,所述计算集群包括控制节点和计算节点,所述方法包括:所述控制节点确定进行图计算需要执行的数据操作,根据所确定的数据操作获取对应的数据总量;将所确定数据操作的操作类型及对应的数据总量输入至深度学习模型,得到所述计算集群中计算节点对应的可占用资源量;根据所确定的数据操作获取键对应的键值对,由所述键对应的键值对计算所述键的键值对数量;基于所述键的键值对数量和所述计算集群中计算节点对应的可占用资源量,统计所述键对应键值对在所述计算集群中计算节点上的分布;通过所统计的分布结果,构建所述键与所述计算集群中计算节点之间的映射函数;根据所构建的映射函数,将所述键对应的键值对分配至所述计算集群中的计算节点。
【技术特征摘要】
1.一种数据分配方法,其特征在于,应用于计算集群,所述计算集群包括控制节点和计算节点,所述方法包括:所述控制节点确定进行图计算需要执行的数据操作,根据所确定的数据操作获取对应的数据总量;将所确定数据操作的操作类型及对应的数据总量输入至深度学习模型,得到所述计算集群中计算节点对应的可占用资源量;根据所确定的数据操作获取键对应的键值对,由所述键对应的键值对计算所述键的键值对数量;基于所述键的键值对数量和所述计算集群中计算节点对应的可占用资源量,统计所述键对应键值对在所述计算集群中计算节点上的分布;通过所统计的分布结果,构建所述键与所述计算集群中计算节点之间的映射函数;根据所构建的映射函数,将所述键对应的键值对分配至所述计算集群中的计算节点。2.如权利要求1所述的方法,其特征在于,所述深度学习模型为神经网络模型,所述神经网络模型包括输入层、若干全连接层和输出层;所述将所确定数据操作的操作类型及对应的数据总量输入至神经网络模型,得到所述计算集群中计算节点对应的可占用资源量,包括:将所确定数据操作的操作类型及对应的数据总量,输入至所述神经网络模型的输入层进行特征提取;在所述神经网络模型的若干全连接层中进行特征传播;通过所述神经网络模型的输出层对所传播的特征进行可占用资源量预测,得到所述计算集群中计算节点对应的可占用资源量。3.如权利要求1或2所述的方法,其特征在于,所述方法还包括:进行所述深度学习模型的训练;所述进行所述深度学习模型的训练,包括:获取进行标签标注的训练数据,所述标签用于指示所述计算集群中计算节点针对已完成数据操作实际分配的数据量;根据所述训练数据和所述深度学习模型的参数构建损失函数;在所述损失函数通过所述深度学习模型的反向传播收敛时,完成所述深度学习模型的训练。4.如权利要求3所述的方法,其特征在于,所述获取进行标签标注的训练数据,包括:获取所述计算集群中计算节点针对已完成数据操作实际分配的数据量;针对所述已完成数据操作,将所述计算集群中计算节点实际分配到的数据量相加,得到所述已完成数据操作对应的数据总量;以所述计算集群中计算节点针对已完成数据操作实际分配的数据量作为所述标签,对所述已完成数据操作的操作类型及对应的数据总量进行标注,得到所述训练数据。5.如权利要求4所述的方法,其特征在于,所述获取进行标签标注的训练数据,还包括:基于操作类型相同的已完成数据操作,获取对应的处理时间;在操作类型相同的已完成数据操作所对应数据总量中,根据获取到的处理时间进行筛选,通过筛选结果进行所述训练数据的标签标注。6.如权利要求1所述的方法,其特征在于,所述根据所确定的数据操作获取键对应的键值对,由所述键对应的键值对计算所述键的键值对数量,包括:将所述键对应的键值对随机分配至所述计算集群中的计算节点;在所述计算集群中的计算节点上,计算随机分配到所述键对应键值对的数量;将所述计算集群中计算节点计算得到的数量相加,得到所述键的键值对数量。7.如权利要求6所述的方法,其特征在于,所述根据所确定的数据操作获取键对应的键值对,由所述键对应的键值对计算所述键的键值对数量,还包括:如果所述键的键值对数量大于所述计算集群中计算节点对应的可占用资源量之和,则将所述键的键值对数量超出部分进行存储,以控制所述超出部分进行后一次的数据分配。8.如权利要求1所述的方法,其特征在于,所述基于所述键的键值对数量和所述计算集群中计算节点对应的可占用资源量,统计所述键对应键值对在所述计算集群中计算节点上的分布,包括:对键标识不同的若干键进行遍历,以遍历到的键作为当前键;根据所述当前键的键值对数量确定为所述当前键分配的目标资源量;根据所述目标资源量,从所述计算集群的计算节点中选取目标计算节点,所述目标计算节点对应的可占用资源量不小于所述目标资源量;存储所述当前键与所述目标计算节点之间的映射关系,通过所存储的映射关系完成所述当前键对应键值对在所述计算集群中计算节点上的分布统计。9.如权利要求8所述的方法,...
【专利技术属性】
技术研发人员:张长旺,韩笑天,张纪红,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。