一种用于分布式深度学习的增量迭代方法技术

技术编号：36085971 阅读：14 留言：0更新日期：2022-12-24 11:01

本发明专利技术涉及到数据处理领域，提出了一种用于分布式深度学习的增量迭代方法，步骤包括：步骤1)：构造DAG；步骤2)：过滤RDD数据集；步骤3)：将过滤后的RDD数据集转换为GPU可以处理的数据类型，存入GPU全局显存中；步骤4)进行迭代计算；步骤5)：进行增量迭代计算。在本发明专利技术中，打破了传统数据处理方法不能有效利用异构多样的内存，以及对增量数据的数据处理效率慢的问题，提出一种用于分布式深度学习的增量迭代方法，有效利用GPU中的多级存储结构进行增量迭代学习，提升了深度学习数据处理效率。提升了深度学习数据处理效率。提升了深度学习数据处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于分布式深度学习的增量迭代方法

[0001]本专利技术涉及数据处理领域，特别是涉及一种用于分布式深度学习的增量迭代方法。

技术介绍

[0002]随着人工智能热潮的重新兴起，致力于深度学习的并行处理平台已成为许多研究人员的关注焦点。作为MapReduce编程模型的主流代表，Flink和Spark非常适合计算密集型数据分析和迭代计算应用。然而，分布式计算框架和GPU之间仍然存在许多不同的特性，这给在具有集成GPU的异构分布式环境中构建深度学习增量迭代模型带来了挑战。
[0003]同时，在实际应用场景中，流数据是实时动态变化的，如何对数据变化时产生的增量数据的计算进行时间和资源上的合理利用，是传统的大数据处理方法亟需处理的问题。

技术实现思路

[0004]本专利技术的目的是提供一种用于分布式深度学习的增量迭代方法，能够有效完成数据高效处理任务。
[0005]为实现上述目的，本专利技术提供了如下方案：
[0006]一种用于分布式深度学习的增量迭代方法，包括：
[0007]步骤1：构造DAG。获取RDD ID以及RDD间的依赖关系，构建由多个包含头RDD、依赖关系、尾RDD三元组的有向无环图。
[0008]步骤2：过滤RDD数据集。为了增加后续GPU利用效率，当内存达到一定阈值后，计算步骤1中所有RDD数据的权重，并进行过滤操作，将权重小的RDD过滤掉，过滤后的数据集即为需要缓存至内存中的RDD数据集。
[0009]步骤3：将上述步骤2过滤后的RDD数据集转...

【技术保护点】

【技术特征摘要】
1.一种用于分布式深度学习的增量迭代方法，其特征在于包括以下步骤：1)构造DAG；2)过滤RDD数据集；3)将过滤后的RDD数据集转换为GPU可以处理的数据类型，存入GPU全局显存中；4)进行迭代计算；5)进行增量迭代计算。2.如权利要求1所述的一种用于分布式深度学习的增量迭代方法，其特征在于步骤1)中：所述构造DAG具体步骤为：1)输入样本数据，遍历所有RDD函数操作，获取所有输入RDD、依赖关系、输出RDD构成的三元组t：t＝R
h
⊕
r
⊕
R
t
其中R
h
是输入RDD ID，r是依赖关系，R
t
是输出RDD ID；同时，将无法构成三元组关系的RDD丢弃；2)读取所有三元组t，构建DAG。3.如权利要求1所述的一种用于分布式深度学习的增量迭代方法，其特征在于步骤1)中：过滤RDD数据集具体步骤为：1)判断当前内存的存储量是否达到阈值，如达到，则继续一下步骤；2)计算RDD权重；该过程的公式定义如下：其中,w表示该RDD分区的权重值,表示该RDD的计算代价,表示该RDD的使用次数,S
p
表示该分区的大小,表示该RDD的生命周期,表示计算该RDD输入RDD的位置；A＝{α0，α1...

【专利技术属性】
技术研发人员：邵长城，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人