【技术实现步骤摘要】
一种任务处理的方法以及任务处理装置
[0001]本申请涉及计算机
,具体涉及一种任务处理的方法以及任务处理装置。
技术介绍
[0002]随着计算机技术的发展,由中央处理器和硬件加速器组成的异构计算架构得到广泛应用,这种异构计算架构可用于提升算法的计算速率。这种异构计算架构的实现原理是将待加速算法分割为小粒度的计算任务,并结合该异构计算架构中的自定义加速器指令(以下简称“自定义指令”),完成整个待加速算法的计算。
[0003]粗粒度并行计算机(coarse-grained parallel computers)是一种常见的异构计算架构。由于这种异构计算架构的自定义指令的划分粒度较粗,因此单个自定义指令的执行时间较长,对应的流水时延也相应较长。而且,由于粒度较粗的原因,不同的自定义指令间容易有数据依赖关系。假设每个自定义指令包含4个load任务(L0、L1、L2、L3)和4个store任务(S0、S1、S2、S3),每个自定义指令的load任务和store任务中间有一段执行时间(execute),两个自定义指令为第一指令和第二指令,该两个自定义指令的执行时序示意图如图1。需要说明的是,每个自定义指令所包含的load任务和store任务的实际执行时序可以是任意顺序,只要保证该自定义指令中的load任务和store任务的执行时序符合正常的数据依赖关系,图1所示的只是一种简单的情况。假设第一指令中的S0和第二指令中的L1的内存地址相同,则该第一指令和第二指令具有数据依赖关系,这种数据依赖关系具体为写入后读取(re ...
【技术保护点】
【技术特征摘要】
1.一种任务处理的方法,其特征在于,应用于目标硬件加速器,所述目标硬件加速器中的每一个待执行指令包含至少一个load任务和至少一个store任务,所述目标硬件加速器中的全部待执行指令所包含的load任务通过load执行队列顺序执行,所述目标硬件加速器中的全部待执行指令所包含的store任务通过store执行队列顺序执行,所述方法包括:判断目标load任务是否满足第一预设条件,所述目标load任务是位于所述load执行队列首位的load任务;若所述目标load任务满足所述第一预设条件,则判断所述目标load任务是否满足第二预设条件;若所述目标load任务满足所述第二预设条件,则确定所述目标load任务具备执行条件。2.根据权利要求1所述的方法,其特征在于,每一个待执行指令以及该待执行指令所包含的load任务和store任务均携带一个与该待执行指令唯一对应的指令编号,所述指令编号用于表示每一个待执行指令的执行顺序。3.根据权利要求2所述的方法,其特征在于,所述判断目标load任务是否满足第一预设条件,包括:判断指令编号小于所述目标load任务的全部store任务是否已进入所述store执行队列;若是,则确定所述目标load任务满足所述第一预设条件。4.根据权利要求3所述的方法,其特征在于,所述判断所述目标load任务是否满足第二预设条件,包括:根据静态分析结果判断所述目标load任务对应的待执行指令是否与所述store执行队列中的全部store任务所对应的待执行任务均不具有数据依赖关系,所述静态分析结果是预先设置的,所述静态分析结果用于表示全部待执行指令中具有数据依赖关系的待执行指令;若是,则确定所述目标load任务满足所述第二预设条件;或者,判断所述目标load任务对应的内存地址是否与所述store执行队列中的全部store任务对应的内存地址不相同;若是,则确定所述目标load任务满足所述第二预设条件;或者,判断所述store执行队列中内存地址与所述目标load任务相同的全部store任务的指令编号是否均大于或等于所述目标load任务;若是,则确定所述目标load任务满足所述第二预设条件。5.根据权利要求2所述的方法,其特征在于,所述判断目标load任务是否满足第一预设条件,包括:判断指令编号小于所述目标load任务的全部store任务是否已通过所述store执行队列进入预设的store缓冲队列;若是,则确定所述目标load任务满足所述第一预设条件。6.根据权利要求5所述的方法,其特征在于,所述判断所述目标load任务是否满足第二预设条件,包括:根据静态分析结果判断所述目标load任务对应的待执行指令是否与所述store缓冲队
列中的全部store任务所对应的待执行任务均不具有数据依赖关系,所述静态分析结果是预先设置的,所述静态分析结果用于表示全部待执行指令中具有数据依赖关系的待执行指令;若是,则确定所述目标load任务满足所述第二预设条件;或者,判断所述目标load任务对应的内存地址是否与所述store缓冲队列中的全部store任务对应的内存地址不相同;若是,则确定所述目标load任务满足所述第二预设条件;或者,判断所述store缓冲队列中内存地址与所述目标load任务相同的全部store任务的指令编号是否均大于或等于所述目标load任务;若是,则确定所述目标load任务满足所述第二预设条件。7.一种任务处理装置,其特征在于,应用于目标硬件加速器,所述目标硬件加速器中的每一个待执行指令包含至少一个load任务和至少一个store任务,所述目标硬件加速器中的...
【专利技术属性】
技术研发人员:陈铁,肖聪,王平,吴正成,张争争,
申请(专利权)人:上海华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。