任务执行方法、装置、设备及介质制造方法及图纸

技术编号:37887517 阅读:21 留言:0更新日期:2023-06-18 11:52
本公开实施例涉及一种任务执行方法、装置、设备及介质,其中该方法应用于配置有GPU的目标设备;该方法包括:响应于接收到指定任务的执行指令,获取配置文件;其中,指定任务为基于GPU执行的任务;配置文件包含有设备类别与优选GPU子线程数之间的映射关系,且优选GPU子线程数为设备类别下的一种代表设备基于其GPU执行指定任务耗时最短时所采用的GPU子线程数;基于配置文件确定目标设备所属的目标设备类别;采用所述目标设备类别对应的优选GPU子线程数执行所述指定任务。上述方式能够有效提升任务执行效果。升任务执行效果。升任务执行效果。

【技术实现步骤摘要】
任务执行方法、装置、设备及介质


[0001]本公开涉及计算机
,尤其涉及一种任务执行方法、装置、设备及介质。

技术介绍

[0002]在诸如移动端、桌面端等多种设备都会配置有GPU(Graphics Processing Unit,图形处理器),在一些场景中在执行诸如图像渲染等指定任务时所需参数会涉及到GPU子线程数,GPU子线程数又可称为local work size,具体是指同一个线程束中对应的子线程的数量。专利技术人经研究发现,GPU子线程数会影响任务执行效果,诸如影响任务的完成耗时。而由于市场中出现的配置有GPU的设备的种类数量非常多,仅以移动端手机为例就有上千款,现有技术很难耗费巨大成本而针对每种设备分别确定其所对应的较为合适的GPU子线程数,因此仅是简单令各设备采用统一默认的GPU子线程数执行任务,致使任务执行效果不佳。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种任务执行方法、装置、设备及介质。
[0004]本公开实施例提供了一种任务执行方法,所述方法应用于配置有GPU的目标设备;所述方法包括:响应于接收到指定任务的执行指令,获取配置文件;其中,所述指定任务为基于GPU执行的任务;所述配置文件包含有设备类别与优选GPU子线程数之间的映射关系,且所述优选GPU子线程数为所述设备类别下的一种代表设备基于其GPU执行所述指定任务耗时最短时所采用的GPU子线程数;基于所述配置文件确定所述目标设备所属的目标设备类别;采用所述目标设备类别对应的优选GPU子线程数执行所述指定任务。
[0005]可选的,所述配置文件中记录有每个所述设备类别对应的多种设备的设备标识;基于所述配置文件确定所述目标设备所属的目标设备类别的步骤,包括:在所述配置文件中查找所述目标设备的设备标识对应的设备类别,将查找到的所述设备类别作为所述目标设备所属的目标设备类别。
[0006]可选的,所述配置文件中记录有所述设备类别的划分方式;所述划分方式包括按照GPU生产商名称划分或者按照GPU型号划分;基于所述配置文件确定所述目标设备所属的目标设备类别的步骤,包括:根据所述配置文件中记录的所述设备类别的划分方式以及所述目标设备的GPU信息,确定所述目标设备所属的目标设备类别。
[0007]可选的,所述配置文件是按照如下方式生成的:获取多种设备的GPU信息;其中,所述设备均为配置有GPU的设备;基于所述GPU信息将所述多种设备划分形成多个设备类别;每个设备类别都对应有多种设备;对于每个设备类别,从该设备类别所对应的所有设备中选取一种代表设备,并获取该设备类别的代表设备对应的优选GPU子线程数,将所述优选GPU子线程数作为该设备类别对应的优选GPU子线程数;基于每种设备类别和优选GPU子线程数之间的映射关系生成配置文件。
[0008]可选的,获取该设备类别的代表设备对应的优选GPU子线程数的步骤,包括:获取多个候选GPU子线程数;针对每个所述候选GPU子线程数,将该候选GPU子线程数作为预设OpenCL程序的参数,并获取该设备类别的代表设备采用所述预设OpenCL程序执行所述指定任务的耗时;将耗时最短对应的候选GPU子线程数作为该设备类别的代表设备对应的优选GPU子线程数。
[0009]可选的,所述GPU信息包括GPU生产商名称或GPU型号;基于所述GPU信息将所述多种设备划分形成多个设备类别的步骤,包括:如果所述GPU信息为GPU生产商名称,则根据每种设备的GPU生产商名称将所述多种设备划分形成多个生产商类别;每个生产商类别对应的所有设备具有相同的生产商名称;如果所述GPU信息为GPU型号,则根据每种设备的GPU型号将所述多种设备划分形成多个GPU型号类别;每个GPU型号类别对应的所有设备具有相同的GPU型号。
[0010]可选的,从该设备类别所对应的所有设备中选取一种代表设备的步骤,包括:基于预设的衡量指标,获取该设备类别所对应的每个设备的指标数据;所述衡量指标包括市场覆盖率和/或设备性能;基于所述每个设备的指标数据,从该设备类别对应的所有设备中选取一种代表设备。
[0011]可选的,基于所述每个设备的指标数据,从该设备类别对应的所有设备中选取一种代表设备的步骤,包括:基于所述每个设备的指标数据,确定该设备类别对应的所有设备的指标数据的中间值;从该设备类别对应的所有设备中选取出指标数据与所述中间值最接近的设备,将选取出的设备作为该设备类别的代表设备。
[0012]本公开实施例提供了一种任务执行装置,所述装置应用于配置有GPU的目标设备;所述装置包括:文件获取模块,用于响应于接收到指定任务的执行指令,获取配置文件;其中,所述指定任务为基于GPU执行的任务;所述配置文件包含有设备类别与优选GPU子线程数之间的映射关系,且所述优选GPU子线程数为所述设备类别下的一种代表设备基于其GPU执行所述指定任务耗时最短时所采用的GPU子线程数;类别确定模块,用于基于所述配置文件确定所述目标设备所属的目标设备类别;任务执行模块,采用所述目标设备类别对应的优选GPU子线程数执行所述指定任务。
[0013]本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的任务执行方法。
[0014]本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的任务执行方法。
[0015]本公开实施例提供的上述方案,配置有GPU的目标设备能够响应于接收到指定任务的执行指令,获取配置文件;其中,配置文件包含有设备类别与优选GPU子线程数之间的映射关系,且优选GPU子线程数为设备类别下的一种代表设备基于其GPU执行指定任务耗时最短时所采用的GPU子线程数;然后基于配置文件确定目标设备所属的目标设备类别;并采用目标设备类别对应的优选GPU子线程数执行指定任务。上述方式能够在执行指定任务时获取记录有设备类别与优选GPU子线程数之间的映射关系的配置文件,采用目标设备所属的目标设备类别对应的优选GPU子线程数执行指定任务,而目标设备类别对应的优选GPU子线程数是该设备类别下的代表设备执行指定任务耗时最短时所采用的GPU子线程数,由于
同一设备类别下的设备通常都具有一定的共性,因此目标设备采用该设备类别下的代表设备对应的优选GPU子线程数执行任务时所用的耗时通常也较短,相比于采用默认的GPU子线程数而言,上述方式便于实现且能够有效提升任务执行效果。
[0016]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0017]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0018本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务执行方法,其特征在于,所述方法应用于配置有GPU的目标设备;所述方法包括:响应于接收到指定任务的执行指令,获取配置文件;其中,所述指定任务为基于GPU执行的任务;所述配置文件包含有设备类别与优选GPU子线程数之间的映射关系,且所述优选GPU子线程数为所述设备类别下的一种代表设备基于其GPU执行所述指定任务耗时最短时所采用的GPU子线程数;基于所述配置文件确定所述目标设备所属的目标设备类别;采用所述目标设备类别对应的优选GPU子线程数执行所述指定任务。2.根据权利要求1所述的方法,其特征在于,所述配置文件中记录有每个所述设备类别对应的多种设备的设备标识;基于所述配置文件确定所述目标设备所属的目标设备类别的步骤,包括:在所述配置文件中查找所述目标设备的设备标识对应的设备类别,将查找到的所述设备类别作为所述目标设备所属的目标设备类别。3.根据权利要求1所述的方法,其特征在于,所述配置文件中记录有所述设备类别的划分方式;所述划分方式包括按照GPU生产商名称划分或者按照GPU型号划分;基于所述配置文件确定所述目标设备所属的目标设备类别的步骤,包括:根据所述配置文件中记录的所述设备类别的划分方式以及所述目标设备的GPU信息,确定所述目标设备所属的目标设备类别。4.根据权利要求1至3任一项所述的方法,其特征在于,所述配置文件是按照如下方式生成的:获取多种设备的GPU信息;其中,所述设备均为配置有GPU的设备;基于所述GPU信息将所述多种设备划分形成多个设备类别;每个设备类别都对应有多种设备;对于每个设备类别,从该设备类别所对应的所有设备中选取一种代表设备,并获取该设备类别的代表设备对应的优选GPU子线程数,将所述优选GPU子线程数作为该设备类别对应的优选GPU子线程数;基于每种设备类别和优选GPU子线程数之间的映射关系生成配置文件。5.根据权利要求4所述的方法,其特征在于,获取该设备类别的代表设备对应的优选GPU子线程数的步骤,包括:获取多个候选GPU子线程数;针对每个所述候选GPU子线程数,将该候选GPU子线程数作为预设OpenCL程序的参数,并获取该设备类别的代表设备采用所述预设OpenCL程序执行所述指定任务的耗时;将耗时最短对应的候选GPU子线程数作为该设备类别的代表设备对应的优选GPU子线程数。6.根据权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:王帅
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1