【技术实现步骤摘要】
线程配置方法、设备、装置、存储介质及程序产品
[0001]本公开涉及计算机
,具体涉及大数据及人工智能
,特别涉及深度学习
,尤其涉及一种线程配置方法、装置、设备、存储介质和程序产品。
技术介绍
[0002]随着计算机技术的快速发展,深度学习框架的应用范围越来越广,例如图形处理器算子等等。
[0003]在深度学习框架中,底层算子的性能在很大程度上决定了该深度学习框架的性能,底层算子的性能由计算效率和访存效率决定,目前,在深度学习框架中,存在访问效率低的问题。
技术实现思路
[0004]本公开提供了一种线程配置方法、装置、设备、存储介质及程序产品。
[0005]根据本公开的一方面,提供了一种线程配置方法,包括:
[0006]获取输入的第一维度和第二维度,以及需要计算的中间维度,其中,所述第二维度大于所述第一维度;
[0007]根据所述第一维度和所述中间维度对线程块之中的线程进行配置,以生成所述线程块在x方向上的第一线程数和在y方向上的第二线程数;
[0008]根据所述第二维度和所述线程块在x方向上的第一线程数和在y方向上的第二线程数对线程栅格之中的线程进行配置,以生成所述线程栅格在x方向上的第三线程数和在y方向上的第四线程数。
[0009]根据本公开的另一方面,提供了一种线程配置装置,包括:
[0010]获取模块,用于获取输入的第一维度和第二维度,以及需要计算的中间维度,其中,所述第二维度大于所述第一维度;
[0011]第 ...
【技术保护点】
【技术特征摘要】
1.一种线程配置方法,包括:获取输入的第一维度和第二维度,以及需要计算的中间维度,其中,所述第二维度大于所述第一维度;根据所述第一维度和所述中间维度对线程块之中的线程进行配置,以生成所述线程块在x方向上的第一线程数和在y方向上的第二线程数;根据所述第二维度以及所述线程块在x方向上的第一线程数和在y方向上的第二线程数对线程栅格之中的线程进行配置,以生成所述线程栅格在x方向上的第三线程数和在y方向上的第四线程数。2.如权利要求1所述的方法,其中,所述根据所述第一维度和所述中间维度对线程块之中的线程进行配置,以生成所述线程块在x方向上的第一线程数和在y方向上的第二线程数,包括:根据所述第一维度确定线程块在x方向上的第五线程数;根据所述中间维度和所述线程块在x方向上的第五线程数确定所述线程块在y方向上的第二线程数;根据所述线程块在y方向上的第二线程数和所述第一维度更新所述线程块在x方向上的第五线程数,以生成所述线程块在x方向上的第一线程数。3.如权利要求2所述的方法,其中,所述根据所述第一维度确定所述线程块在x方向上的第五线程数,包括:获取线程束的大小;将所述线程束的大小和所述第一维度之中的较小值作为所述线程块在x方向上的第五线程数。4.如权利要求2所述的方法,其中,所述根据所述中间维度和所述线程块在x方向上的第五线程数确定所述线程块在y方向上的第二线程数,包括:获取线程块中最大可配置线程数;将所述中间维度与所述线程块中最大可配置线程数之中的较小值作为第一值;将所述中间维度与所述线程块在x方向上的第五线程数之中的较小值作为第二值;将所述第一值与所述第二值之中的较小值作为所述线程块在y方向上的第二线程数。5.如权利要求2所述的方法,其中,所述根据所述线程块在y方向上的第二线程数和所述第一维度更新所述线程块在x方向上的第五线程数,以生成所述线程块在x方向上的第一线程数,包括:将所述第一维度与所述线程块在x方向上的第五线程数之中的较小值作为第三值;将所述第一维度与所述线程块在y方向上的第二线程数之中的较小值作为第四值;根据所述第三值和第四值中的较小值,以及所述第一维度更新所述线程块在x方向上的第一线程数。6.如权利要求1所述的方法,其中,所述根据所述第二维度和所述线程块在x方向上的第一线程数和在y方向上的第二线程数对线程栅格之中的线程进行配置,以生成所述线程栅格在x方向上的第三线程数和在y方向上的第四线程数,包括:根据所述第一维度和所述线程块在x方向上的第一线程数确定在所述线程栅格在x方向上的第三线程数;
根据所述第二维度和所述线程栅格在x方向上的第三线程数确定所述线程栅格在y方向上的第四线程数。7.如权利要求6所述的方法,其中,所述根据所述第一维度和所述线程块在x方向上的第一线程数确定所述线程栅格在x方向上的第三线程数,包括:获取所述线程栅格的可同时启动最大线程块数量;将所述第一维度向上取整后的值与所述可同时启动最大线程块数量之中的较小值作为第五值;将所述线程块在x方向上的第一线程数向上取整后的值与所述可同时启动最大线程块数量之中的较小值作为第六值;将所述第五值和第六值中较小值作为所述线程栅格在x方向上的第三线程数。8.如权利要求6所述的方法,其中,所述根据所述第二维度和所述初线程栅格在x方向上的第三线程数确定所述线程栅格在y方向上的第四线程数,包括:将所述可同时启动最大线程块数量向上取整后的值与所述第二维度之中的较小值为第七值;将所述线程栅格在x方向上的第三线程数向上取整后的值与所述第...
【专利技术属性】
技术研发人员:张政,牛丽玲,邢冯,刘益群,蓝翔,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。