【技术实现步骤摘要】
数据处理方法及装置以及相关产品
本公开涉及计算机
,尤其涉及一种数据处理方法及装置以及相关产品。
技术介绍
在数据处理过程中,通常需要在大量数据中选取满足条件的部分数据,例如,在神经网络运算中的TopK算子,需要选取K个(K为正整数)数值最大(或最小或满足其他不等式或其他数值上的约束)的数据或下标(index)进行输出。目前,主要以堆排序、快速排序、冒泡排序等排序算法为基础进行数据选取并输出,算法的时间复杂度为K*log2N,数据处理效率较低。
技术实现思路
有鉴于此,本公开提出了一种数据处理方法及装置以及相关产品。根据本公开的一方面,提供了一种数据处理方法,所述方法应用于处理器,所述方法包括:将待处理数据划分为预设数量的第一数据组;在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,其中,K为正整数;根据每个第一数据组中的K个第一数据,确定第二数据组;在所述第二数据组中,通过所述向量运算选取满足所述第一预设条件的K个目标数据。根据本公开的另一方面,提供了一种数据处理装置,所述装置应用于处理器,所述装置包括:数据组划分模块,用于将待处理数据划分为预设数量的第一数据组;第一数据选取模块,用于在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,其中,K为正整数;数据组确定模块,用于根据每个第一数据组中的K个第一数据,确定第二数据组;第二数据选取模块,用于在所述第二数据组中,通过所述向量运算选取满足所述第一预设条件的K个目标数据。根据本公开的 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法应用于处理器,所述方法包括:/n将待处理数据划分为预设数量的第一数据组;/n在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,其中,K为正整数;/n根据每个第一数据组中的K个第一数据,确定第二数据组;/n在所述第二数据组中,通过所述向量运算选取满足所述第一预设条件的K个目标数据。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法应用于处理器,所述方法包括:
将待处理数据划分为预设数量的第一数据组;
在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,其中,K为正整数;
根据每个第一数据组中的K个第一数据,确定第二数据组;
在所述第二数据组中,通过所述向量运算选取满足所述第一预设条件的K个目标数据。
2.根据权利要求1所述的方法,其特征在于,在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,包括:
根据第一数据组,确定第一向量,其中,所述第一向量的维数与所述第一数据组中数据的数量相同;
根据预设的第一参考向量以及所述第一向量,确定所述第一数据组中满足第二预设条件的M个第二数据,M为正整数;
在M等于K的情况下,将所述第二数据作为满足所述第一预设条件的K个第一数据。
3.根据权利要求2所述的方法,其特征在于,在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,还包括:
在M大于K的情况下,在所述M个第二数据中,通过向量运算选取满足第三预设条件的第三数据;
在所述第三数据的数量等于K的情况下,将所述第三数据作为满足所述第一预设条件的K个第一数据。
4.根据权利要求2所述的方法,其特征在于,在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,还包括:
在M小于K的情况下,在第一数据组中所述第二数据之外的数据中,选取K-M个第四数据,并将所述第二数据以及K-M个所述第四数据,作为满足第一预设条件的K个第一数据。
5.根据权利要求4所述的方法,其特征在于,在第一数据组中所述第二数据之外的数据中,选取K-M个第四数据,包括:
在第一数据组中所述第二数据之外的数据中,通过向量运算选取满足第四预设条件的T个第五数据;
在T等于K-M的情况下,将所述T个第五数据作为第四数据。
6.根据权利要求5所述的方法,其特征在于,在第一数据组中所述第二数据之外的数据中,选取K-M个第四数据,包括:
在T大于K-M的情况下,从T个第五数据中选取K-M个第五数据作为所述第四数据。
7.根据权利要求5所述的方法,其特征在于,在第一数据组中所述第二数据之外的数据中,选取K-M个第四数据,包括:
在T小于K-M的情况下,从第一数据组中所述第二数据以及所述第五数据之外的数据中,通过向量运算选取满足第五预设条件的K-M-T个第六数据;
将所述第二数据、所述第五数据以及所述第六数据,作为满足第一预设条件的K个第一数据。
8.根据权利要求1-7所述的方法,其特征在于,所述处理器包括多个处理单元,其中,所述预设数量是根据处理单元的数量、处理单元的计算能力中的至少一种确定的。
9.一种数据处理装置,其特征在于,所述装置应用于处理器,所述装置包括:
数据组划分模块,用于将待处理数据划分为预设数量的第一数据组;
第一数据选取模块,用于在每个第一数据组中,通过向量运算选取满足第一预设条件的K个第一数据,其中,K为正整数;
数据组确定模块,用于根据每个第一数据组中的K个第一数据,确定第二数据组;
第二数据选取模块,用于在...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:北京中科寒武纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。