【技术实现步骤摘要】
运算方法、装置及相关产品
本公开涉及计算机
,尤其涉及一种标量查找指令处理方法、装置及相关产品。
技术介绍
随着科技的不断发展,机器学习,尤其是神经网络算法的使用越来越广泛。其在图像识别、语音识别、自然语言处理等领域中都得到了良好的应用。但由于神经网络算法的复杂度越来越高,所涉及的数据运算种类和数量不断增大。相关技术中,在对标量数据进行查找运算的效率低、速度慢。
技术实现思路
有鉴于此,本公开提出了一种标量查找指令处理方法、装置及相关产品,以提高对标量进行查找运算的效率和速度。根据本公开的第一方面,提供了一种标量查找指令处理装置,所述装置包括:控制模块,用于对接收到的标量查找指令进行解析,获得所述标量查找指令的操作码和操作域,并根据所述操作码和所述操作域确定执行所述标量查找指令所需的待查找标量、指定值、指定排序和目标地址;运算模块,用于依次确定表示所述待查找标量的多个待查数的数值是否等于所述指定值,并将数值等于所述指定值、且排序为所述指定排序的待查数确定为目标数,将所述目标数的存储地址作为查找结果存入所述目标地址,其中,所述操作码用于指示所述标量查找指令对标量数据所进行的运算为查找运算,所述操作域包括所述待查找标量地址和所述目标地址。根据本公开的第二方面,提供了一种机器学习运算装置,所述装置包括:一个或多个上述第一方面所述的标量查找指令处理装置,用于从其他处理装置中获取待运算数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递 ...
【技术保护点】
1.一种标量查找指令处理装置,其特征在于,所述装置包括:/n控制模块,用于对接收到的标量查找指令进行解析,获得所述标量查找指令的操作码和操作域,并根据所述操作码和所述操作域确定执行所述标量查找指令所需的待查找标量、指定值、指定排序和目标地址;/n运算模块,用于依次确定表示所述待查找标量的多个待查数的数值是否等于所述指定值,并将数值等于所述指定值、且排序为所述指定排序的待查数确定为目标数,将所述目标数的存储地址作为查找结果存入所述目标地址,/n其中,所述操作码用于指示所述标量查找指令对标量数据所进行的运算为查找运算,所述操作域包括所述待查找标量地址和所述目标地址。/n
【技术特征摘要】
1.一种标量查找指令处理装置,其特征在于,所述装置包括:
控制模块,用于对接收到的标量查找指令进行解析,获得所述标量查找指令的操作码和操作域,并根据所述操作码和所述操作域确定执行所述标量查找指令所需的待查找标量、指定值、指定排序和目标地址;
运算模块,用于依次确定表示所述待查找标量的多个待查数的数值是否等于所述指定值,并将数值等于所述指定值、且排序为所述指定排序的待查数确定为目标数,将所述目标数的存储地址作为查找结果存入所述目标地址,
其中,所述操作码用于指示所述标量查找指令对标量数据所进行的运算为查找运算,所述操作域包括所述待查找标量地址和所述目标地址。
2.根据权利要求1所述的装置,其特征在于,所述操作域还包括输入长度,
所述控制模块,还用于根据所述输入长度,从所述待查找标量地址中获取所述待查找标量。
3.根据权利要求1所述的装置,其特征在于,所述操作域还包括指定值和指定排序,
所述控制模块,还用于根据所述操作域,确定所述指定值和所述指定排序。
4.根据权利要求1所述的装置,其特征在于,
所述控制模块,还用于根据所述操作码,确定所述指定值和所述指定排序,其中,所述操作码还用于指示所述标量查找指令的指定值和指定排序。
5.根据权利要求1所述的装置,其特征在于,所述运算模块,包括:
至少一个比较器,用于对所述多个待查数的数值和所述指定值进行比较,获得比较结果,以便于根据所述比较结果确定待查数的数值与所述指定值是否相等。
6.根据权利要求1-5任一项所述的装置,其特征在于,所述指定排序包括以下至少一种:
所述待查数的排序为等于所述指定值的待查数中的第n个,所述n为大于或等于1的正整数;
所述待查数的排序为等于所述指定值的待查数中的倒数第m个,所述m为大于或等于1的正整数,
其中,m、n小于或等于所述待查找标量中待查数的数量。
7.根据权利要求1所述的装置,其特征在于,
所述装置还包括:存储模块,用于存储所述待查找标量。
其中,所述控制模块,包括:
指令存储子模块,用于存储所述标量查找指令;
指令处理子模块,用于对所述标量查找指令进行解析,得到所述标量查找指令的操作码和操作域;
队列存储子模块,用于存储指令队列,所述指令队列包括按照执行顺序依次排列的多个待执行指令,所述多个待执行指令包括所述标量查找指令,
其中,所述控制模块,还包括:
依赖关系处理子模块,用于在确定所述多个待执行指令中的第一待执行指令与所述第一待执行指令之前的第零待执行指令存在关联关系时,将所述第一待执行指令缓存在所述指令存储子模块中,在所述第零待执行指令执行完毕后,从所述指令存储子模块中提取所述第一待执行指令发送至所述运算模块,
其中,所述第一待执行指令与所述第一待执行指令之前的第零待执行指令存在关联关系包括:
存储所述第一待执行指令所需数据的第一存储地址区间与存储所述第零待执行指令所需数据的第零存储地址区间具有重叠的区域。
8.一种机器学习运算装置,其特征在于,所述装置包括:
一个或多个如权利要求1-7任一项所述的标量查找指令处理装置,用于从其他处理装置中获取待运算数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
当所述机器学习运算装置包含多个所述标量查找指令处理装置时,所述多个所述标量查找指令处理装置间可以通过特定的结构进行连接并传输数据;
其中,多个所述标量查找指令处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算;多个所述标量查找指令处理装置共享同一控制系统或拥有各自的控制系统;多个所述标量查找指令处理装置共享内存或者拥有各自的内存;多个所述标量查找指令处理装置的互联方式是任意互联拓扑。
9.一种组合处理装置,其特征在于,所述组合处理装置包括:
如权利要求8所述的机器学习运算装置、通用互联接口和其他处理装置;
所述机器学习运算装置与所述其他处理装置进行交互,共同完成用户指定的计算操作,
其中,所述组合处理装置还包括:存储装置,该存储装置分别与所述机器学习运...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:上海寒武纪信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。