【技术实现步骤摘要】
一种基于RISC-V的人工智能推理方法和系统
本专利技术涉及人工智能领域,更具体地,特别是指一种基于RISC-V的人工智能推理方法和系统。
技术介绍
目前,人工智能(AI)芯片大致的分类如下:从应用场景角度看,AI芯片主要有两个方向,一个是在数据中心部署的云端,一个是在消费者终端部署的终端。从功能角度看,AI芯片主要做两个事情,一是Training(训练),二是Inference(推理)。目前AI芯片的大规模应用分别在云端和终端。云端的AI芯片同时做两个事情:Training和Inference。Training即用大量标记过的数据来“训练”相应的系统,使之可以适应特定的功能,比如给系统海量的“猫”的图片,并告诉系统这个就是“猫”,之后系统就“知道”什么是猫了;Inference即用训练好的系统来完成任务,接上面的例子,就是你将一张图给之前训练过的系统,让它得出这张图是不是猫这样的结论。云端的AI芯片目前主要是GPU,由于训练需要的数据量大、算力大、功耗大,需要大规模的散热,Training将在很长一段时间里集中在云端,Inference的完成目前也主要集中在云端,但随着越来越多厂商的努力,很多的应用将逐渐转移到终端,如目前应用比较多的自动驾驶芯片。在终端完成Inference,主要是满足终端低延时的需求,云端推理的延时与网络相关,一般延时较大,难以满足终端(如自动驾驶)的需求;满足终端多样化需求;以及初步筛选终端的数据,将有效数据传送到云端等等。RISC-V是一个基于精简指令集(RISC)原 ...
【技术保护点】
1.一种基于RISC-V的人工智能推理方法,其特征在于,包括执行以下步骤:/n通过直接存储器访问接口获取人工智能推理的指令和数据并写入存储器;/n从所述存储器获取和翻译所述指令,基于所述指令将所述数据从所述存储器加载到对应的寄存器;/n响应于所述指令是向量指令,而由卷积控制单元基于所述向量指令在向量处理单元处理对应的向量数据;/n反馈处理过的所述向量数据以完成推理。/n
【技术特征摘要】
1.一种基于RISC-V的人工智能推理方法,其特征在于,包括执行以下步骤:
通过直接存储器访问接口获取人工智能推理的指令和数据并写入存储器;
从所述存储器获取和翻译所述指令,基于所述指令将所述数据从所述存储器加载到对应的寄存器;
响应于所述指令是向量指令,而由卷积控制单元基于所述向量指令在向量处理单元处理对应的向量数据;
反馈处理过的所述向量数据以完成推理。
2.根据权利要求1所述的方法,其特征在于,所述存储器包括向量数据存储器、指令存储器、和标量数据存储器;所述寄存器包括向量寄存器和标量寄存器。
3.根据权利要求2所述的方法,其特征在于,基于所述指令将所述数据从所述存储器加载到对应的寄存器包括:基于环境参数确定单次向量操作个数,以使用所述指令中的向量加载指令将单次向量操作个数个所述向量数据加载到所述向量寄存器。
4.根据权利要求3所述的方法,其特征在于,还包括:由所述卷积控制单元基于所述指令中的寄存器配置指令确定环境参数,所述环境参数包括向量有效位宽、向量寄存器每组个数、寄存器位宽、和当前需要操作向量个数;
基于环境参数确定单次向量操作个数包括:基于所述寄存器位宽除以所述向量有效位宽乘以所述向量寄存器每组个数而确定允许操作向量最大个数,并将所述允许操作向量最大个数和所述当前需要操作向量个数中的较小值确定为所述单次向量操作个数。
5.根据权利要求1所述的方法,其特征在于,由卷积控制单元基于所述向量指令在向量处理单元处理对应的向量数据包括:
响应于所述向量寄存器有数据、所述向量处理单元的影子寄存器为空、并且所述卷积控制单元允许,将所述向量数据从所述向量寄存器缓存到所述影子寄存器;
在所述影子寄存器中依次对所述向量数据执行重排序处理和预处理,并存入所述向量处理单元的乘法器输入缓存;
由所述向量处理单元的乘法器阵列从所述乘法器输入缓存获取所述向量数据以在所述卷积控制单元的控制下执行乘积运算;
由所述向量处理单元的乘积累加器从所述乘法器阵列获取所述向量数据以在所述卷积控制单元的控制下执行累加运算;
由所述向量处理单元的向量激活单元从所述乘积累加器获取所述向量数据以在所述卷积控制单元的控制下使用查找表执行非线性向量运算。
6.根据权利要求5所述的方法,其特征在于,还包括:
由所述卷积控制单元基于所述指令中的查找表激活指令为所述向量激活单元配置所述查找表的缓存区;
由所述卷积控制单元基于所述指令中的实时控制指令使所述向...
【专利技术属性】
技术研发人员:贾兆荣,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。