用于优化神经网络模型推理的方法及设备技术

技术编号：28625353 阅读：20 留言：0更新日期：2021-05-28 16:21

本发明专利技术的实施方式提供了一种用于优化神经网络模型推理的方法及设备，所述方法包括：根据同一批次中多个待处理任务的组合关系，以及根据所述神经网络模型的重组帧的帧重组规则，确定所述重组帧中有效帧和/或无效帧的位置，其中，所述有效帧仅包括来自同一待处理任务的帧的组合，所述无效帧包括来自不同待处理任务的帧的组合；以及根据所述有效帧和/或所述无效帧的位置，在利用所述神经网络模型进行推理时只使用所述有效帧。根据本发明专利技术的方法，可以显著减少无效运算量，从而能够有利于提高神经网络模型的推理速度，并且可以使得神经网络模型能够更好的适应于高吞吐量需求的应用场景中。

全部详细技术资料下载

【技术实现步骤摘要】
用于优化神经网络模型推理的方法及设备
本专利技术的实施方式涉及计算机
，更具体地，本专利技术的实施方式涉及用于优化神经网络模型推理的方法及设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念，但不一定是之前已经想到或者已经探究的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。随着人工智能技术的不断发展，神经网络的应用范围越来越广。例如时延神经网络(TDNN)用作语音识别的声学模型时，凭借着高效低成本的训练过程和不错的识别率，在实际应用中发挥了重要的作用。然而，由于时延神经网络推理时的计算量较大，导致利用时延神经网络模型进行推理时的推理速度较慢以及吞吐量较低，这将极大地影响用户的使用体验，并且在高吞吐量需求的情况下将需要更多的计算设备来进行推理运算，从而增加了硬件成本和设备损耗。
技术实现思路
由于在时延神经网络模型中，本层节点的帧与其它层或者其他时刻的帧相关，或者是由其他层节点的多个帧计算得出，因此在对时延神经网络模型进行推理时常需要将相关的帧重组以便进一步地操作。然而，当利用时延神经网络模型处理批次任务时，重组操作会使得不同任务之间产生无效帧，并且无效帧的后续计算也是无效的。特别是当神经网络模型的层数较多时，无效帧的数量会随着层数的增加而增加，进而产生大量的无效计算，大大降低了神经网络模型的推理速度，这是非常令人烦恼的过程。<...

【技术保护点】
1.一种用于优化神经网络模型推理的方法，包括：/n根据同一批次中多个待处理任务的组合关系，以及根据所述神经网络模型的重组帧的帧重组规则，确定所述重组帧中有效帧和/或无效帧的位置，其中，所述有效帧仅包括来自同一待处理任务的帧的组合，所述无效帧包括来自不同待处理任务的帧的组合；以及/n根据所述有效帧和/或所述无效帧的位置，在利用所述神经网络模型进行推理时只使用所述有效帧。/n

【技术特征摘要】
1.一种用于优化神经网络模型推理的方法，包括：
根据同一批次中多个待处理任务的组合关系，以及根据所述神经网络模型的重组帧的帧重组规则，确定所述重组帧中有效帧和/或无效帧的位置，其中，所述有效帧仅包括来自同一待处理任务的帧的组合，所述无效帧包括来自不同待处理任务的帧的组合；以及
根据所述有效帧和/或所述无效帧的位置，在利用所述神经网络模型进行推理时只使用所述有效帧。

2.根据权利要求1所述的方法，其中，确定所述重组帧中有效帧和/或无效帧的位置包括：
根据每个待处理任务的起始位置以及所述帧重组规则，确定所述第一层重组帧中有效帧和/或无效帧的位置；以及
根据上一层重组帧中有效帧和/或无效帧的位置，确定本层重组帧中有效帧和/或无效帧的位置。

3.根据权利要求1或2所述的方法，进一步包括：
确定所述重组帧中有效帧的位置偏移量；以及
根据所述位置偏移量，读取所述重组帧中的有效帧以进行后续运算操作。

4.根据权利要求3所述的方法，其中确定有效帧的位置偏移量包括：
根据每个待处理任务的起始位置以及所述帧重组规则，确定所述第一层重组帧中有效帧的位置偏移量；以及
根据上一层重组帧中有效帧的位置偏移量，确定本层重组帧中有效帧的位置偏移量。

5.根据权利要求1所述的方法，进一步包括，在确定所述重组帧中有效帧和/或无效帧的位置之前，基于如下生成所述重组帧：
根据所述帧重组规则，读取第一节点值矩阵中的帧，以形成与所述第一节点值矩阵相关的多个第一节点子矩阵；
利用所述多个第一节点子矩阵分别与相应的权重执行运算，以确定第二节点值矩阵；以及
基于所述第二节点值矩阵生成所述重组帧。

6.根据权利要求5所述的方法，其中...

【专利技术属性】
技术研发人员：蒲永杰，高飞，王玉龙，张广勇，段亦涛，
申请(专利权)人：网易有道信息技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人