一种神经网络模型的计算方法、计算机设备和存储介质技术

技术编号：35906699 阅读：11 留言：0更新日期：2022-12-10 10:45

本发明专利技术公开了一种神经网络模型的计算方法、计算机设备和存储介质。该方法应用于计算系统，计算系统包括能够相互通信的主机设备和异构设备，主机设备上存储有神经网络模型；包括如下步骤：监测所述神经网络模型与所述异构设备进行异构计算中指令转换的第一数据，从所述第一数据中确定出不会被再次使用的数据作为第二数据；删除与所述第二数据对应的原始数据和/或用于将所述原始数据部署至所述异构设备上的配置指令。本发明专利技术能够及时清理主机内存，有效提升算法应用的运行效率，能够支持更多个算法模型的同时运行。多个算法模型的同时运行。多个算法模型的同时运行。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型的计算方法、计算机设备和存储介质

[0001]本专利技术涉及神经网络
，尤其涉及一种神经网络模型的计算方法、计算机设备和存储介质。

技术介绍

[0002]卷积神经网络的算法复杂度及计算量在传统的CPU指令集上计算时间过长，难以满足实际场景需求，阻碍了卷积神经网络在日常应用中的部署。为了解决此问题，可以通过设置与主机设备相互通信的异构设备与主机设备进行异构计算以提升神经网络的处理效率。
[0003]进行异构计算时，需要将传统的算子计算描述为异构设备能够识别的数据流计算指令，同时也需要将至少部分神经网络的参数数据转化为有利于异构设备加速读取的格式。上述的转换过程会涉及到大量的数据复制，这些复制的数据以及数据流计算指令会一直存在于主机设备的内存中。
[0004]进一步地，在实际人工智能应用中，通常需要加载多个神经网络模型来协同完成一个实际的算法任务，例如安全生产监控领域中，需要安全帽识别、工服识别、烟雾报警识别等功能，同时加载多个神经网络模型并进行异构计算，将会有大量的数据和指令存在主机设备的内存中，这会迅速消耗主机设备的内存，导致算法应用的运行效率下降。

技术实现思路

[0005]基于此，有必要针对主机内存被快速消耗，算法运行效率低的问题，提出了一种神经网络模型的计算方法、计算机设备和存储介质，能够及时清理主机内存，从而能够支持更多个算法模型的同时运行，有效提升算法应用的运行效率。
[0006]一种神经网络模型的计算方法，应用于计算系统，所述计算系统包括能够相

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的计算方法，其特征在于，应用于计算系统，所述计算系统包括通信连接的主机设备和异构设备，所述主机设备上存储有神经网络模型；所述神经网络模型的计算方法包括：监测所述神经网络模型与所述异构设备进行异构计算中指令转换的第一数据，从所述第一数据中确定出不会被再次使用的数据作为第二数据；删除与所述第二数据对应的原始数据和/或用于将所述原始数据部署至所述异构设备上的配置指令。2.根据权利要求1所述的神经网络模型的计算方法，其特征在于，从所述第一数据中确定出不会被再次使用的数据作为第二数据，包括如下步骤：获取所述神经网络模型待部署至所述异构设备上的原始数据和用于将所述原始数据部署至所述异构设备上的配置指令；将所述配置指令和所述原始数据传输并部署至所述异构设备上，以使得所述异构设备根据所述配置指令获取所述原始数据，并根据所述原始数据进行推理运算；接收所述异构设备的反馈信息，所述反馈信息是所述异构设备接收到所述原始数据和所述配置指令后生成的，基于所述反馈信息从所述第一数据中确定出不会被再次使用的数据作为第二数据。3.根据权利要求2所述的神经网络模型的计算方法，其特征在于，删除与所述第二数据对应的原始数据和/或用于将所述原始数据部署至所述异构设备上的配置指令，包括：当所述反馈信息显示所述异构设备接收到的所述神经网络模型的所有所述配置指令和/或所述原始数据完整时，删除所述神经网络的所有所述配置指令和所述原始数据。4.根据权利要求2所述的神经网络模型的计算方法，其特征在于，删除与所述第二数据对应的原始数据和/或用于将所述原始数据部署至所述异构设备上的配置指令，包括：获取当前接收到的反馈信息对应的已被所述异构设备接收的所述原始数据和所述配置指令，删除所述当前接收到的反馈信息对应的已被所述异构设备接收的所述原始数据和所述配置指令。5.根据权利要求2所述的神经网络模型的计算方法，其特征在于，删除与所述第二数据对应的原始数据和/或用于将所述原始数据部署至所述异构设备上的配置指令，...

【专利技术属性】
技术研发人员：黄雪辉，熊超，牛昕宇，
申请(专利权)人：深圳鲲云信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人