【技术实现步骤摘要】
数据处理的方法、端侧设备、云侧设备与端云协同系统
本申请涉及数据处理领域,并且更具体地,涉及一种数据处理的方法、端侧设备、云侧设备与端云协同系统。
技术介绍
端侧设备的智能应用需求日益增长,典型的智能应用场景有智能移动终端、机器人、无人驾驶、平安城市、智慧城市和物联网等。智能应用场景对端侧设备的智能应用需求日益强烈。智能应用的典型特点是数据量大、计算量大以及运行时存储需求大。智能应用的计算程序的计算内核主要是机器学习,尤其是神经网络,这类程序的特点是计算量大以及运行时存储需求大。但端侧设备(例如智能手机、平板电脑、智能摄像头、智能眼镜、机器人或智能传感器等)的典型特点是计算能力相对较弱,并且设备集成的存储容量有限,远低于高性能的服务器,从而难以在端侧设备上高效率地计算进而满足智能应用场景所需要的计算需求,限制了端侧设备智能应用特征的拓展。
技术实现思路
本申请提供一种数据处理的方法、端侧设备、云侧设备与端云协同系统,能够提高端侧设备处理神经网络相关应用的性能,有利于增强端侧设备的智能应用能力的扩展。第一方面,提供一种数据处理的方法,所述方法包括:端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;所述端侧设备基于所述第二神经 ...
【技术保护点】
1.一种数据处理的方法,其特征在于,包括:/n端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;/n所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;/n所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务。/n
【技术特征摘要】
1.一种数据处理的方法,其特征在于,包括:
端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;
所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;
所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务。
2.根据权利要求1所述的方法,其特征在于,所述端侧设备包括神经网络基础平台,所述神经网络基础平台包括神经网络架构组件与神经网络参数组件,所述神经网络架构组件与所述神经网络参数组件解耦;
所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务,包括:
当所述第二神经网络模型包括架构更新组件时,基于所述架构更新组件更新所述神经网络架构组件;
当所述第二神经网络模型包括参数更新组件时,基于所述参数更新组件更新所述神经网络参数组件;
基于更新后的神经网络基础平台,处理所述认知计算任务。
3.根据权利要求1或2所述的方法,其特征在于,所述端侧设备向云侧设备发送请求消息,包括:
所述端侧设备在下列任一种条件下,向所述云侧设备发送所述请求消息:所述端侧设备上缺少用于处理所述认知计算任务的神经网络模型,所述端侧设备上用于处理所述认知计算任务的神经网络模型的精度不满足认知精度容忍度,以及所述端侧设备上用于处理所述认知计算任务的神经网络模型在运行时所需的硬件资源超过所述端侧设备的硬件资源可用能力,其中,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。
4.根据权利要求1或2所述的方法,其特征在于,所述请求消息中携带用于指示认知精度容忍度的指示信息,以便于所述云侧设备通过修整所述第一神经网络模型得到满足所述认知精度容忍度的所述第二神经网络模型,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。
5.根据权利要求1或2所述的方法,其特征在于,所述请求消息中携带用于指示所述端侧设备的硬件资源可用能力的指示信息。
6.根据权利要求1或2所述的方法,其特征在于,所述请求消息中还携带用于指示所述第一神经网络模型的标识,以便于所述云侧设备根据所述标识确定所述第一神经网络模型;或
所述请求消息中还携带功能信息,所述功能信息用于描述处理所述认知计算任务的功能,以便于所述云侧设备根据所述功能信息确定所述第一神经网络模型。
7.根据权利要求1或2所述的方法,其特征在于,所述第二神经网络模型的计算量与存储需求量分别小于所述第一神经网络模型的计算量与存储需求量。
8.一种数据处理的方法,其特征在于,包括:
云侧设备接收端侧设备发送的请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型;
所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;
所述云侧设备向所述端侧设备发送所述第二神经网络模型,以便于所述端侧设备基于所述第二神经网络模型处理所述认知计算任务。
9.根据权利要求8所述的方法,其特征在于,所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备通过修整所述第一神经网络模型的参数组件,得到所述第二神经网络模型,所述第二神经网络模型的参数组件的存储需求量小于所述第一神经网络模型的参数组件的存储需求量。
10.根据权利要求8所述的方法,其特征在于,所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备通过修整所述第一神经网络模型的架构组件,得到第三神经网络模型,所述第三神经网络模型的计算内核的计算量小于所述第一神经网络模型的计算内核的计算量;
所述云侧设备通过修整所述第三神经网络模型的参数组件,得到所述第二神经网络模型,所述第二神经网络模型的参数组件的存储需求量小于所述第三神经网络模型的参数组件的存储需求量。
11.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中携带用于指示认知精度容忍度的指示信息,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度;
所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备根据所述认知精度容忍度,修整所述第一神经网络模型得到所述第二神经网络模型,所述第二神经网络模型处理所述认知计算任务的精度满足所述认知精度容忍度。
12.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中携带用于指示所述端侧设备的硬件资源可用能力的指示信息。
13.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中还携带用于指示所述第一神经网络模型的标识;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型,包括:
所述云侧设备根据所述标识,确定所述第一神经网络模型。
14.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中还携带功能信息,所述功能信息用于描述处理所述认知计算任务的功能;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型,包括:
所述云侧设备根据所述功能信息,确定所述第一神经网络模型。
15.根据权利要求8至10中任一项所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:宋风龙,刘武龙,薛希俊,张慧敏,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。