数据处理的方法、端侧设备、云侧设备与端云协同系统技术方案

技术编号:23320011 阅读:113 留言:0更新日期:2020-02-14 21:20
本申请提供一种数据处理的方法、端侧设备、云侧设备与端云协同系统,该方法包括:端侧设备向云侧设备发送请求消息,请求消息用于请求处理认知计算任务的神经网络模型;端侧设备接收云侧设备发送的通过压缩第一神经网络模型得到的第二神经网络模型,第一神经网络模型为云侧设备上用于处理认知计算任务的神经网络模型,第二神经网络模型在端侧设备上运行时所需的硬件资源在端侧设备的硬件资源可用能力范围内;端侧设备基于第二神经网络模型,处理认知计算任务,从而能够提高端侧设备处理神经网络相关应用的性能,有利于增强端侧设备的智能应用能力的扩展。

Data processing methods, end-side devices, cloud side devices and end cloud collaborative system

【技术实现步骤摘要】
数据处理的方法、端侧设备、云侧设备与端云协同系统
本申请涉及数据处理领域,并且更具体地,涉及一种数据处理的方法、端侧设备、云侧设备与端云协同系统。
技术介绍
端侧设备的智能应用需求日益增长,典型的智能应用场景有智能移动终端、机器人、无人驾驶、平安城市、智慧城市和物联网等。智能应用场景对端侧设备的智能应用需求日益强烈。智能应用的典型特点是数据量大、计算量大以及运行时存储需求大。智能应用的计算程序的计算内核主要是机器学习,尤其是神经网络,这类程序的特点是计算量大以及运行时存储需求大。但端侧设备(例如智能手机、平板电脑、智能摄像头、智能眼镜、机器人或智能传感器等)的典型特点是计算能力相对较弱,并且设备集成的存储容量有限,远低于高性能的服务器,从而难以在端侧设备上高效率地计算进而满足智能应用场景所需要的计算需求,限制了端侧设备智能应用特征的拓展。
技术实现思路
本申请提供一种数据处理的方法、端侧设备、云侧设备与端云协同系统,能够提高端侧设备处理神经网络相关应用的性能,有利于增强端侧设备的智能应用能力的扩展。第一方面,提供一种数据处理的方法,所述方法包括:端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务。在本方案中,通过端侧设备向云侧设备请求用于处理认知计算任务的神经网络模型,云侧设备将能够处理该认知计算任务的神经网络模型进行修整之后下发到端侧设备,修整之后的神经网络模型运行时所需的硬件资源在端侧设备的硬件资源可用能力范围内,从而,使原本运行在计算能力强的云侧设备上的神经网络模型也可以适用于计算能力较弱的端侧设备,即实现了端侧设备能够处理该认知计算任务。因此,本申请提供的方案可以提高端侧设备处理神经网络相关应用的性能,有利于增强端侧设备的智能应用能力的扩展。结合第一方面,在第一方面的一种可能的实现方式中,所述端侧设备包括神经网络基础平台,所述神经网络基础平台包括神经网络架构组件与神经网络参数组件,所述神经网络架构组件与所述神经网络参数组件解耦;所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务,包括:当所述第二神经网络模型包括架构更新组件时,基于所述架构更新组件更新所述神经网络架构组件;当所述第二神经网络模型包括参数更新组件时,基于所述参数更新组件更新所述神经网络参数组件;基于更新后的神经网络基础平台,处理所述认知计算任务。在本方案中,端侧设备的神经网络基础平台包括神经网络架构组件与神经网络参数组件,且神经网络架构组件与神经网络参数组件解耦设计,换句话说,神经网络参数组件的更新与神经网络架构组件的更新互相独立、互不影响,这样可以有利于端侧设备的智能应用功能的拓展。结合第一方面或第一方面的某些可能的实现方式,在第一方面的一种可能的实现方式中,所述端侧设备向云侧设备发送请求消息,包括:所述端侧设备在下列任一种条件下,向所述云侧设备发送所述请求消息:所述端侧设备上缺少用于处理所述认知计算任务的神经网络模型,所述端侧设备上用于处理所述认知计算任务的神经网络模型的精度不满足认知精度容忍度,以及所述端侧设备上用于处理所述认知计算任务的神经网络模型在运行时所需的硬件资源超过所述端侧设备的硬件资源可用能力,其中,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。在本方案中,端侧设备在上述任一种条件下,主动向云侧设备请求用于处理认知计算任务的神经网络模型,可以有效地实现端侧设备具备处理神经网络相关应用的功能,有利于增强端侧设备的智能应用能力的扩展。结合第一方面或第一方面的某些可能的实现方式,在第一方面的一种可能的实现方式中,所述请求消息中携带用于指示认知精度容忍度的指示信息,以便于所述云侧设备通过修整所述第一神经网络模型得到满足所述认知精度容忍度的所述第二神经网络模型,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。在本方案中,端侧设备向云侧设备请求处理认知计算任务的神经网络模型时,还上报用于指示认知精度容忍度的指示信息,以使得云侧设备下发的神经网络模型可以满足所述认知精度容忍度的要求。因此,本申请提供的技术方案,不仅使得端侧设备可以基于自身的硬件资源调用从云侧设备接收的神经网络模型处理认知计算任务,而且还可以保证认知计算任务的处理精度,从而,可以更进一步提高端侧设备处理神经网络相关应用的性能。在上述某些实现方式中,云侧设备向端侧设备下发的所述第二神经网络模型处理所述认知计算任务的精度与所述认知精度容忍度对应的精度一致。换句话说,所述第二神经网络模型处理所述认知计算任务的精度没有比所述认知精度容忍度对应的精度高很多。应理解,神经网络模型处理认知计算任务的精度越高,对应的计算量与存储需求量也越大。在本方案中,在保证云侧设备下发到端侧设备的神经网络模型处理认知计算任务的精度满足认知精度容忍度的前提下,较大程度地减小该神经网络模型所需的硬件资源,从而减少端侧设备运行神经网络模型的硬件资源负担。结合第一方面或第一方面的某些可能的实现方式,在第一方面的一种可能的实现方式中,所述请求消息中携带用于指示所述端侧设备的硬件资源可用能力的指示信息。结合第一方面或第一方面的某些可能的实现方式,在第一方面的一种可能的实现方式中,所述请求消息中还携带用于指示所述第一神经网络模型的标识,以便于所述云侧设备根据所述标识确定所述第一神经网络模型;或所述请求消息中还携带功能信息,所述功能信息用于描述处理所述认知计算任务的功能,以便于所述云侧设备根据所述功能信息确定所述第一神经网络模型。结合第一方面或第一方面的某些可能的实现方式,在第一方面的一种可能的实现方式中,所述第二神经网络模型的计算量与存储需求量分别小于所述第一神经网络模型的计算量与存储需求量。第二方面,提供一种数据处理的方法,所述方法包括:云侧设备接收端侧设备发送的请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型;所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;所述云侧设备向所述端侧设备发送所述第二神经网络模型,以便于所述端侧设备基于所述第二神经网络模型处理所述认知计算任务。在本方案中,通过端侧设备向云侧设备请求用于处理认知计算任务的神经网络模型,云侧设备将能够处理该认知计算任务的神经网络模型进行修整之后下发到端侧设备,修整之后的神经网络模型运行时所需的硬件资源在端侧设备的硬件资源可用能力范围内,从而,使原本运行在计算能力强的云侧设备上的神经网络模型也可以适用于计算本文档来自技高网...

【技术保护点】
1.一种数据处理的方法,其特征在于,包括:/n端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;/n所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;/n所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务。/n

【技术特征摘要】
1.一种数据处理的方法,其特征在于,包括:
端侧设备向云侧设备发送请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;
所述端侧设备接收所述云侧设备发送的通过修整第一神经网络模型得到的第二神经网络模型,所述第一神经网络模型为所述云侧设备上用于处理所述认知计算任务的神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;
所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务。


2.根据权利要求1所述的方法,其特征在于,所述端侧设备包括神经网络基础平台,所述神经网络基础平台包括神经网络架构组件与神经网络参数组件,所述神经网络架构组件与所述神经网络参数组件解耦;
所述端侧设备基于所述第二神经网络模型,处理所述认知计算任务,包括:
当所述第二神经网络模型包括架构更新组件时,基于所述架构更新组件更新所述神经网络架构组件;
当所述第二神经网络模型包括参数更新组件时,基于所述参数更新组件更新所述神经网络参数组件;
基于更新后的神经网络基础平台,处理所述认知计算任务。


3.根据权利要求1或2所述的方法,其特征在于,所述端侧设备向云侧设备发送请求消息,包括:
所述端侧设备在下列任一种条件下,向所述云侧设备发送所述请求消息:所述端侧设备上缺少用于处理所述认知计算任务的神经网络模型,所述端侧设备上用于处理所述认知计算任务的神经网络模型的精度不满足认知精度容忍度,以及所述端侧设备上用于处理所述认知计算任务的神经网络模型在运行时所需的硬件资源超过所述端侧设备的硬件资源可用能力,其中,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。


4.根据权利要求1或2所述的方法,其特征在于,所述请求消息中携带用于指示认知精度容忍度的指示信息,以便于所述云侧设备通过修整所述第一神经网络模型得到满足所述认知精度容忍度的所述第二神经网络模型,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度。


5.根据权利要求1或2所述的方法,其特征在于,所述请求消息中携带用于指示所述端侧设备的硬件资源可用能力的指示信息。


6.根据权利要求1或2所述的方法,其特征在于,所述请求消息中还携带用于指示所述第一神经网络模型的标识,以便于所述云侧设备根据所述标识确定所述第一神经网络模型;或
所述请求消息中还携带功能信息,所述功能信息用于描述处理所述认知计算任务的功能,以便于所述云侧设备根据所述功能信息确定所述第一神经网络模型。


7.根据权利要求1或2所述的方法,其特征在于,所述第二神经网络模型的计算量与存储需求量分别小于所述第一神经网络模型的计算量与存储需求量。


8.一种数据处理的方法,其特征在于,包括:
云侧设备接收端侧设备发送的请求消息,所述请求消息用于请求处理认知计算任务的神经网络模型;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型;
所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,所述第二神经网络模型运行时所需的硬件资源在所述端侧设备的硬件资源可用能力范围内;
所述云侧设备向所述端侧设备发送所述第二神经网络模型,以便于所述端侧设备基于所述第二神经网络模型处理所述认知计算任务。


9.根据权利要求8所述的方法,其特征在于,所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备通过修整所述第一神经网络模型的参数组件,得到所述第二神经网络模型,所述第二神经网络模型的参数组件的存储需求量小于所述第一神经网络模型的参数组件的存储需求量。


10.根据权利要求8所述的方法,其特征在于,所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备通过修整所述第一神经网络模型的架构组件,得到第三神经网络模型,所述第三神经网络模型的计算内核的计算量小于所述第一神经网络模型的计算内核的计算量;
所述云侧设备通过修整所述第三神经网络模型的参数组件,得到所述第二神经网络模型,所述第二神经网络模型的参数组件的存储需求量小于所述第三神经网络模型的参数组件的存储需求量。


11.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中携带用于指示认知精度容忍度的指示信息,所述认知精度容忍度表示所述端侧设备处理所述认知计算任务的预期精度;
所述云侧设备通过修整所述第一神经网络模型得到第二神经网络模型,包括:
所述云侧设备根据所述认知精度容忍度,修整所述第一神经网络模型得到所述第二神经网络模型,所述第二神经网络模型处理所述认知计算任务的精度满足所述认知精度容忍度。


12.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中携带用于指示所述端侧设备的硬件资源可用能力的指示信息。


13.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中还携带用于指示所述第一神经网络模型的标识;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型,包括:
所述云侧设备根据所述标识,确定所述第一神经网络模型。


14.根据权利要求8至10中任一项所述的方法,其特征在于,所述请求消息中还携带功能信息,所述功能信息用于描述处理所述认知计算任务的功能;
所述云侧设备根据所述请求消息,确定用于处理所述认知计算任务的第一神经网络模型,包括:
所述云侧设备根据所述功能信息,确定所述第一神经网络模型。


15.根据权利要求8至10中任一项所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:宋风龙刘武龙薛希俊张慧敏
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1