模型的配置方法、装置和系统制造方法及图纸

技术编号:37677835 阅读:13 留言:0更新日期:2023-05-26 04:43
本公开涉及一种模型的配置方法、装置和系统,涉及通信技术领域。该模型的配置方法,包括:根据终端上报的终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,确定匹配的模型;将匹配的模型的指示信息下发给终端,以便终端根据指示信息确定匹配的模型,并利用匹配的模型处理计算任务。利用匹配的模型处理计算任务。利用匹配的模型处理计算任务。

【技术实现步骤摘要】
模型的配置方法、装置和系统


[0001]本公开涉及通信
,特别涉及一种模型的配置方法、模型的配置装置、模型的配置系统和非易失性计算机可读存储介质。

技术介绍

[0002]在相关技术中,终端侧完成检测任务,然后传输检测结果。一般来说,这种视觉任务信息的处理和交互方式的任务相对固定,难以变更,具有专业性。
[0003]例如,在自动驾驶汽车的应用场景中,车载摄像头采集视觉信号,并在车内的计算单元完成障碍物识别和移动物体跟踪任务;将处理信息输送给决策系统进行动作规划。完全自动驾驶系统可以不依赖网络独立完成端侧计算。在V2X系统中,自动驾驶汽车还可能将检测到的障碍物信息传送到边缘计算节点或是云端服务器,供其进一步分析或暂时存储。
[0004]或者,端侧负责信息采集,并将信息传输到云端进行处理,适用于性能和多样性任务。由于对于原始数据大的信息,需要具备较大传输带宽,即使在5G时代,仍然可能受限,或出于节约传输成本的考虑,交通监控摄像头采集的视频或图像在终端侧进行压缩后传输到云端进行处理。例如,可以进行视频解码重建,或者进行智能分析任务。
[0005]也就是说,在相关技术中,对于指定任务的视觉信号(视频或图像)处理,采用终端侧处理直接给出分析结果,再传输到云端进行分发;或者,将原始数据进行以人类视觉复现为目的的压缩后进行传输,再到收端进行处理得到分析结果。

技术实现思路

[0006]本公开的专利技术人发现上述相关技术中存在如下问题:对终端侧处理能力要求高,或者对网络传输带宽有较高要求,导致系统性能下降。
[0007]鉴于此,本公开提出了一种模型的配置技术方案,能够平衡终端侧处理能力和传输带宽需求,从而提高系统性能。
[0008]根据本公开的一些实施例,提供了一种模型的配置方法,包括:根据终端上报的终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,确定匹配的模型;将匹配的模型的指示信息下发给终端,以便终端根据指示信息确定匹配的模型,并利用匹配的模型处理计算任务。
[0009]在一些实施例中,确定匹配的模型包括:根据计算任务的类型,在模型数据库中确定候选模型;根据终端处理能力信息,确定候选模型的分割点;根据分割点,对候选模型进行分割,获取匹配的模型。
[0010]在一些实施例中,候选模型包括按顺序排列的多个层,分割点用于指示多个层中的一个层,根据分割点,对候选模型进行分割,获取匹配的模型包括:将候选模型中排序在分割点之后的层删除,获取匹配的模型。
[0011]在一些实施例中,模型的配置方法还包括:将分割后的候选模型加入模型数据库。
[0012]在一些实施例中,确定匹配的模型包括:根据终端处理能力信息、可用的传输带
宽、计算任务的类型中的至少一项,确定用于处理视觉任务的神经网络模型;根据计算任务的类型,确定用于对传输内容进行编码和译码的熵编码模型。
[0013]在一些实施例中,将匹配的模型的指示信息下发给终端包括:根据匹配的模型与模型标识之间的映射关系,将匹配的模型对应的模型标识发送给终端。
[0014]在一些实施例中,模型的配置方法还包括:接收终端的反馈信息,反馈信息根据终端利用匹配的模型处理计算任务的准确性确定;根据反馈信息更新匹配的模型的参数。
[0015]在一些实施例中,终端处理能力信息包括终端的运算能力、通信能力、功耗限制中的至少一项,计算任务的类型包括分类任务、检测任务、分割任务、时间识别任务中的多项。
[0016]根据本公开的另一些实施例,提供一种模型的配置装置,包括:动态确定单元,用于根据终端上报的终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,确定匹配的模型;发送单元,用于将匹配的模型的指示信息下发给终端,以便终端根据指示信息确定匹配的模型,并利用匹配的模型处理计算任务。
[0017]在一些实施例中,动态确定单元根据计算任务的类型,在模型数据库中确定候选模型;根据终端处理能力信息,确定候选模型的分割点;根据分割点,对候选模型进行分割,获取匹配的模型。
[0018]在一些实施例中,候选模型包括按顺序排列的多个层,分割点用于指示多个层中的一个层,动态确定单元将候选模型中排序在分割点之后的层删除,获取匹配的模型。
[0019]在一些实施例中,模型的配置装置还包括:更新单元,用于将分割后的候选模型加入模型数据库。
[0020]在一些实施例中,动态确定单元根据终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,确定用于处理视觉任务的神经网络模型;根据计算任务的类型,确定用于对传输内容进行编码和译码的熵编码模型。
[0021]在一些实施例中,发送单元根据匹配的模型与模型标识之间的映射关系,将匹配的模型对应的模型标识发送给终端。
[0022]在一些实施例中,模型的配置装置还包括:接收单元,用于接收终端的反馈信息,反馈信息根据终端利用匹配的模型处理计算任务的准确性确定;更新单元,用于根据反馈信息更新匹配的模型的参数。
[0023]在一些实施例中,终端处理能力信息包括终端的运算能力、通信能力、功耗限制中的至少一项,计算任务的类型包括分类任务、检测任务、分割任务、时间识别任务中的多项。
[0024]根据本公开的又一些实施例,提供一种模型的配置装置,包括:存储器;和耦接至存储器的处理器,处理器被配置为基于存储在存储器装置中的指令,执行上述任一个实施例中的模型的配置方法。
[0025]根据本公开的再一些实施例,提供一种非易失性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的模型的配置方法。
[0026]根据本公开的再一些实施例,提供一种模型的配置系统,包括:上述任一个实施例中的模型的配置装置;终端,用于向配置装置上报终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,并根据配置装置根据配置装置下发的指示信息确定匹配的模型,并利用匹配的模型处理计算任务。
[0027]在上述实施例中,云端能够根据终端处理能力信息、可用的传输带宽、计算任务的
类型等实际情况,动态地配置匹配的模型,并指示终端利用该模型处理任务。这样,能够根据实际情况平衡端侧处理能力和传输带宽需求,从而提高系统性能。
附图说明
[0028]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
[0029]参照附图,根据下面的详细描述,可以更加清楚地理解本公开:
[0030]图1示出本公开的模型的配置方法的一些实施例的流程图;
[0031]图2示出本公开的模型的配置系统的一些实施例的示意图;
[0032]图3示出本公开的模型的配置方法的一些实施例的示意图;
[0033]图4示出本公开的模型的配置装置的一些实施例的框图;
[0034]图5示出本公开的模型的配置的另一些实施例的框图;
[0035]图6示出本公开的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型的配置方法,包括:根据终端上报的终端处理能力信息、可用的传输带宽、计算任务的类型中的至少一项,确定匹配的模型;将所述匹配的模型的指示信息下发给所述终端,以便所述终端根据所述指示信息确定所述匹配的模型,并利用所述匹配的模型处理所述计算任务。2.根据权利要求1所述的配置方法,其中,所述确定匹配的模型包括:根据所述计算任务的类型,在模型数据库中确定候选模型;根据所述终端处理能力信息,确定所述候选模型的分割点;根据所述分割点,对所述候选模型进行分割,获取所述匹配的模型。3.根据权利要求2所述的配置方法,其中,所述候选模型包括按顺序排列的多个层,所述分割点用于指示所述多个层中的一个层,所述根据所述分割点,对所述候选模型进行分割,获取所述匹配的模型包括:将所述候选模型中排序在所述分割点之后的层删除,获取所述匹配的模型。4.根据权利要求2所述的配置方法,还包括:将分割后的所述候选模型加入所述模型数据库。5.根据权利要求1所述的配置方法,其中,所述,所述确定匹配的模型包括:根据所述终端处理能力信息、所述可用的传输带宽、所述计算任务的类型中的至少一项,确定用于处理视觉任务的神经网络模型;根据所述计算任务的类型,确定用于对传输内容进行编码和译码的熵编码模型。6.根据权利要求1所述的配置方法,其中,所述将所述匹配的模型的指示信息下发给所述终端包括:根据所述匹配的模型与模型标识之间的映射关系,将所述匹配的模型对应的模型标识发送给所述终端。7.根据权利要求1

6任一项所述的配置方法,还包括:接收所述终端的反馈信息,所述反馈信息根据所述终端利用所述匹配的模型处理所述计算任务的准确性确定;根据所述反馈信息更新所述匹配的模型的参...

【专利技术属性】
技术研发人员:范叔炬张园
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1