本公开关于一种分类任务处理方法、装置、电子设备及存储介质,该方法包括基于加速处理器接收目标分类任务的处理请求,处理请求包括目标分类任务对应的待分类信息;基于加速处理器,获取目标分类任务对应的目标分类模型的目标模型结构信息,目标模型结构信息为预先基于目标分类模型的模型文件进行格式转换后,按照目标格式存储的结点信息;目标格式为加速处理器的可读格式,结点信息为目标分类模型对应的决策树中的结点信息;控制加速处理器,执行基于待分类信息和目标模型结构信息进行分类任务处理的操作,得到目标分类任务的分类结果信息。利用本公开实施例可以有效降低分类任务处理的时延,提升分类任务处理的速度和效率。提升分类任务处理的速度和效率。提升分类任务处理的速度和效率。
【技术实现步骤摘要】
分类任务处理方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,尤其涉及一种分类任务处理方法、装置、电子设备及存储介质。
技术介绍
[0002]随着人工智能技术的发展,人工智能技术在多个领域得到广泛应用。人工智能技术中的随机森林模型是一种利用多个决策树对数据进行判别与分类的机器学习方法,常被应用于流量识别、兴趣识别等分类任务中。
[0003]相关技术中,在基于随机森林模型进行分类的任务处理中,常常基于Python xgboost库(一种python方法库,用于随机森林模型的训练与推理)进行随机森林模型的训练,训练完成后基于Python pickle库(一种python方法库,用于已训练随机森林模型的模型文件的保存与加载)将模型保存为pkl格式(python中的一种文件存储格式,用于保存随机森林模型的序列化)。CPU(central processing unit,中央处理器)结合pkl格式的模型文件进行分类处理。但是,CPU无法高效进行大规模数据的并行计算,导致相关技术的分类任务处理过中,存在计算时延、任务处理效率低等问题。
技术实现思路
[0004]本公开提供一种分类任务处理方法、装置、电子设备及存储介质,以至少解决相关技术中存在计算时延、任务处理效率低等问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种分类任务处理方法,包括:
[0006]基于加速处理器接收目标分类任务的处理请求,所述处理请求包括所述目标分类任务对应的待分类信息;
[0007]基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息,所述目标模型结构信息为预先基于所述目标分类模型的模型文件进行格式转换后,按照目标格式存储的结点信息;所述目标格式为所述加速处理器的可读格式,所述结点信息为所述目标分类模型对应的决策树中的结点信息;
[0008]通过所述加速处理器,执行基于所述待分类信息和所述目标模型结构信息进行分类任务处理的操作,得到所述目标分类任务的分类结果信息。
[0009]可选的,所述加速处理器包括数据存储块,所述基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息之前,所述方法还包括:
[0010]基于所述加速处理器,读取所述目标格式的所述结点信息;
[0011]基于所述加速处理器将所述结点信息存储至所述数据存储块。
[0012]可选的,所述基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息包括:
[0013]通过所述加速处理器,执行从所述数据存储块中加载所述结点信息的操作。
[0014]可选的,所述方法还包括:
[0015]基于中央处理器,获取所述模型文件;
[0016]通过所述中央处理器,执行基于预设导出方法从所述模型文件中,导出预设文本格式的初始模型结构信息的操作,所述初始模型结构信息包括所述结点信息;
[0017]基于所述中央处理器,将所述结点信息按照所述目标格式进行存储。
[0018]可选的,所述目标分类模型对应的决策树为多个决策树,所述方法还包括:
[0019]基于所述中央处理器,确定每一结点信息的结点位置信息;
[0020]通过所述中央处理器,执行基于所述结点位置信息,将同一决策树对应的结点信息写入对应的预设数组中的操作;
[0021]所述基于所述中央处理器,将所述结点信息按照所述目标格式进行存储包括:
[0022]基于所述中央处理器,将所述预设数组中的所述结点信息,按照所述目标格式进行存储。
[0023]可选的,按照所述目标格式存储的结点信息为多个预设尺寸的数据块;所述基于中央处理器,将所述预设数组中的所述结点信息,按照所述目标格式进行存储包括:
[0024]基于所述中央处理器,将任意两个决策树对应预设数组中,同一结点位置信息对应的结点信息,存储为同一数据块。
[0025]可选的,所述方法还包括:
[0026]基于所述中央处理器,将叶子结点对应的结点信息和所述叶子结点的父结点的结点信息进行合并处理,得到合并结点信息;
[0027]所述基于所述中央处理器,将任意两个决策树对应预设数组中,同一结点位置信息对应的结点信息,存储为同一数据块包括:
[0028]通过所述中央处理器,将任意两个决策树对应预设数组中,同一结点位置信息对应的合并结点信息,存储为同一数据块。
[0029]可选的,所述加速处理器包括同一并行线程下的多个串行数据存储块,每一数据存储块包括所述目标分类模型对应的决策树中至少一个决策树的结点信息,所述方法还包括:
[0030]基于所述中央处理器,从所述多个串行数据存储块中,确定处于所在并行线程中末尾的目标数据存储块;
[0031]基于所述中央处理器,确定所述目标数据存储块对应的至少一个决策树中目标决策树;
[0032]基于所述中央处理器,记录所述目标决策树的结点信息,在所述多个预设尺寸的数据块中位置信息和所述目标决策树对应的数据块尺寸。
[0033]可选的,所述方法还包括:
[0034]基于所述中央处理器,获取所述目标分类模型的模型类型;
[0035]所述通过中央处理器,执行基于预设导出方法从所述模型文件中,导出预设文本格式的初始模型结构信息的操作包括:
[0036]在所述模型类型为预设兼容模型类型的情况下,所述中央处理器基于预设导出方法从所述模型文件中,导出预设文本格式的初始模型结构信息。
[0037]根据本公开实施例的第二方面,提供一种分类任务处理装置,包括:
[0038]处理请求接收模块,运行于加速处理器,被配置为执行接收目标分类任务的处理
请求,所述处理请求包括所述目标分类任务对应的待分类信息;
[0039]目标模型结构信息获取模块,运行于所述加速处理器,被配置为执行获取所述目标分类任务对应的目标分类模型的目标模型结构信息,所述目标模型结构信息为预先基于所述目标分类模型的模型文件进行格式转换后,按照目标格式存储的结点信息;所述目标格式为所述加速处理器的可读格式,所述结点信息为所述目标分类模型对应的决策树中的结点信息;
[0040]分类任务处理模块,运行于所述加速处理器,被配置为执行基于所述待分类信息和所述目标模型结构信息进行分类任务处理,得到所述目标分类任务的分类结果信息。
[0041]可选的,所述加速处理器包括数据存储块,所述装置还包括:
[0042]结点信息读取模块,运行于所述加速处理器,被配置为执行在所述获取所述目标分类任务对应的目标分类模型的目标模型结构信息之前,读取所述目标格式的所述结点信息;
[0043]结点信息存储模块,运行于所述加速处理器,被配置为执行将所述结点信息存储至所述数据存储块。
[0044]可选的,所述目标模型结构信息获取模块具体被配置为执行从所述数据存储块中加载所述结本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种分类任务处理方法,其特征在于,包括:基于加速处理器接收目标分类任务的处理请求,所述处理请求包括所述目标分类任务对应的待分类信息;基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息,所述目标模型结构信息为预先基于所述目标分类模型的模型文件进行格式转换后,按照目标格式存储的结点信息;所述目标格式为所述加速处理器的可读格式,所述结点信息为所述目标分类模型对应的决策树中的结点信息;通过所述加速处理器,执行基于所述待分类信息和所述目标模型结构信息进行分类任务处理的操作,得到所述目标分类任务的分类结果信息。2.根据权利要求1所述的分类任务处理方法,其特征在于,所述加速处理器包括数据存储块,所述基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息之前,所述方法还包括:基于所述加速处理器,读取所述目标格式的所述结点信息;基于所述加速处理器将所述结点信息存储至所述数据存储块。3.根据权利要求2所述的分类任务处理方法,其特征在于,所述基于加速处理器,获取所述目标分类任务对应的目标分类模型的目标模型结构信息包括:通过所述加速处理器,执行从所述数据存储块中加载所述结点信息的操作。4.根据权利要求1至3任一所述的分类任务处理方法,其特征在于,所述方法还包括:基于中央处理器,获取所述模型文件;通过所述中央处理器,执行基于预设导出方法从所述模型文件中,导出预设文本格式的初始模型结构信息的操作,所述初始模型结构信息包括所述结点信息;基于所述中央处理器,将所述结点信息按照所述目标格式进行存储。5.根据权利要求4所述的分类任务处理方法,其特征在于,所述目标分类模型对应的决策树为多个决策树,所述方法还包括:基于所述中央处理器,确定每一结点信息的结点位置信息;通过所述中央处理器,执行基于所述结点位置信息,将同一决策树对应的结点信息写入对应的预...
【专利技术属性】
技术研发人员:刘晓戬,付鹏,钟辉,彭薛葵,刘凌志,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。