批处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29702805 阅读:10 留言:0更新日期:2021-08-17 14:31
本申请涉及数据处理技术领域,提供了一种批处理方法、装置、计算机设备和存储介质。所述方法包括:接收业务数据处理请求,业务数据处理请求携带待处理数据;将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识;当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据;获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果;根据批处理结果和数据标识,返回业务数据处理结果。采用本方法能够实现对数据处理并行计算能力的充分利用,节约数据处理资源。

【技术实现步骤摘要】
批处理方法、装置、计算机设备和存储介质
本申请涉及数据处理
,特别是涉及一种批处理方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展,出现了模型服务技术,模型服务是指通过部署深度学习模型,并提供接口给业务系统调用,以提供数据处理服务。传统技术中,在部署深度学习模型时,为了实现高并发处理会在模型服务端开多进程,且相应占用较多的CPU(centralprocessingunit,中央处理器)、IO(Input/Output,输入/输出)、内存等硬件资源,此外,由于还需要GPU(graphicsprocessingunit,图形处理器)资源的支持,会同步安装更多的GPU。然而,传统方法,没有充分利用GPU的计算能力,存在浪费数据处理资源的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够节约数据处理资源的批处理方法、装置、计算机设备和存储介质。一种批处理方法,所述方法包括:接收业务数据处理请求,业务数据处理请求携带待处理数据;将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识;当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据;获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果;根据批处理结果和数据标识,返回业务数据处理结果。在一个实施例中,生成与待处理数据对应的数据标识包括:对待处理数据进行哈希运算,得到与待处理数据对应的哈希值;将哈希值作为与待处理数据对应的数据标识。在一个实施例中,当输入队列中的待处理数据达到预设的批处理条件时,获取与批处理条件对应的待处理数据,生成待批处理数据之前,还包括:判断输入队列中的待处理数据是否满足预设的批处理条件,预设的批处理条件包括达到批处理时间窗和/或达到批处理数据阈值。在一个实施例中,预设的批处理条件包括达到批处理时间窗,判断输入队列中的待处理数据是否满足预设的批处理条件包括:获取数据处理时间以及系统时间,数据处理时间与输入队列中排在最前面的待处理数据对应;根据数据处理时间和系统时间,得到数据等待时间;比对数据等待时间以及批处理时间窗。在一个实施例中,预设的批处理条件包括达到批处理数据阈值,判断输入队列中的待处理数据是否满足预设的批处理条件包括:实时统计输入队列中待处理数据数量;比对待处理数据数量以及批处理数据阈值。在一个实施例中,获取用于业务数据处理的深度学习模型包括:获取与业务数据处理对应的训练数据以及初始深度学习模型;根据训练数据对初始深度学习模型进行训练,得到用于业务数据处理的深度学习模型。在一个实施例中,根据批处理结果和数据标识,返回业务数据处理结果包括:获取与批处理条件对应的批次大小;根据批次大小对批处理结果进行拆分,并根据数据标识标记拆分后的批处理结果,得到与待批处理数据中待处理数据对应的数据处理结果;将数据处理结果作为业务数据处理结果返回。一种批处理装置,所述装置包括:请求接收模块,用于接收业务数据处理请求,业务数据处理请求携带待处理数据;第一处理模块,用于将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识;数据获取模块,用于当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据;模型处理模块,用于获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果;第二处理模块,用于根据批处理结果和数据标识,返回业务数据处理结果。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:接收业务数据处理请求,业务数据处理请求携带待处理数据;将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识;当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据;获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果;根据批处理结果和数据标识,返回业务数据处理结果。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:接收业务数据处理请求,业务数据处理请求携带待处理数据;将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识;当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据;获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果;根据批处理结果和数据标识,返回业务数据处理结果。上述批处理方法、装置、计算机设备和存储介质,通过在接收到携带待处理数据的业务数据处理请求后,将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识,当输入队列中的待处理数据达到预设的批处理条件时,从输入队列中取出与批处理条件对应的待处理数据,生成待批处理数据,获取用于业务数据处理的深度学习模型,将待批处理数据输入深度学习模型,得到对应的批处理结果,根据批处理结果和数据标识,返回业务数据处理结果,整个过程,将对待处理数据的数据处理过程解耦出来,能够解耦数据处理计算,让深度学习模型用批次计算的方式实现在单个进程内同时并发处理多个待处理数据,实现对数据处理并行计算能力的充分利用,节约数据处理资源。附图说明图1为一个实施例中批处理方法的应用环境图;图2为一个实施例中批处理方法的流程示意图;图3为另一个实施例中批处理方法的流程示意图;图4为一个实施例中批处理装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的批处理方法,可以应用于如图1所示的应用环境中。其中,终端102与用于模型服务的业务服务器104通过网络进行通信,用于模型服务的业务服务器104通过网络与用于批处理的处理服务器106进行通信。当需要对业务数据进行处理时,用户会通过终端102发送携带业务数据的业务调用请求至业务服务器104,业务服务器104在接收到业务调用请求后,会根据业务数据生成待处理数据,发送携带待处理数据的业务数据处理请求至处理服务器106,处理服务器106接收业务数据处理请求,业务数据处理请求携带待处理数据,将待处理数据放入预设的输入队列中,生成与待处理数据对应的数据标识,当输入队列本文档来自技高网...

【技术保护点】
1.一种批处理方法,其特征在于,所述方法包括:/n接收业务数据处理请求,所述业务数据处理请求携带待处理数据;/n将所述待处理数据放入预设的输入队列中,生成与所述待处理数据对应的数据标识;/n当所述输入队列中的待处理数据达到预设的批处理条件时,从所述输入队列中取出与所述批处理条件对应的待处理数据,生成待批处理数据;/n获取用于业务数据处理的深度学习模型,将所述待批处理数据输入所述深度学习模型,得到对应的批处理结果;/n根据所述批处理结果和所述数据标识,返回业务数据处理结果。/n

【技术特征摘要】
1.一种批处理方法,其特征在于,所述方法包括:
接收业务数据处理请求,所述业务数据处理请求携带待处理数据;
将所述待处理数据放入预设的输入队列中,生成与所述待处理数据对应的数据标识;
当所述输入队列中的待处理数据达到预设的批处理条件时,从所述输入队列中取出与所述批处理条件对应的待处理数据,生成待批处理数据;
获取用于业务数据处理的深度学习模型,将所述待批处理数据输入所述深度学习模型,得到对应的批处理结果;
根据所述批处理结果和所述数据标识,返回业务数据处理结果。


2.根据权利要求1所述的方法,其特征在于,所述生成与所述待处理数据对应的数据标识包括:
对所述待处理数据进行哈希运算,得到与所述待处理数据对应的哈希值;
将所述哈希值作为与所述待处理数据对应的数据标识。


3.根据权利要求1所述的方法,其特征在于,所述当所述输入队列中的待处理数据达到预设的批处理条件时,获取与所述批处理条件对应的待处理数据,生成待批处理数据之前,还包括:
判断所述输入队列中的待处理数据是否满足预设的批处理条件,所述预设的批处理条件包括达到批处理时间窗和/或达到批处理数据阈值。


4.根据权利要求3所述的方法,其特征在于,所述预设的批处理条件包括达到批处理时间窗,所述判断所述输入队列中的待处理数据是否满足预设的批处理条件包括:
获取数据处理时间以及系统时间,所述数据处理时间与所述输入队列中排在最前面的待处理数据对应;
根据所述数据处理时间和所述系统时间,得到数据等待时间;
比对所述数据等待时间以及所述批处理时间窗。


5.根据权利要求3所述的方法,其特征在于,所述预设的批处理条件包括达到批处理数据阈值,所述判断所述输入队列中的待处理数据是否满足预设的批处理条件包括:
实时统计所述输入队列中待处理...

【专利技术属性】
技术研发人员:陈桂安
申请(专利权)人:平安国际融资租赁有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1