一种负载均衡方法、装置、设备以及存储介质制造方法及图纸

技术编号:35112181 阅读:19 留言:0更新日期:2022-10-01 17:27
本发明专利技术实施例提供了一种负载均衡方法、装置、设备以及存储介质,涉及数据处理技术领域,具体方案为:响应于客户端发送的目标任务请求,获得响应目标任务请求所需资源的第一资源信息;根据各台服务器的当前负载的负载信息、处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时,获得各台服务器的可用资源的第二资源信息;根据第一资源信息和各第二资源信息,从各台服务器中分配目标服务器,以使得目标服务器与客户端针对目标任务请求建立长连接,并响应目标任务请求。应用本发明专利技术实施例提供的方案能够实现负载均衡。够实现负载均衡。够实现负载均衡。

【技术实现步骤摘要】
一种负载均衡方法、装置、设备以及存储介质


[0001]本专利技术涉及数据处理
,特别是涉及一种负载均衡方法、装置、设备以及存储介质。

技术介绍

[0002]各种平台为了向客户提供较佳的服务,一般通过客服系统向客户提供客服服务。为了应对大规模的客服请求,客服系统中一般配置有多台服务器,客户通过其所使用的客户端向客服系统发起客服请求后,与多台服务器中的一台服务器建立长连接,并由该台服务器为客户提供客服服务。
[0003]然而,客户端与服务器之间建立的长连接会消耗服务器的资源,为此,需要提供一种负载均衡方案,以保证各台服务器的负载均衡,减少个别服务器出现负载过高或者过低的情况。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种负载均衡方法、装置、设备以及存储介质,以实现多个服务器的负载均衡。
[0005]本专利技术实施例提供了一种负载均衡方法,所述方法包括:响应于客户端发送的目标任务请求,若所述目标任务请求对应的数据类型为图文类型,根据响应图文类型对应的任务请求所需资源的历史资源信息,获得响应所述目标任务请求所需资源的第一资源信息,若所述目标任务请求对应的数据类型为音视频类型,根据所述目标任务请求对应的数据特征,获得所述第一资源信息;根据各台服务器的当前负载的负载信息、处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时,获得各台服务器的可用资源的第二资源信息;根据所述第一资源信息和各第二资源信息,从各台服务器中分配用于响应所述目标任务请求、且使得服务器间资源占用差异最小的目标服务器,以使得所述目标服务器与所述客户端针对所述目标任务请求建立长连接,并基于所建立的长连接响应所述目标任务请求。
[0006]本专利技术实施例还提供了一种负载均衡装置,所述装置包括:第一信息获得模块,用于响应于客户端发送的目标任务请求,若所述目标任务请求对应的数据类型为图文类型,根据响应图文类型对应的任务请求所需资源的历史资源信息,获得响应所述目标任务请求所需资源的第一资源信息,若所述目标任务请求对应的数据类型为音视频类型,根据所述目标任务请求对应的数据特征,获得所述第一资源信息;第二信息获得模块,用于根据各台服务器的当前负载的负载信息、处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求
的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时,获得各台服务器的可用资源的第二资源信息;任务请求分配模块,用于根据所述第一资源信息和各第二资源信息,从各台服务器中分配用于响应所述目标任务请求、且使得服务器间资源占用差异最小的目标服务器,以使得所述目标服务器与所述客户端针对所述目标任务请求建立长连接,并基于所建立的长连接响应所述目标任务请求。
[0007]本专利技术实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述负载均衡方法步骤。
[0008]本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述负载均衡方法步骤。
[0009]本专利技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述负载均衡方法。
[0010]本专利技术实施例有益效果:本专利技术实施例提供的方案中,在为目标任务请求分配目标服务器时,既考虑了各台服务器的可用资源,也考虑各任务请求的所需资源,并据此分配目标服务器,使得分配目标服务器后,服务器间资源占用差异最小,也就是各服务器的资源占用率较为接近,实现了负载均衡。
[0011]在此情况下,由于各服务器上均存在接近的资源占用率,相当每一服务器上的资源均被使用,不会出现部分服务器一直不被分配任务请求而导致资源利用率低的状况。且相比于只是通过参考服务器性能,也就是只考虑服务器的可用资源,本专利技术实施例提供的方案考虑任务请求的所需资源,参考的信息更为充分,分配方案的均衡效果更优。
[0012]另外,在计算任务请求所需资源时,会考虑目标任务请求的数据类型,由于不同数据类型的任务请求消耗资源的特点不同,按数据类型选择对应的获取资源信息的方法,所得第一资源信息对所需资源的预测更为准确。
[0013]当然,实施本专利技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
[0015]图1A为本专利技术实施例提供的第一种负载均衡方法的流程示意图。
[0016]图1B为本专利技术实施例提供的第二种负载均衡方法的流程示意图。
[0017]图2为本专利技术实施例提供的一种资源信息方法的流程示意图。
[0018]图3为本专利技术实施例提供的一种模型训练方法的流程示意图。
[0019]图4为本专利技术实施例提供的第三种负载均衡方法的流程示意图。
[0020]图5为本专利技术实施例提供的第一种负载均衡装置的结构示意图。
[0021]图6为本专利技术实施例提供的第二种负载均衡装置的结构示意图。
[0022]图7为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0023]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]下面对本专利技术实施例所提供方案的执行主体进行说明。
[0025]以服务系统为例,对本专利技术实施例的执行主体进行说明。为了便于向客户提供服务,服务系统可以包括多台服务器,每一台服务器可以与发送任务请求的客户端建立长连接,且每一台服务器可以同时维护与多个客户端之间的多个长连接。
[0026]在此情况下,本专利技术实施例提供的负载均衡方案的执行主体可以是对上述各台服务器进行管理的管理设备,管理设备可以是一台具有服务器管理功能的电子设备,管理设备可以独立于上述多台服务器存在,也可以是上述多台服务器之一。
[0027]下面对本专利技术实施例提供方案的应用场景进行举例说明。
[0028]应用场景一:上述服务系统为客服系统,客服系统通过与客户端进行交互向使用客户端的客户提供对话服务。对话服务的方式可能是语音对话、文本对话、视频对话等,不同方式下的对话服务均通过客户端与客服系统中的服务器建立长连接完成。若在一段时间内,大量长连接接入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种负载均衡方法,其特征在于,所述方法包括:响应于客户端发送的目标任务请求,若所述目标任务请求对应的数据类型为图文类型,根据响应图文类型对应的任务请求所需资源的历史资源信息,获得响应所述目标任务请求所需资源的第一资源信息,若所述目标任务请求对应的数据类型为音视频类型,根据所述目标任务请求对应的数据特征,获得所述第一资源信息;根据各台服务器的当前负载的负载信息、处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时,获得各台服务器的可用资源的第二资源信息;根据所述第一资源信息和各第二资源信息,从各台服务器中分配用于响应所述目标任务请求、且使得服务器间资源占用差异最小的目标服务器,以使得所述目标服务器与所述客户端针对所述目标任务请求建立长连接,并基于所建立的长连接响应所述目标任务请求。2.根据权利要求1所述的方法,其特征在于,所述根据各台服务器的当前负载的负载信息、处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时,获得各台服务器的可用资源的第二资源信息,包括:按照以下方式,获得各台服务器的可用资源的第二资源信息:获得服务器的网络资源中当前被占用的带宽资源信息,并获得服务器的计算资源中当前被占用的计算资源信息;获得服务器处于连接状态的长连接中对应于图文类型的任务请求的第一连接的数量、对应于音视频类型的任务请求的第二连接的数量、空闲的第三连接的数量以及处于连接状态的长连接的平均创建耗时;根据所述带宽资源信息、第一连接的数量、第二连接的数量、第三连接的数量以及平均创建耗时,获得第一特征;根据所述计算资源信息、第一连接的数量、第二连接的数量、第三连接的数量以及平均创建耗时,获得第二特征;根据所述第一特征和所述第二特征,获得服务器的可用资源的第二资源信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一特征和所述第二特征,获得服务器的可用资源的第二资源信息,包括:将所述第一特征和所述第二特征输入预先训练的可用资源预测模型,得到所述可用资源预测模型输出的服务器的可用资源的第二资源信息;其中,所述可用资源预测模型为:以第一样本特征和第二样本特征为输入,以样本数据中的可用资源的样本资源信息为监督信息,对预设的第一神经网络模型进行训练得到的用于预测服务器的可用资源的资源信息的模型;所述样本数据为:按照预设周期对样本服务器进行数据采集得到的数据;所述第一样本特征为:根据所述样本数据中包括的样本带宽资源信息、第一样本连接的数量、第二样本连接的数量、第三样本连接的数量以及样本平均创建耗时获得的特征,所述第二样本特征为:根据所述样本计算资源信息、第一样本连接的数量、第二样本连接的数量、第三样本连
接的数量以及样本平均创建耗时获得的特征。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述根据响应图文类型对应的任务请求所需资源的历史资源信息,获得响应所述目标任务请求所需资源的第一资源信息,包括:获得各台服务器在预设的第一历史时长内响应图文类型对应的任务请求所需带宽资源的历史平均带宽资源信息;获得各台服务器在所述第一历史时长内响应图文类型对应的任务请求所需计算资源的历史平均计算资源信息;获得根据所述第一历史时长内响应图文类型对应的任务请求所需带宽资源的历史最大值和预设的第二历史时长内响应图文类型对应的任务请求所需带宽资源的平均值确定的第一浮动系数;获得根据所述第一历史时长内响应图文类型对应的任务请求所需计算资源的历史最大值和所述第二历史时长内响应图文类型对应的任务请求所需计算资源的平均值确定的第二浮动系数;根据所述历史平均带宽信息和所述第一浮动系数获得带宽资源预测值,并根据所述历史平均计算资源信息和所述第二浮动系数获得计算资源预测值,得到所述带宽资源预测值、计算资源预测值表示的响应所述目标任务请求所需资源的第一资源信息。5.根据权利要求1

3中任一项所述的方法,其特征在于,所述根据所述目标任务请求对应的数据特征,获得所述第一资源信息,包括:若所述目标任务请求对应的数据类型为音频子类型,获得根据音频的比特率、采样率以及音频道数确定的数据特征;若所述目标任务请求对应的数据类型为视频子类型,获得根据视频中画面的分辨率、帧率、码率以及视频中声音的比特率、采样率、音频道数确定的数据特征;根据所述数据特征,获得所述第一资源信息。6.根据权利要求5所述的方法,其特征在于,所述根据所述数据特征,获得所述第一资源信息,包括:将所述数据特征输入预先训练的所需资源预测模型,获得所述所需资源预测模型输出的第一资源信息,其中,所述所需资源预测模型为:以样本数据特征为输入,以响应样本任务请求消耗资源的样本资源信...

【专利技术属性】
技术研发人员:潘建东徐政钧刘逸雄谷航宇
申请(专利权)人:中信建投证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1