一种响应时间保障型集群系统及其规模调整方法技术方案

技术编号:38534853 阅读:19 留言:0更新日期:2023-08-19 17:06
本发明专利技术提供一种响应时间保障型集群系统及其规模调整方法,通过采用循环队列覆盖式统计记录并计算预设时间内的负载的五项特征的采样值,准确反映集群的情况,同时基于平均响应时间评估集群系统服务质量,并根据集群系统服务质量水平在期望范围时的具体负载各特征值与集群规模实际提供值来为样本,以负载的各项特征与集群系统服务质量间的变化关联程度为判定特征的重要依据,生成阈值决策树,使得生成的阈值决策树更能反应负载与系统服务质量之间的联系,进而从而实现快速根据当前负载各特征值得出与之匹配的集群规模,及时将系统集群规模调整为合适大小。集群规模调整为合适大小。集群规模调整为合适大小。

【技术实现步骤摘要】
一种响应时间保障型集群系统及其规模调整方法


[0001]本专利技术涉及计算机系统结构领域,具体涉及一种响应时间保障型集群系统及其规模调整方法。

技术介绍

[0002]集群系统广泛用于各类云、雾计算,由于其负载多变,集群的规模通常为可伸缩设计,以保证系统能效。但在进行集群规模调整时,不能一味的以保证能效为目标而忽略系统的服务质量。集群规模应当匹配当前负载的服务质量要求,否则,规模太小无法保证服务质量,规模过大带来服务资源浪费会降低系统能效。负载通常是持续变化的,对集群规模的调整应当快速且准确。传统的反应式集群规模调整方法,不会评估集群规模多大才匹配负载需求,所以在实际服务质量偏离期望的标准时,只能通过逐步尝试,如每次增加或减少1个集群工作节点数量的方式进行集群规模的调整,由于逐步尝试延误了调整时机,难以将系统的服务质量与能效保持在良好的水准。为了弥补这种缺陷,新近的方法为求准确,会考虑大量参数以确定的模型来评估最佳集群规模,但由于实际负载不仅强度在持续变化,其资源需求如空间要求、计算量要求等各方面也是在持续变化,确定的模型可能短时期内比较准确,但随着负载的变化,很可能不再适合于后续负载的状况。
[0003]因此,动态持续地根据负载实际情况快速将集群规模调整至合适大小有着重要意义。需要注意的是,若集群规模无法及时被调整为适合的大小,那么在调整后,如果规模过小会使严重影响系统服务质量,如果规模过大则难以保证系统能效水平。故而,准确地评估出当前负载对系统规模的需求是非常关键的。从实际上来说,做到评估完全准确是不太可能的,但评估结果越接近实际需求值,那么微调的代价就会越小,更能保证系统的服务质量与能效水平。不少现有技术追求极致的数学模型来实现对需求的评估,但由于实际系统的运行设计因素众多难以全面把握,在通用负载情况下(负载对资源的使用模式多变),往往越极致的数学模型越容易出现大偏差,此外,极致的数学模型所需要的数据在采集时带来的资源开销额外增加了系统负担。

技术实现思路

[0004]针对上述现有技术中存在的不足,本专利技术提供一种响应时间保障型集群系统及其规模调整方法,实现高效地监测负载状况并动态持续地确定集群规模并将系统集群规模调整为合适大小。
[0005]一种响应时间保障型集群系统及其规模调整方法,所述一种响应时间保障型集群规模调整方法包括:S1、通过负载检测模块持续地监测负载情况,并采用循环队列统计记录并计算预设时间内的负载中的任务带来率R
ar
、任务到来间隔的变异系数CoV
ar
、已完成的负载任务的平均响应时间T
rt
、任务服务时间的变异系数CoV
st
和集群工作节点的平均任务服务率R
sr
等五个方面的特征的采样值;S2、通过服务质量监测模块将预设时间内的已完成的负载任务的平均响应时间T
rt
与其预设的响应时间标准E
rt
做对比,评估出集群系统的服务
质量情况;S3、通过阈值设定调整模块持续分析负载的各项特征的采样值R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
与集群系统服务质量间的变化关联程度,然后依据关联程度由大到小的顺序,依次设定负载各项特征的初始阈值;S4、通过规模调整模块对集群系统的规模进行调整,具体步骤包括S41、所述规模调整模块从服务质量监测模块获取当前集群系统服务质量情况;S42、若集群系统服务质量水平在期望范围内时,所述阈值设定调整模块获取当前负载各个特征的采样值与当前集群规模值并将其作为一个样本收集记录,当累积定量样本后,以样本中与集群系统服务质量间关联程度最大的负载特征为划分依据,以信息增益最大化原则确定最佳划分值,调整初始阈值,生成阈值决策树;S43、若服务质量水平不在期望的范围内,则采用阈值设定调整模块生成的阈值决策树,将当前负载的各项特征采样值与各调整后的初始阈值逐一进行比较,确定适合于当前负载情况的最佳集群规模,并通过状态切换的方式切换处于工作状态和空闲状态的集群服务节点状态,将集群工作节点调整为相应数量;S5、通过任务分发模块接收负载,根据负载检测模块得到的各集群工作节点的任务服务率情况,以先来先服务的方式,每次选择任务服务率最高的集群工作节点,将任务逐一进行分发,集群工作节点对收到的任务进行处理并在处理完毕之后根据实际需要向用户终端返回响应。
[0006]优选地,步骤S1中,所述循环队列采用覆盖式存储记录,所述负载检测模块监测R
ar
与CoV
ar
时,采用循环队列A并依照时间先后顺序记录到来任务的到来时间,并在预设统计时间根据该循环队列A里的记录计算出R
ar
与CoV
ar
;在监测CoV
st
与R
sr
时,采用循环队列B并依照时间先后顺序记录完成的任务的服务时间,并在预设统计时间根据该循环队列
B
里的记录计算出CoV
st
与R
sr

[0007]优选地,所述的步骤S2具体步骤为:S21、通过服务质量监测模块为每个集群工作节点设置一个循环队列C;S22、各集群工作节点每完成的一个任务时,将该任务的响应时间记录到对应集群工作节点的循环序列之中;S23、预设时长后遍历所有循环队列记录并计算出已完成的负载任务的平均响应时间T
rt
,将T
rt
与预设的响应时间标准作对比,评估出集群系统服务质量状况。
[0008]优选地,所述的步骤S3中R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
与集群系统服务质量间的变化关联程度的判断具体为:S31、所述阈值设定调整模块获取将最新样本前的连续时间段内的负载各特征的采样值,具体包含R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
;S32、将各时间段负载的特征的采样值作为分析统计数据,分别计算出服务质量相对率P
rq
以及P
rq
与R
ar
的相关系数P
rq
与CoV
ar
的相关系数P
rq
与T
rt
的相关系数P
rq
与CoV
st
的相关系数和P
rq
与R
sr
的相关系数等,其中,式中E
rt
为预设的响应时间标准;S33、相关系数值和的大小即对应判别负载的各项特征与集群系统服务质量间的变化关联程度的大小。
[0009]优选地,步骤S43中服务质量水平不在期望的范围包括两种情况,一种是平均响应时间T
rt<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种响应时间保障型集群规模调整方法,其特征在于,包括以下步骤:S1、通过负载检测模块持续地监测负载情况,并采用循环队列统计记录并计算预设时间内的负载中的任务带来率R
ar
、任务到来间隔的变异系数CoV
ar
、已完成的负载任务的平均响应时间T
rt
、任务服务时间的变异系数CoV
st
和集群工作节点的平均任务服务率R
sr
等五个方面的特征的采样值;S2、通过服务质量监测模块将预设时间内的已完成的负载任务的平均响应时间T
rt
与其预设的响应时间标准E
rt
做对比,评估出集群系统的服务质量情况;S3、通过阈值设定调整模块持续分析负载的各项特征的采样值R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
与集群系统服务质量间的变化关联程度,然后依据关联程度由大到小的顺序,依次设定负载各项特征的初始阈值;S4、通过规模调整模块对集群系统的规模进行调整,其具体步骤包括S41、所述规模调整模块从服务质量监测模块获取当前集群系统服务质量情况;S42、若集群系统服务质量水平在期望范围内时,所述阈值设定调整模块获取当前负载各个特征的采样值与当前集群规模值并将其作为一个样本收集记录,当累积定量样本后,以样本中与集群系统服务质量间的变化关联程度最大的负载特征为划分依据,以信息增益最大化原则确定最佳划分值,调整初始阈值,生成阈值决策树;S43、若服务质量水平不在期望的范围内,则采用步骤S43中生成的阈值决策树,将当前负载的各项特征采样值与各调整后的初始阈值逐一进行比较,确定适合于当前负载情况的最佳集群规模,并通过状态切换的方式切换处于工作状态和空闲状态的集群服务节点状态,将集群工作节点调整为相应数量;S5、通过任务分发模块接收负载,根据负载检测模块得到的各集群工作节点的任务服务率情况,以先来先服务的方式,每次选择任务服务率最高的集群工作节点,将任务逐一进行分发,集群工作节点对收到的任务进行处理并在处理完毕之后根据实际需要向用户终端返回响应。2.根据权利要求1所述的一种响应时间保障型集群规模调整方法,其特征在于,步骤S1中,所述循环队列采用覆盖式存储记录,所述负载检测模块监测R
ar
与CoV
ar
时,采用循环队列A并依照时间先后顺序记录到来任务的到来时间,并在预设统计时间根据该循环队列A里的记录计算出R
ar
与CoV
ar
;在监测CoV
st
与R
sr
时,采用循环队列B并依照时间先后顺序记录完成的任务的服务时间,并在预设统计时间根据该循环队列B里的记录计算出CoV
st
与R
sr
。3.根据权利要求1所述的一种响应时间保障型集群规模调整方法,其特征在于,所述的步骤S2具体步骤为:S21、通过服务质量监测模块为每个集群工作节点设置一个循环队列C;S22、各集群工作节点每完成的一个任务时,将该任务的响应时间记录到对应集群工作节点的循环序列C之中;S23、预设时长后遍历所有循环队列C记录并计算出已完成的负载任务的平均响应时间T
rt
,将T
rt
与预设的响应时间标准作对比,评估出集群系统服务质量状况。4.根据权利要求1所述的一种响应时间保障型集群规模调整方法,其特征在于,所述的步骤S3中R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
与集群系统服务质量间的变化关联程度的判断步骤具体为:
S31、所述阈值设定调整模块获取将最新样本前的连续时间段内的负载各特征的采样值,具体包含R
ar
、CoV
ar
、T
rt
、CoV
st
、R
sr
;S32、将各时间段负载的特征的采样值作为分析统计数据,分别计算出服务质量相对率P
rq
以及P
rq
与R
ar
的相关系数P
rq
与CoV
ar
的相关系数P
rq
与T
rt
的相关系数P
rq
与CoV
st
的相关系数和P
rq
与R
sr
的相关系数等,其中,式中E
rt
为预设的响应时间标准;S33、相关系数值和的大小即对应判别负载的各项特征与集群系统服务质量间的变化关联程度的大小。5.根据权利要求1所述的一种响应时间保障型集群规模调整方法,其特征在于,步骤S43中服务质量水平不在期望的范围包括两种情况,一种是平...

【专利技术属性】
技术研发人员:胡程
申请(专利权)人:广东外语外贸大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1