用于在线资源分配的方法及装置制造方法及图纸

技术编号:33071014 阅读:14 留言:0更新日期:2022-04-15 10:05
本公开提供一种用于在线资源分配的方法及装置。该方法包括:获取关于当前和历史在线资源分配请求量的信息;基于所获取的信息来预测在未来特定时段内的在线资源分配请求量;基于预测的在线资源分配请求量、虚拟路由单元的处理能力和虚拟工作单元的处理能力来计算满足所述预测的在线资源分配请求量的算力配置;以及基于计算的算力配置来调整所述虚拟路由单元的数量和所述虚拟工作单元的数量。单元的数量和所述虚拟工作单元的数量。单元的数量和所述虚拟工作单元的数量。

【技术实现步骤摘要】
用于在线资源分配的方法及装置


[0001]本公开涉及在线资源分配领域,具体地,涉及一种用于实现低时延的在线资源分配的方法及装置。

技术介绍

[0002]在推荐、搜索、营销、广告系统中,在线决策一方面需要考虑点击率、转化率等偏好指标,另一方面可能会遇到资金、成本、流量等资源方面的限制。如何在有限资源的前提下,实现整体资源分配的最大化,这类问题被称为在线资源分配问题(Online Resource Allocation)。
[0003]在在线资源分配情况下,假设有K个关于资源(诸如红包、优惠券、电子券、消费券等的资源)的约束(例如,消费券的总数或总额度),针对每次在线决策的服务主体i(例如要分配资源的每个用户),在线决策的候选集可以离散化为J个选择(例如,J个在线资源分配方案),主体i关于每个选择j的收益为,关于资源约束的消耗为。因此,可以将在线资源分配建模为在全局资源约束下,求解0

1的决策变量,以实现整体收益最大化的线性规划(LP)的规划问题。
[0004]目前的在线资源分配的实现方案一般是采用以下三种:(1)离线训练模型和在线打分的组合:在这种方案下,在离线训练模型时可以增加约束信息,但这种方式会受限于模型更新的效率(例如,通常是几十分钟才更新一次),从而时效性较差;(2)实时规划和在线服务的组合:这种方案可以根据资源分配结果进行实时规划并求解决策变量,该决策变量可以是可控变量且可用于进行在线服务,这种实时规划求解所需的处理时间一般是分钟级,相比第一种方案在处理时间上有所减少,但上述两种方案对在线资源分配请求的处理都存在滞后性,导致实际算法效果有损失;(3)基于统计的近似方法:以几乎最优快速近似(Nearly Optimal Fast Approximation)算法为例,该算法可以利用方差对其最坏表现进行估计,每次的请求决策过程是通过减少算法失败的概率来获得算法的最佳收益,它可以对算法进行分布式化并针对在线请求进行局部优化决策,实际算法效果损失较小。
[0005]然而,上述方案的在线资源分配方式灵活性差且无法应对突发的流量高峰,资源利用率低。有鉴于此,需要提出一种新的方案以克服上述缺陷。

技术实现思路

[0006]鉴于上述问题,在基于统计的近似方法进行在线资源分配时,本公开提出了一种用于在线资源分配的技术,用以通过根据请求量来自动调整虚拟路由单元和虚拟计算单元的数量从而确保低时延的在线资源分配。
[0007]根据本公开的一个方面,提供了一种用于在线资源分配的方法,包括:获取关于当前和历史在线资源分配请求量的信息;基于所获取的信息来预测在未来特定时段内的在线资源分配请求量;基于预测的在线资源分配请求量、虚拟路由单元的处理能力和虚拟工作
单元的处理能力来计算满足所述预测的在线资源分配请求量的算力配置;以及基于计算的算力配置来调整所述虚拟路由单元的数量和所述虚拟工作单元的数量。
[0008]可选地,在上述方面的一个示例中,当所述预测的在线资源分配请求量相比当前在线资源分配请求量上升时,增加所述虚拟路由单元的数量和/或增加所述虚拟工作单元的数量。
[0009]可选地,在上述方面的一个示例中,当所述预测的在线资源分配请求量相比当前在线资源分配请求量下降时,减少所述虚拟路由单元的数量和/或所述虚拟工作单元的数量。
[0010]可选地,该方法还可以包括:监测容器组的资源信息,其中,所述容器组包括一个或多个虚拟路由单元以及一个或多个虚拟工作单元,所述资源信息指示所述容器组的当前在线资源是否充足;以及当监测到的资源信息指示所述容器组的当前在线资源不充足时,将该容器组中的一个或多个虚拟路由单元和/或一个或多个虚拟工作单元调整到具有充足在线资源的其它容器组中。
[0011]根据本公开的另一方面,提供一种用于在线资源分配的装置,包括:获取单元,被配置为获取关于当前和历史在线资源分配请求量的信息;预测单元,被配置为基于所获取的信息来预测在未来特定时段内的在线资源分配请求量;计算单元,被配置为基于预测的在线资源分配请求量、虚拟路由单元的处理能力和虚拟工作单元的处理能力来计算满足所述预测的在线资源分配请求量的算力配置;以及调整单元,被配置为基于所计算的算力配置来调整所述虚拟路由单元的数量和所述虚拟工作单元的数量。
[0012]根据本公开的另一方面,提供一种计算设备,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器运行时,使得所述至少一个处理器执行如上所述的用于在线资源分配的方法。
[0013]根据本公开的另一方面,提供一种机器可读介质,其存储有可执行指令,所述指令当被运行时使得所述机器执行如上所述的用于在线资源分配的方法。
[0014]在本公开的实施例中,可以对服务路由器和算法工作单元的角色进行抽象化或虚拟化,使其不再绑定具体的进程和/或线程结构。通过采用对未来时段的资源分配请求量进行预测的方式,可以根据预测的请求量提前对服务路由器和算法工作单元的数量进行调整,从而确保低时延的在线资源分配。
附图说明
[0015]通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。附图是用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开的实施例,但并不构成对本公开的实施例的限制。
[0016]图1示出了当前在线资源分配的部署方案的架构图。
[0017]图2示出了根据本公开的实施例的在线资源分配的部署方案的示意性架构图。
[0018]图3示出了根据本公开的实施例的在线资源分配方案中对服务路由器和算法工作单元的数量进行调整的部署方案的示意性架构图。
[0019]图4示出了根据本公开的实施例的在线资源分配方案中对服务路由器和算法工作
单元的数量进行调整的另一个部署方案的示意性架构图。
[0020]图5示出了根据本公开的实施例的用于实现低时延的在线资源分配的方法的示意性流程图。
[0021]图6示出了根据本公开的实施例的用于实现低时延的在线资源分配的装置的示意性方框图。
[0022]图7示出了根据本公开的实施例的用于实现低时延的在线资源分配的计算设备的示意性硬件结构图。
具体实施方式
[0023]现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对本公开内容中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
[0024]如本文中使用的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于在线资源分配的方法,包括:获取关于当前和历史在线资源分配请求量的信息;基于所获取的信息来预测在未来特定时段内的在线资源分配请求量;基于预测的在线资源分配请求量、虚拟路由单元的处理能力和虚拟工作单元的处理能力来计算满足所述预测的在线资源分配请求量的算力配置;以及基于计算的算力配置来调整所述虚拟路由单元的数量和所述虚拟工作单元的数量。2.如权利要求1所述的方法,其中,当所述预测的在线资源分配请求量相比当前在线资源分配请求量上升时,增加所述虚拟路由单元的数量和/或增加所述虚拟工作单元的数量。3.如权利要求2所述的方法,其中,增加所述虚拟工作单元的数量进一步包括:针对当前的虚拟路由单元添加新的虚拟工作单元。4.如权利要求2所述的方法,其中:增加所述虚拟路由单元的数量进一步包括:在与所述虚拟路由单元相关联的容器组中添加新的虚拟路由单元;以及增加所述虚拟工作单元的数量进一步包括:针对所述新的虚拟路由单元添加新的虚拟工作单元。5.如权利要求1所述的方法,其中,当所述预测的在线资源分配请求量相比当前在线资源分配请求量下降时,减少所述虚拟路由单元的数量和/或所述虚拟工作单元的数量。6.如权利要求5所述的方法,其中,减少所述虚拟路由单元的数量进一步包括:向所述虚拟路由单元发送通知以指示所述虚拟路由单元执行以下操作:拒绝接收新的请求,以及在与所述虚拟路由单元相关联的虚拟工作单元处理完当前的在线资源分配请求后从数据面退出。7.如权利要求5所述的方法,其中,减少所述虚拟工作单元的数量进一步包括:向所述虚拟工作单元发送通知以指示所述虚拟工作单元执行以下操作:在处理完当前的在线资源分配请求后退出运行。8.如权利要求1所述的方法,还包括:监测容器组的资源信息,其中,所述容器组包括一个或多个虚拟路由单元以及一个或多个虚拟工作单元,所述资源信息指示所述容器组的当前在线资源是否充足;以及当监测到的资源信息指示所述容器组的当前在线资源不充足时,将该容器组中的一个或多个虚拟路由单元和/或一个或多个虚拟工作单元调整到具有充足在线资源的其它容器组中。9.一种用于在线资源分配的装置,包括:获取单元,被配置为获取关于当前和历史在线资源分配请求量的信息;预测单元,被配置为基于所获取的信息来预测在未来特定时段内的在线资源分配请求量;计算单元,被配置为基于预测的在线资...

【专利技术属性】
技术研发人员:方丰斌杜荣杨霖薛涛朱文豪王煜郭宇梁方叶青解承莹王明
申请(专利权)人:北京蚂蚁云金融信息服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1