当前位置: 首页 > 专利查询>清华大学专利>正文

考虑可替代性的单周期端到端库存控制方法及产品技术

技术编号:39297072 阅读:21 留言:0更新日期:2023-11-07 11:05
本发明专利技术提供了一种考虑可替代性的单周期端到端库存控制方法及产品,涉及智能决策技术领域。本发明专利技术实施例中,所述方法包括:确定当前周期观察到的特征,将所述特征输入端到端库存决策模型,得到库存控制策略,所述库存控制策略表示为多维向量,代表每种等级资源的采购数量。本发明专利技术实施例中,端到端库存决策模型的输入是可观察到的特征,输出是库存控制策略。相比于传统的先预测后优化框架,端到端库存决策模型在实际生产环境中部署更容易,使用更简单,决策更高效,并且,本发明专利技术实施例提出的端到端库存决策模型训练高效,还可以学习到相关的库存控制策略。库存控制策略。库存控制策略。

【技术实现步骤摘要】
考虑可替代性的单周期端到端库存控制方法及产品


[0001]本专利技术实施例涉及智能决策
,尤其涉及一种考虑可替代性的单周期端到端库存控制方法及产品。

技术介绍

[0002]在考虑可替代性的库存(以下简称可替代库存)系统中,需求可以被不同等级(类型)的资源满足。考虑可替代性的库存控制问题(以下简称可替代库存问题)的目标是控制不同等级资源的库存,以更好地匹配需求,从而使系统的总成本达到最小。可替代库存在许多生产或服务系统中被广泛应用。公司可以灵活使用他们的各种资源,以不同的成本满足客户的随机需求,从而降低企业成本,提升利润。例如,回收品再制造商可以再制造不同等级的旧产品,以满足客户的需求。由于交货时间长,订单时间窗口短,再制造商需要在真实需求揭露之前就从回收商那里提前购买回收品。在收到客户的订单后,再制造商会对回收品进行再制造。通常,回收品被分为不同等级,其收购价格和再制造成本都不同。高等级回收品的收购成本高,再制造成本低,低等级回收品则反之。如何在这两种成本之间进行权衡,对于再制造企业来说至关重要。云计算公司为其客户提供远程计算服务。在客户需求揭露之前,公司需要提前配置计算环境,如高性能计算平台、特定的软件服务等。同时,客户的需求可以通过不同的配置得到满足。例如,计算需求可以通过配置不同型号的CPU服务器来满足。类似的设定也可以在航空公司座舱分配、电动汽车充电服务等例子中找到。
[0003]合理配置各种资源的库存水平是十分棘手的问题。不同的资源有不同的采购成本(在购买资源时产生)和服务成本(在满足客户需求时产生)。当配置的资源过多时,会有较高的采购成本;当分配的资源过少时,未满足的需求会有较高的缺货成本。当需求较为稳定时,配置一些总成本(采购成本加服务成本)最低的资源是比较合适的,因为这样可以使成本最小化。然而,当需求不太稳定时,有必要配置一些采购成本较低的资源(可能服务成本较高),这是因为,当需求较高时,这类资源可以减少缺货的概率;同时当需求较低时,其沉没成本也较低。
[0004]由于需求的不确定性,大多数库存管理方法采用一种称为“先预测后优化”的框架应对这一挑战。在这个框架中,决策者首先训练一个预测模型估计随机需求,之后根据估计的需求,解决相应的库存优化问题得到配置决策。不可避免的是,在第一步估计预测模型的参数时,有必要假设未知需求遵循一个特定的分布(如正态分布)或函数形式(如线性函数)。如果预测模型学习的分布与潜在的真实分布相匹配,那么通过求解优化问题就可以得到最优库存控制方案。然而,在许多相关的应用领域,需求分布并不是明确知道的,预先确定一个分布的形式会带来一定的问题:(1)需要较强的专家知识。不同产品的需求受不同因素的影响,例如:二手手机的需求受到客户评价、是否发布新机、价格等因素影响,云计算需求则表现出较强的周期性需求。可见,确定不同产品需求的形式或者服从的分布需要较为丰富的行业经验。(2)引入模型选择偏差。由于需求的高不确定性和不可知性,经验再丰富的专家也不可能完全确定正确的需求形式。不当的需求形式会引入模型选择偏差,此类偏
差会通过优化步骤进一步放大,从而导致决策的次优性。(3)决策效率低下。先预测后优化的决策框架需要在优化步骤调用优化模型求解器求解相应模型,这通常不满足时效性要求较高的场景如实时库存调度的需求,极大影响决策效率。
[0005]由此可见,为了应对企业在实际中遇到的库存决策复杂、时效性要求高以及传统先预测后优化的决策框架会引入模型选择偏差等问题,目前亟需一种新的单周期库存控制方法。

技术实现思路

[0006]本专利技术实施例提供一种考虑可替代性的单周期端到端库存控制方法及产品,以至少部分解决相关技术中存在的问题。
[0007]本专利技术实施例第一方面提供了一种考虑可替代性的单周期端到端库存控制方法,所述方法包括:
[0008]确定当前周期观察到的特征,将所述特征输入端到端库存决策模型,得到库存控制策略,所述库存控制策略表示为多维向量,代表每种等级资源的采购数量;
[0009]所述端到端库存决策模型的训练样本包括:样本特征和对应的历史真实需求,所述端到端库存决策模型的训练过程为无标签学习,所述端到端库存决策模型的输出为最小化经验成本的库存控制策略A=h(x);所述最小化经验成本表示为:
[0010]其中,是神经网络模型h在给定数据集H
n
下的经验成本,H
n
=[(x1,d1),

,(x
n
,d
n
)],是所有神经网络模型的集合,x
i
表示第i个样本的特征,d
i
表示第i个样本的历史真实需求。
[0011]可选地,在所述神经网络模型的输入为x=(x1,

,x
i
,

,x
d
)的情况下,第一层隐藏层的输入通过计算,第一层隐藏层的输出为b
1j
=g(a
1j
),其中函数g(
·
)为激活函数;对于隐藏层l,其输入为输出为b
lj
=g(a
lj
);所述神经网络模型的输出通过计算。
[0012]可选地,所述神经网络模型的训练目标是找到一组参数:
[0013][0014]最小化经验成本;
[0015]其中n,m根据不同层之间的神经元的数量设置;
[0016]所述神经网络模型通过反复使用训练数据集调整权重Wi来进行训练。
[0017]可选地,计算梯度并通过以下方式对权重进行更新:
[0018][0019]其中η为学习率。
[0020]可选地,通过链式法则计算梯度:
[0021][0022]其中,其中c
i
是资源单位采购成本,φ
i

i
是如下优化问题的最优解:
[0023]max∑
i

i

λ
i
)A
i
+μd;
[0024][0025]μ≤w;
[0026][0027][0028]其中,A
i
表示等级为i的资源采购数量;p表示产品单位售价,r
i
表示等级i资源单位服务成本,w表示未满足需求单位惩罚成本;s
i
表示等级i资源单位处理成本;
[0029]根据神经网络的反向传播计算公式,其中,b
lk
为神经网络隐藏层l的第k个神经元的输出。
[0030]可选地,所述神经网络模型采用五层网络架构,每层的神经元数量为11、5、5、5、3,采用ReLU激活函数。
[0031]可选地,确定当前周期观察到的特征,包括:将当前周期及之前的预设数量个历史周期观察到的特征作为当前周期观察到的特征。
[0032]本专利技术实施例第二方面提供了一种考虑可替代性的单周期端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种考虑可替代性的单周期端到端库存控制方法,其特征在于,所述方法包括:确定当前周期观察到的特征,将所述特征输入端到端库存决策模型,得到库存控制策略,所述库存控制策略表示为多维向量,代表每种等级资源的采购数量;所述端到端库存决策模型的训练样本包括:样本特征和对应的历史真实需求,所述端到端库存决策模型的训练过程为无标签学习,所述端到端库存决策模型的输出为最小化经验成本的库存控制策略A=h(x);所述最小化经验成本表示为:其中,是神经网络模型h在给定数据集H
n
下的经验成本,H
n
=[(x1,d1),...,(x
n
,d
n
)],是所有神经网络模型的集合,x
i
表示第i个样本的特征,d
i
表示第i个样本的历史真实需求。2.根据权利要求1所述的考虑可替代性的单周期端到端库存控制方法,其特征在于,在所述神经网络模型的输入为x=(x1,...,x
i
,...,x
d
)的情况下,第一层隐藏层的输入通过计算,第一层隐藏层的输出为b
1j
=g(a
1j
),其中函数g(
·
)为激活函数;对于隐藏层l,其输入为输出为b
lj
=g(a
lj
);所述神经网络模型的输出通过计算。3.根据权利要求2所述的考虑可替代性的单周期端到端库存控制方法,其特征在于,所述神经网络模型的训练目标是找到一组参数:最小化经验成本;其中n,m根据不同层之间的神经元的数量设置;所述神经网络模型通过反复使用训练数据集调整权重Wi来进行训练。4.根据权利要求3所述的考虑可替代性的单周期端到端库存控制方法,其特征在于,计算梯度并通过以下方式对权重进行更新:其中η为学习率。5.根据权利要求4所述的考虑可替代性的单周期端到端库存控制方法,其特征在于,通过链式法则计算梯度:其中,其中c
i
是资源单位采购成本,φ
i
,λ
i
是如下优化问题的最优解:max∑
i

i

【专利技术属性】
技术研发人员:张智海龚海磊
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1