考虑可替代性的单周期端到端库存控制方法及产品技术

技术编号：39297072 阅读：21 留言：0更新日期：2023-11-07 11:05

本发明专利技术提供了一种考虑可替代性的单周期端到端库存控制方法及产品，涉及智能决策技术领域。本发明专利技术实施例中，所述方法包括：确定当前周期观察到的特征，将所述特征输入端到端库存决策模型，得到库存控制策略，所述库存控制策略表示为多维向量，代表每种等级资源的采购数量。本发明专利技术实施例中，端到端库存决策模型的输入是可观察到的特征，输出是库存控制策略。相比于传统的先预测后优化框架，端到端库存决策模型在实际生产环境中部署更容易，使用更简单，决策更高效，并且，本发明专利技术实施例提出的端到端库存决策模型训练高效，还可以学习到相关的库存控制策略。库存控制策略。库存控制策略。

全部详细技术资料下载

【技术实现步骤摘要】
考虑可替代性的单周期端到端库存控制方法及产品

[0001]本专利技术实施例涉及智能决策
，尤其涉及一种考虑可替代性的单周期端到端库存控制方法及产品。

技术介绍

[0002]在考虑可替代性的库存(以下简称可替代库存)系统中，需求可以被不同等级(类型)的资源满足。考虑可替代性的库存控制问题(以下简称可替代库存问题)的目标是控制不同等级资源的库存，以更好地匹配需求，从而使系统的总成本达到最小。可替代库存在许多生产或服务系统中被广泛应用。公司可以灵活使用他们的各种资源，以不同的成本满足客户的随机需求，从而降低企业成本，提升利润。例如，回收品再制造商可以再制造不同等级的旧产品，以满足客户的需求。由于交货时间长，订单时间窗口短，再制造商需要在真实需求揭露之前就从回收商那里提前购买回收品。在收到客户的订单后，再制造商会对回收品进行再制造。通常，回收品被分为不同等级，其收购价格和再制造成本都不同。高等级回收品的收购成本高，再制造成本低，低等级回收品则反之。如何在这两种成本之间进行权衡，对于再制造企业来说至关重要。云计算公司为其客户提供远程计算服务。在客户需求揭露之前，公司需要提前配置计算环境，如高性能计算平台、特定的软件服务等。同时，客户的需求可以通过不同的配置得到满足。例如，计算需求可以通过配置不同型号的CPU服务器来满足。类似的设定也可以在航空公司座舱分配、电动汽车充电服务等例子中找到。
[0003]合理配置各种资源的库存水平是十分棘手的问题。不同的资源有不同的采购成本(在购买资源时产生)和服务成本(在满足客户需求...

【技术保护点】

【技术特征摘要】
1.一种考虑可替代性的单周期端到端库存控制方法，其特征在于，所述方法包括：确定当前周期观察到的特征，将所述特征输入端到端库存决策模型，得到库存控制策略，所述库存控制策略表示为多维向量，代表每种等级资源的采购数量；所述端到端库存决策模型的训练样本包括：样本特征和对应的历史真实需求，所述端到端库存决策模型的训练过程为无标签学习，所述端到端库存决策模型的输出为最小化经验成本的库存控制策略A＝h(x)；所述最小化经验成本表示为：其中，是神经网络模型h在给定数据集H
n
下的经验成本，H
n
＝[(x1，d1)，...，(x
n
，d
n
)]，是所有神经网络模型的集合，x
i
表示第i个样本的特征，d
i
表示第i个样本的历史真实需求。2.根据权利要求1所述的考虑可替代性的单周期端到端库存控制方法，其特征在于，在所述神经网络模型的输入为x＝(x1，...，x
i
，...，x
d
)的情况下，第一层隐藏层的输入通过计算，第一层隐藏层的输出为b
1j
＝g(a
1j
)，其中函数g(
·
)为激活函数；对于隐藏层l，其输入为输出为b
lj
＝g(a
lj
)；所述神经网络模型的输出通过计算。3.根据权利要求2所述的考虑可替代性的单周期端到端库存控制方法，其特征在于，所述神经网络模型的训练目标是找到一组参数：最小化经验成本；其中n，m根据不同层之间的神经元的数量设置；所述神经网络模型通过反复使用训练数据集调整权重Wi来进行训练。4.根据权利要求3所述的考虑可替代性的单周期端到端库存控制方法，其特征在于，计算梯度并通过以下方式对权重进行更新：其中η为学习率。5.根据权利要求4所述的考虑可替代性的单周期端到端库存控制方法，其特征在于，通过链式法则计算梯度：其中，其中c
i
是资源单位采购成本，φ
i
，λ
i
是如下优化问题的最优解：max∑
i
(φ
i
‑

【专利技术属性】
技术研发人员：张智海，龚海磊，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人