System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练及多品订货量预测方法、计算机设备和介质技术_技高网

模型训练及多品订货量预测方法、计算机设备和介质技术

技术编号:41836107 阅读:6 留言:0更新日期:2024-06-27 18:19
本申请涉及一种模型训练及多品订货量预测方法、计算机设备和介质。所述方法包括:基于预先从多个生鲜门店采集的多条样本数据构造多条训练样本;构建多品订货量预测模型;使用该多条训练样本对该多品订货量预测模型进行训练;该多品订货量预测模型,用于根据输入的训练样本生成多维度特征,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列;基于自注意力机制将接收到的输入序列转换为第一过渡序列;通过线性变换将第一过渡序列转换为第二过渡序列,从第二过渡序列中提取多品订货量预测信息并输出。本申请实施例能够准确预测多种生鲜商品的订货量。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种模型训练及多品订货量预测方法、计算机设备和介质


技术介绍

1、生鲜门店是指专门销售未经加工或简单加工的新鲜食品的零售商店,这些食品通常包括新鲜蔬菜、水果、肉类、海鲜、奶制品和熟食等。生鲜门店的特点是商品的保质期较短,需要快速流通以保证食品的新鲜度和质量。由于生鲜商品易腐烂,因此这类门店在商品的采购、库存管理、订货策略以及销售策略等方面都面临着特别的挑战。为了让消费者买到更新鲜的商品,一些生鲜门店还采用日清模式。日清模式是指门店当天进的商品必须在当天卖完清空,在日清模式下,所有商品的销售期限都为1天,为了实现日清,生鲜门店会在晚间进行打折销售,到了打烊时间还没卖完的商品则会直接报损。

2、生鲜门店主要依靠店长或店员的人工经验来进行订货,包括确定需要订货的生鲜商品以及各种生鲜商品的需求量(需求量通常就是订货量),然而,人的经验良莠不齐,而且人的算力有限,因此难以实现准确订货。近年来,随着人工智能技术的发展,有不少企业利用基于机器学习、深度学习的数据分析技术来预测市场对特定商品的需求,进而基于预测的需求信息如商品的销售量来进行订货。然而,与其他类别的商品相比,生鲜商品具有季节性强、保质期短、非标准化三大特点,它在销售数据上会呈现出品项时有时无、售价波动大、滞销和畅缺频发等特点,而且,生鲜商品之间有较强的相关性,包括互补性和替代性。目前的商品需求预测方案并未充分考虑到生鲜商品的上述特点,因而还无法实现准确预测生鲜商品的需求。例如,时间序列预测模型是常用的用于预测商品需求的模型,但是,很多生鲜商品在生鲜门店中时有时无,其订货和销售数据在时间轴上也是断断续续的,因此难以直接用时间序列预测模型来预测生鲜商品的需求量。又例如,生鲜商品之间存在相关性,因此商品需求预测领域中常用的单品预测模型无法用于预测生鲜商品的需求,此时需要引入多品预测模型,可是传统的机器学习和深度学习的输入特征是固定的,难以应对品项时有时无的生鲜商品,而如果对历史上所有生鲜商品都构建一个或多个相应的特征,那么特征量将非常庞大,且数据会非常稀疏,这会导致多品预测模型难以进行训练。此外,商品需求预测时通常是预测商品未来的销售量,即以商品的销售量作为商品的需求量,可是生鲜商品存在滞销、畅缺情况频发的特点,这导致生鲜商品的销售量往往不等于需求量,因而如果只是对生鲜商品的销售量进行预测,将得不到真实需求量,而如果要预测多种生鲜商品的需求量,目前的商品需求预测方案则难以实现。


技术实现思路

1、本申请针对上述不足或缺点,提供了一种模型训练及多品订货量预测方法、计算机设备和介质,该方法能够准确预测多种生鲜商品的订货量。

2、本申请根据第一方面提供了一种模型训练方法,在一些实施例中,该方法包括:

3、基于预先从多个生鲜门店采集的多条样本数据构造多条训练样本;

4、构建多品订货量预测模型;

5、使用该多条训练样本对该多品订货量预测模型进行训练;

6、该多品订货量预测模型,用于根据输入的训练样本生成多维度特征,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列;基于自注意力机制将接收到的输入序列转换为第一过渡序列;通过线性变换将第一过渡序列转换为第二过渡序列,从第二过渡序列中提取多品订货量预测信息并输出;该多维度特征包括该训练样本相关的生鲜门店的门店特征、多个门店销售日的日期特征和天气特征、每种订货商品的静态商品特征和包括实际销售进度特征的动态经营特征、每种不订货商品的静态商品特征和动态经营特征。

7、在一些实施例中,使用该多条训练样本对该多品订货量预测模型进行训练,包括:

8、依次按照日期分箱和序列长度分箱的方式将该多条训练样本分为多个批次;

9、确定各个批次的日期,根据各个批次的日期确定各个批次的训练次序;

10、按照各个批次的训练次序依次使用各个批次对该多品订货量预测模型进行训练。

11、在一些实施例中,针对该多品订货量预测模型的每次训练的训练过程,包括:

12、将一批次的训练样本分别输入该多品订货量预测模型;

13、获取该多品订货量预测模型输出的各训练样本相应的多品订货量预测信息;

14、基于各训练样本相应的多品订货量预测信息和多品订货量真实信息计算预测损失;

15、根据预测损失更新该多品订货量预测模型的模型参数。

16、在一些实施例中,根据该多维度特征构造多个序列单元,根据该多个序列单元构造输入序列,包括:

17、将门店特征作为一个序列单元,记为第一序列单元;

18、将每个门店销售日的日期特征和天气特征合并为一个序列单元,记为第二序列单元;第二序列单元的数量与门店销售日的数量相同;

19、将每种订货商品的静态商品特征和包括实际销售进度特征的动态经营特征合并为一个序列单元,记为第三序列单元;第三序列单元的数量与订货商品的种类数量相同;

20、将每种不订货商品的静态商品特征和动态经营特征合并为一个序列单元,记为第四序列单元;第四序列单元的数量与不订货商品的种类数量相同;

21、将第一序列单元、每一第二序列单元、每一第四序列单元与任一第三序列单元进行特征对齐,使得所有序列单元的维度相同,之后根据所有序列单元构造得到输入序列。

22、在一些实施例中,将第一序列单元、每一第二序列单元、每一第四序列单元与任一第三序列单元进行特征对齐,包括:

23、通过第一特征空间对齐变换矩阵处理第一序列单元,使得处理后的第一序列单元的维度与第三序列单元的维度相同;

24、通过第二特征空间对齐变换矩阵处理每个第二序列单元,使得每个处理后的第二序列单元的维度与第三序列单元的维度相同;

25、通过第三特征空间对齐变换矩阵处理每个第四序列单元,使得每个处理后的第四序列单元的维度与第三序列单元的维度相同。

26、在一些实施例中,根据所有序列单元构造得到输入序列,包括:

27、在特征对齐后,将所有序列单元进行堆叠,得到初始输入序列;

28、获取本次训练所用批次的最大序列长度;

29、判断初始输入序列的序列长度是否小于最大序列长度;

30、若是,在初始输入序列中添加填充单元,以获得序列长度等于最大序列长度的输入序列;填充单元的序列长度等于最大序列长度减去初始输入序列的序列长度。

31、在一些实施例中,基于自注意力机制将接收到的输入序列转换为第一过渡序列时,通过预先构建的填充单元掩码机制对输入序列中每个填充单元进行掩码处理,使得每个填充单元的注意力权重近似为0。

32、在一些实施例中,每个门店销售日的日期特征包括节假日类别特征和节假日位置特征,每个门店销售日的节假日类别特征用于表示该门店销售日对应的节假日类别;该节假日类别包括非节假日和多种节假日;对于任一门店销售日,当该门店销售日的本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,使用所述多条训练样本对所述多品订货量预测模型进行训练,包括:

3.如权利要求1或2所述的方法,其特征在于,针对所述多品订货量预测模型的每次训练的训练过程,包括:

4.如权利要求1所述的方法,其特征在于,根据所述多维度特征构造多个序列单元,根据所述多个序列单元构造输入序列,包括:

5.如权利要求4所述的方法,其特征在于,将所述第一序列单元、每一所述第二序列单元、每一所述第四序列单元与任一所述第三序列单元进行特征对齐,包括:

6.如权利要求1所述的方法,其特征在于,基于自注意力机制将接收到的输入序列转换为第一过渡序列时,通过预先构建的日期掩码机制对所述输入序列中的每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后的日期和天气特征的注意力权重进行掩码处理,使得每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后的日期和天气特征的注意力权重为0。

7.如权利要求4所述的方法,其特征在于,每个门店销售日的日期特征包括节假日类别特征和节假日位置特征,每个门店销售日的节假日类别特征用于表示该门店销售日对应的节假日类别;所述节假日类别包括非节假日和多种节假日;对于任一门店销售日,当该门店销售日的节假日类别特征表示该门店销售日对应的节假日类别是任一种节假日时,该门店销售日的节假日位置特征用于表示该门店销售日位于节假日的哪一天。

8.一种多品订货量预测方法,其特征在于,所述方法包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,使用所述多条训练样本对所述多品订货量预测模型进行训练,包括:

3.如权利要求1或2所述的方法,其特征在于,针对所述多品订货量预测模型的每次训练的训练过程,包括:

4.如权利要求1所述的方法,其特征在于,根据所述多维度特征构造多个序列单元,根据所述多个序列单元构造输入序列,包括:

5.如权利要求4所述的方法,其特征在于,将所述第一序列单元、每一所述第二序列单元、每一所述第四序列单元与任一所述第三序列单元进行特征对齐,包括:

6.如权利要求1所述的方法,其特征在于,基于自注意力机制将接收到的输入序列转换为第一过渡序列时,通过预先构建的日期掩码机制对所述输入序列中的每种生鲜商品对相应日期位于该种生鲜商品的销售期限之后的日期和天气特征的注意力权重进行掩码处理,使得每种生鲜商品对相应日期位于...

【专利技术属性】
技术研发人员:熊礼平张文胜陈祥龙
申请(专利权)人:杭州铭信信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1