基于大数据的食品销售数据挖掘分析方法技术

技术编号:38677926 阅读:12 留言:0更新日期:2023-09-02 22:52
本发明专利技术涉及数据处理技术领域,具体涉及一种基于大数据的食品销售数据挖掘分析方法,包括:按照设定的置信度阈值和销售周期,对食品销售数据进行数据挖掘,获取每种食品在每个销售周期下的关联规则集合和关联规则集合中每条关联规则的置信度;根据每种食品在每个销售周期下的价格、关联规则集合中每条关联规则及其置信度,进行数据处理,得到每种食品在每个销售周期下的动态调整参数,进而对置信度阈值进行调整,获取调整置信度阈值;基于该调整置信度阈值,对食品销售数据进行数据挖掘,获取最终的关联规则集合。本发明专利技术通过利用数据处理技术,避免了价格因素对数据挖掘中食品关联规则的影响,提高了食品销售关联规则挖掘的准确性。性。性。

【技术实现步骤摘要】
基于大数据的食品销售数据挖掘分析方法


[0001]本专利技术涉及数据处理
,具体涉及一种基于大数据的食品销售数据挖掘分析方法。

技术介绍

[0002]近年来,随着网络技术的发展和普及,在食品销售领域,大多数食品的销售行为已经从单纯的线下销售转换为线上销售的模式,尤其是食品中的农产畜牧分类。而在进行线上的农产畜牧食品销售时,会产生海量的销售数据,由于这些销售数据中包含了大量的具有价值的信息,因此通过对这些销售数据进行数据挖掘,可以从这些销售数据中提取有价值的信息、发现潜在的规律以及趋势,对农产畜牧食品的销售决策制定具有重要意义。
[0003]现有技术在对农产畜牧分类的食品进行数据挖掘时,通常是根据销售数据中单个产品的被购买的次数以及不同种类的食品被同时购买的次数,来量化对应的支持度和置信度,而后通过置信度阈值进行不同种类的农产畜牧食品的关联规则挖掘。但是考虑到不同于其余的食品,农产畜牧食品会受到季节、环境等多方面的因素影响,且不同种类的农产畜牧食品对于消费者的消费必要性不同,就会导致其价格存在较大的波动区间,而在不同的价格变化的影响下,就会导致所挖掘出的关联规则不够准确,进而影响农产畜牧食品的销售决策的准确制定,不利于农产畜牧食品的销售。

技术实现思路

[0004]本专利技术的目的在于提供一种基于大数据的食品销售数据挖掘分析方法,用于解决现有食品销售关联规则挖掘准确性低的问题。
[0005]为解决上述技术问题,本专利技术提供了一种基于大数据的食品销售数据挖掘分析方法,包括以下步骤:获取待挖掘的食品销售数据,按照设定的置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,获取每种食品在每个销售周期下的关联规则集合以及所述关联规则集合中每条关联规则的置信度;根据每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类的分布特征以及各条关联规则对应的置信度,确定每种食品在每个销售周期下的关联规则复杂程度;根据所述食品销售数据,确定每种食品在每个销售周期下的价格,根据所述价格和关联规则复杂程度,确定每种食品的最具有市场潜力价格;根据每种食品在每相邻两个销售周期下的价格的差异、关联规则集合中各条关联规则的个数的差异以及关联规则集合中各条关联规则中后项食品的总种类数的差异,确定每种食品对应的关联规则相关参数;根据每种食品对应的所述关联规则相关参数、每种食品在每个销售周期下的价格与对应的所述最具有市场潜力价格的差异、以及每种食品在每相邻两个销售周期下的价格
的差异,确定每种食品在每个销售周期下的动态调整参数;根据所述动态调整参数,对所述置信度阈值进行调整,获取每种食品在每个销售周期下的调整置信度阈值,并根据所述调整置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,确定每种食品在每个销售周期下的最终的关联规则集合。
[0006]进一步的,确定每种食品在每个销售周期下的关联规则复杂程度,包括:确定每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类对应的信息熵;确定每种食品在每个销售周期下的关联规则集合中各条关联规则的置信度的累加和,从而得到每种食品在每个销售周期下对应的置信度累加和;根据每种食品在每个销售周期下对应的信息熵和置信度累加和,确定每种食品在每个销售周期下的关联规则复杂程度,所述信息熵和置信度累加和均与所述关联规则复杂程度成正相关关系。
[0007]进一步的,确定每种食品对应的关联规则相关参数,包括:所述关联规则相关参数包括食品关联规则改变系数和食品种类规则改变系数,所述食品关联规则改变系数和食品种类规则改变系数对应的计算公式为:其中,和分别表示第n种食品对应的食品关联规则改变系数和食品种类规则改变系数,和分别表示第n种食品在第t个和第t

1个销售周期下的关联规则集合中各条关联规则的总个数,和分别表示第n种食品在第t个和第t

1个销售周期下的价格,和分别表示第n种食品在第t个和第t

1个销售周期下的关联规则集合中所有后项食品的总种类数,T表示第n种食品对应的销售周期的总数目,| |表示取绝对值符号,e表示自然常数。
[0008]进一步的,确定每种食品在每个销售周期下的动态调整参数,包括:根据每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值,确定每种食品在每个销售周期下的价格系数;确定每种食品在每相邻两个销售周期下的价格的差值的平均值,从而得到每种食品对应的价格差异均值;根据每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值绝对值,以及每种食品对应的价格差异均值,确定每种食品在每个销售周期下对应的价格差距量化值;根据每种食品在每个销售周期下对应的价格差距量化值以及每种食品对应的关联规则相关参数,确定每种食品在每个销售周期下对应的关联规则价格影响程度;对所述关联规则价格影响程度进行正相关归一化,并将每种食品在每个销售周期
下对应的正相关归一化结果与所述价格系数的乘积值,确定为每种食品在每个销售周期下的动态调整参数。
[0009]进一步的,确定每种食品在每个销售周期下的价格系数,包括:判断每种食品在每个销售周期下的价格和对应的所述最具有市场潜力价格的差值是否大于0,若大于0,则将对应销售周期下的价格系数设置为第一数值,否则将对应销售周期下的价格系数设置为第二数值,所述第一数值为负数且所述第二数值为正数。
[0010]进一步的,所述第一数值为

1,所述第二数值为1。
[0011]进一步的,确定每种食品的最具有市场潜力价格,包括:将每种食品在各个销售周期下的关联规则复杂程度中的最大值所对应的销售周期,确定为每种食品的目标销售周期,并将每种食品在其目标销售周期下的价格确定为每种食品的最具有市场潜力价格。
[0012]进一步的,对所述置信度阈值进行调整,获取每种食品在每个销售周期下的调整置信度阈值,对应的计算公式为:其中,为第n种食品在第t个销售周期下的调整置信度阈值,为所述置信度阈值,为第n种食品在第t个销售周期下的动态调整参数。
[0013]进一步的,采用Apriori算法对所述食品销售数据进行数据挖掘。
[0014]进一步的,所述销售周期为每相邻两天的设定时刻之间的时间段,所述设定时刻根据食品价格变更完成时间确定。
[0015]本专利技术具有如下有益效果:通过按照设定的置信度阈值和销售周期,对食品销售数据进行初步的数据挖掘,从而可以确定每种食品在每个销售周期下的关联规则集合以及关联规则集合中每条关联规则的置信度。为了消除食品的价格因素对关联规则的影响,确定每种食品在每个销售周期下的关联规则复杂程度,以对每个销售周期内每种食品在当前价格下的市场潜力进行衡量,从而筛选出每种食品的最具有市场潜力价格。同时,通过分析每种食品在每相邻两个销售周期下的价格的差异、关联规则集合中各条关联规则的个数的差异以及关联规则集合中各条关联规则中后项食品的总种类数的差异,对食品价格差异对关联规则的影响程度进行衡量,从而确定每种食品本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的食品销售数据挖掘分析方法,其特征在于,包括以下步骤:获取待挖掘的食品销售数据,按照设定的置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,获取每种食品在每个销售周期下的关联规则集合以及所述关联规则集合中每条关联规则的置信度;根据每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类的分布特征以及各条关联规则对应的置信度,确定每种食品在每个销售周期下的关联规则复杂程度;根据所述食品销售数据,确定每种食品在每个销售周期下的价格,根据所述价格和关联规则复杂程度,确定每种食品的最具有市场潜力价格;根据每种食品在每相邻两个销售周期下的价格的差异、关联规则集合中各条关联规则的个数的差异以及关联规则集合中各条关联规则中后项食品的总种类数的差异,确定每种食品对应的关联规则相关参数;根据每种食品对应的所述关联规则相关参数、每种食品在每个销售周期下的价格与对应的所述最具有市场潜力价格的差异、以及每种食品在每相邻两个销售周期下的价格的差异,确定每种食品在每个销售周期下的动态调整参数;根据所述动态调整参数,对所述置信度阈值进行调整,获取每种食品在每个销售周期下的调整置信度阈值,并根据所述调整置信度阈值和销售周期,对所述食品销售数据进行数据挖掘,确定每种食品在每个销售周期下的最终的关联规则集合。2.根据权利要求1所述的一种基于大数据的食品销售数据挖掘分析方法,其特征在于,确定每种食品在每个销售周期下的关联规则复杂程度,包括:确定每种食品在每个销售周期下的关联规则集合中各条关联规则中后项食品的种类对应的信息熵;确定每种食品在每个销售周期下的关联规则集合中各条关联规则的置信度的累加和,从而得到每种食品在每个销售周期下对应的置信度累加和;根据每种食品在每个销售周期下对应的信息熵和置信度累加和,确定每种食品在每个销售周期下的关联规则复杂程度,所述信息熵和置信度累加和均与所述关联规则复杂程度成正相关关系。3.根据权利要求1所述的一种基于大数据的食品销售数据挖掘分析方法,其特征在于,确定每种食品对应的关联规则相关参数,包括:所述关联规则相关参数包括食品关联规则改变系数和食品种类规则改变系数,所述食品关联规则改变系数和食品种类规则改变系数对应的计算公式为:其中,和分别表示第n种食品对应的食品关联规则改变系数和食品种类规则改
变系数,和分别表示第n种食品在第t个和第t

1个销售周期下的关联规则集合中各条关联规则的总个数,和分别表示第n种食品在第t个和第t

1个销售周期下的价格,和分别表示第n种食品在第t个和第t

1个销售周期下的关联规则集合中所有后...

【专利技术属性】
技术研发人员:杨国武付国荣
申请(专利权)人:同心县启胜新能源科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1