本发明专利技术公开了一种基于卷烟订购行为的正和负关联竞品目录的创建,所述正和负关联竞品目录的创建包括以下步骤:S1、将客户档位根据档位划分的原则综合汇总成4个大类,并使每个类别的客户数量基本平衡,然后,拆分并加密商户订单信息。本发明专利技术采取了“kulc+IR”的模型评估模式,对关联结果进行了再运算。既消除了“零事务”影响,又利用不平衡比(IR)量化了极不平衡的卷烟品规间的关联,极大的吻合了卷烟订购项集的“数量大、零事务多、品规偏好明显”的特点。主观方面结合卷烟竞品特点,标准化算法构建“正负关联强度”,使每一层的关联事务数减少,使结果采用极小支持度阈值的同时还能够精准定位竞品,更好的支撑营销决策。更好的支撑营销决策。
【技术实现步骤摘要】
一种基于卷烟订购行为的正和负关联竞品目录的创建
[0001]本专利技术涉及卷烟销售
,具体为一种基于卷烟订购行为的正和负关联竞品目录的创建。
技术介绍
[0002]关联分析又称关联挖掘,是从大量数据中发现项集之间有趣的关联和相关联系。关联规则是形如X
→
Y的蕴涵式,其中,X和Y分别称为关联规则的先导(antecedent或left
‑
hand
‑
side,LHS)和后继(consequent或right
‑
hand
‑
side,RHS)。关联规则最初提出的动机是针对购物篮分析(MarketBasketAnalysis)问题提出的,其目的是为了知道哪些商品顾客可能会在一次购物时同时购买。关联规则定义为:假设是项的集合。给定一个交易数据库D,其中每个事务(Transaction)t是I的非空子集,即,每一个交易都与一个唯一的标识符TID(TransactionID)对应。关联规则在D中的支持度(support)是D中事务同时包含X、Y的百分比,即概率;置信度(confidence)是D中事务已经包含X的情况下,包含Y的百分比,即条件概率。如果满足最小支持度阈值和最小置信度阈值,则认为关联规则是有趣的。
[0003]Agrawal和R.Srikant于1994年提出了Apriori算法用于为布尔关联规则挖掘频繁项集,是最著名的关联规则挖掘算法之一,也是本实验中采用的算法。其核心是基于两阶段频集思想的递推算法。基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。
[0004]现有技术方案:在相似的卷烟关联分析中,论文《贵州卷烟品牌大数据关联规则挖掘》利用2010
‑
2015年贵州烟草的卷烟销售数据,重点选用Apriori和FP
‑
Growth算法开展卷烟品牌关联规则挖掘,主要目的是找到品牌之间的关联性,为营销策略提供指导。该论文将每一笔卷烟销售数据作为一个项集,项集里每个卷烟或者几个卷烟的组合作为一个事务,通过Apriori和FP
‑
Growth算法计算出了各个事务之间的支持度和置信度,即掌握了在购买某几个卷烟的基础上,同时购买其他几种卷烟的概率。最后简述了关联分析在贵烟营销分析平台中的应用,主要是描述了平台建设和关联结果展示。
[0005]现有技术准确生成了卷烟品牌间的关联规则结果,但重点在于论述Apriori和FP
‑
Growth算法以及尝试在Hadoop分布式环境下运行FP算法运算关联结果的可行性。现有技术能够得到一组卷烟销售项集之间各个卷烟和各个卷烟组合之间的关联关系(包括支持度、置信度和提升度)。但是缺点如下:1.最小支持度和置信度阈值虽然能够排除大量无趣规则的探查,但是销售人员最关注的紧俏卷烟往往属于低支持度规则,容易被阈值排除在外,因此实际阈值需要设定的非常低,而低阈值又会产生大量无趣规则。2.卷烟品牌繁多,往往有大量卷烟品规不会出现在销售项集中。这些A和B都不出现的事务就是“零事务”,而利用提升度衡量事务关系容易受到“零事务”影响得出错误结论。3.最终关联结果未加入主观归类
评价,将所有卷烟均纳入一个关联层级,属于原始抽象层的挖掘,含有较多的零散模式。
技术实现思路
[0006]基于
技术介绍
存在的技术问题,本专利技术提出了一种基于卷烟订购行为的正和负关联竞品目录的创建。
[0007]本专利技术提出的一种基于卷烟订购行为的正和负关联竞品目录的创建,所述正和负关联竞品目录的创建包括以下步骤:
[0008]S1、将客户档位根据档位划分的原则综合汇总成4个大类,并使每个类别的客户数量基本平衡,然后,拆分并加密商户订单信息。
[0009]S2、分别将处理后的4个类型的客户订购数据导入R语言,并运用Apriori函数进行编译,编译过程运用了R自带的arules包。结合紧俏卷烟的投放量,设置最小支持度为0.002,设置最小置信度为0,为了找到品牌之间的竞品关系,设置项集最多只包含2项,即实现卷烟品牌和品牌之间的两两关联,R运算结果为支持度0.002以上卷烟两两之间的支持度、置信度和提升度。
[0010]S3、将R语言计算的支持度(Support)和置信度(Confidence)结果整理归类,进一步运用公式计算每一对品牌组合的KULC和IR(不平衡比)。
[0011]S4、将建议零售价之间的差异作为重要性的系数进行加权,结合KULC结果分布情况,按照前10%和后10%,分别选择0.6和0.3作为正关联和负关联的临界值并进行数据的(0,1)标准化,结合实际,构建“正关联强度”和“负关联强度”指标作为间接评价标准,并结合正负关联强度对卷烟之间的竞品关系进行区分。
[0012]S5、收集业务人员想要了解的竞品之间横向对比的结构和内容,并依次添加数据集,与商品基础信息、卷烟销售数据、市场信息采集数据进行横向数据关联,创建竞品目录组件。
[0013]S6、结合零售户上柜本品和竞品的订购积极性差异寻找目标推荐商户,并结合竞品的分类(同质化竞品、差异化竞品)分别建立不同的营销话术,同质强调“共同选择”,差异强调“品牌特征”。
[0014]优选的,所述步骤S2中核心代码:pl1_rules<
‑
apriori(data=pl1,parameter=list(support=0.002,confidenc e=0,minlen=1,maxlen=2))。
[0015]优选的,所述步骤S3中核心公式:借助{}
→
A的支持度,计算sup(A),运用公式IR(A,B)=|sup(A)
‑
sup(B)|/(sup(A)+sup(B)
‑
sup(A∪B))和公式Kulc(A,B)=1/2(P(A|B)+P(B|A))分别计算每一对组合的KULC+IR。
[0016]优选地,所述步骤S4中正关联强度=
‑
(ABS(A价格
‑
B价格)/MIN(A价格,B价格))+2.5*KULC)*100,负关联强度=2
‑
(ABS(A价格
‑
B价格)/MIN(A价格,B价格))
‑
3.3*KULC)*100。
[0017]本专利技术提供一种基于卷烟订购行为的正和负关联竞品目录的创建,采取了“kulc+IR”的模型评估模式,对关联结果进行了再运算。既消除了“零事务”影响,又利用不平衡比(IR)量化了极不平衡的卷烟品规间的关联,极大的吻合了卷烟订购项集的“数量本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于卷烟订购行为的正和负关联竞品目录的创建,其特征在于,所述正和负关联竞品目录的创建包括以下步骤:S1、将客户档位根据档位划分的原则综合汇总成4个大类,并使每个类别的客户数量基本平衡,然后,拆分并加密商户订单信息。S2、分别将处理后的4个类型的客户订购数据导入R语言,并运用Apriori函数进行编译,编译过程运用了R自带的arules包。结合紧俏卷烟的投放量,设置最小支持度为0.002,设置最小置信度为0,为了找到品牌之间的竞品关系,设置项集最多只包含2项,即实现卷烟品牌和品牌之间的两两关联,R运算结果为支持度0.002以上卷烟两两之间的支持度、置信度和提升度。S3、将R语言计算的支持度(Support)和置信度(Confidence)结果整理归类,进一步运用公式计算每一对品牌组合的KULC和IR(不平衡比)。S4、将建议零售价之间的差异作为重要性的系数进行加权,结合KULC结果分布情况,按照前10%和后10%,分别选择0.6和0.3作为正关联和负关联的临界值并进行数据的(0,1)标准化,结合实际,构建“正关联强度”和“负关联强度”指标作为间接评价标准,并结合正负关联强度对卷烟之间的竞品关系进行区分。S5、收集业务人员想要了解的竞品之间横向对比的结构和内容,并依次添加数据集,与商品基础信息、卷烟销售数据、市场信息采集数据进行横向数据关联,创建竞品目录组件。S6、结合零售户上柜本品和竞品的订购积极性差异寻找目标推荐商户,并结合竞品的分类(同质化竞品、差...
【专利技术属性】
技术研发人员:兰斓,朱瑾,刘阳,温海茜,辛娟,王鹏,王洪立,尚民东,王毅,
申请(专利权)人:河南省烟草公司三门峡市公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。