一种商品防窜货方法技术

技术编号:19694260 阅读:59 留言:0更新日期:2018-12-08 11:47
本发明专利技术涉及一种商品防窜货方法,包括:搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;获取待区分类别的当前扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;若当前扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则当前扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。本发明专利技术实施例基于历史扫码数据的行为特征来预测未知的扫码数据属于正常扫码数据类别还是有窜货风险的扫码数据类别,流程简单,成本低,覆盖范围广。

【技术实现步骤摘要】
一种商品防窜货方法
本专利技术涉及电子商务平台
,尤其涉及一种商品防窜货方法。
技术介绍
窜货区分分销网路的窜货和消费者进行行销活动的窜货行为,分销网路的窜货是指分销网路中各级代理商、经销商、分销公司等受利益驱动,将所经销的产品跨区域销售,造成价格混乱的营销现象,消费者进行行销活动的窜货是指中奖的二维码被人为贩卖或伪造销售,造成企业的营销损失。现在市场上解决窜货的机制有针对销售区域进行差异的包装、生产流程加强品质的管理以防不正当产品流出、定制各区域合理的销售目标、合理公平进行定价避免渠道成员的差异、建立规范避免各级价格体系过大、合理划分各级的市场区域、建立监督经销商有关行为的监督机制…等以上总多方式集合才能避免窜货发生,不仅流程冗长,规则复杂,涉及的人事物庞大,所花费的金额也很多,如果只是仰赖公司建立监督经销商有关行为的稽核员,人力成本也很大,所以一般只会有几个稽核员做不定点不定时的采样稽核,既不能覆盖大部分的销售范围也不能在提前预测其商品是否未来可能发生窜货。
技术实现思路
针对上述现有技术的缺点,本专利技术的目的是提供一种商品防窜货方法,覆盖范围广,可提前预测商品是否未来可能发生窜货,流程简单,成本低。本专利技术实施例提供的一种商品防窜货方法,该方法包括:搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;获取待预测类别的扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;若扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。进一步地,上述方法中,所述将扫码数据的第一特征值信息带入已训练好的支持向量机模型中进行分类预测具体包括:将训练数据中包含已知的有窜货风险的扫码数据和正常扫码数据作为支持向量机模型在建模时的分类依据;将每一个历史数据的第一特征值信息作为每一个历史数据的向量,并将该向量映射到一个高维空间中;根据已知的有窜货风险的扫码数据和正常扫码数据作为分类的标的,在上述空间里建造一个最大间隔超平面来完全区隔两种类别的数据;找出这个超平面之后,将待预测类别的扫码数据的第一特征值信息带入支持向量机模型;根据扫码数据坐落在超平面的位置,确定扫码数据为正常扫码数据还是有窜货风险的扫码数据。进一步地,上述方法中,所述获取待预测类别的扫码数据的第一特征值信息,具体是指获取待预测类别的扫码数据在扫码阶段的第一特征值信息。进一步地,上述方法中,所述扫码数据的第一特征值信息包括但不限于以下一种或多种:与设备信息相关的特征值信息;与位置信息相关的特征值信息;与时间信息相关的特征值信息;与扫码次数相关的特征值信息。进一步地,上述方法中,若所述扫码数据属于有窜货风险的扫码数据,则还包括:将有窜货风险的扫码数据区分为低窜货风险扫码数据和高窜货风险扫码数据两个类别;提取有窜货风险的扫码数据的第二特征值信息,并将该信息作为随机森林模型的训练数据;获取待预测类别的扫码数据的第二特征值信息,并将其带入已训练好的随机森林模型中进行分类预测;若扫码数据的第二特征值信息落入低窜货风险扫码数据类别的范围内,则扫码数据属于低窜货风险扫码数据,否则属于高窜货风险扫码数据。进一步地,上述方法中,所述将待预测类别的扫码数据的第二特征值信息带入已训练好的随机森林模型中进行分类预测具体包括:将有窜货风险的扫码数据作为随机森林模型在建模时的样本个数n,然后将每一个扫码数据的第二特征值信息作为每一个扫码数据的特征数目a;对n个样本采取有放回抽样的方式选择a中的k个特征值,形成一个训练集,再用k值建立决策树的方式来获得最佳分割点;以此类推重复采样m次,产生m颗决策树,然后将待预测类别的扫码数据的第二特征值信息带入随机森林模型;根据每颗树分类的结果进行多数投票机制来预测扫码数据属于低窜货风险扫码数据还是高窜货风险扫码数据。进一步地,上述方法中,所述提取有窜货风险的扫码数据的第二特征值信息,具体是指提取有窜货风险的扫码数据在兑奖阶段的第二特征值信息。进一步地,上述方法中,所述扫码数据的第二特征值信息包括但不限于以下一种或多种:与利益信息相关的特征值信息;与位置信息相关的特征值信息;与设备信息相关的特征值信息;与扫码次数相关的特征值信息;与销售范围信息相关的特征值信息。与现有技术相比,本专利技术实施例商品防窜货方法,包括:搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;获取待区分类别的当前扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;若当前扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则当前扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。本专利技术实施例基于历史扫码数据的行为特征来预测未知的扫码数据属于正常扫码数据类别还是有窜货风险的扫码数据类别,流程简单,成本低,覆盖范围广。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于支持向量机算法模型的商品防窜货方法流程图;图2为本专利技术提供的一种基于随机森林算法模型的商品防窜货方法流程图;图3为本专利技术提供的一种基于支持向量机算法模型和随机森林算法模型组合的商品防窜货方法流程图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部份实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。如图1所示,本专利技术实施例提供的一种商品防窜货方法,该方法包括:S101,搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;S102,提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;S103,获取待预测类别的扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;S104,若扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。优选地,上述方法中,所述获取待预测类别的扫码数据的第一特征值信息,具体是指获取待预测类别的扫码数据在扫码阶段的第一特征值信息。优选地,上述方法中,所述扫码数据的第一特征值信息包括但不限于以下一种或多种:与设备信息相关的特征值信息;与位置信息相关的特征值信息;与时间信息相关的特征值信息;与扫码次数相关的特征值信息。支持向量机(SupportVectorMachine,SVM)算法属于一种监督式学习模型的一种分类算法,在训练阶段给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,例如:数组为[180,本文档来自技高网...

【技术保护点】
1.一种商品防窜货方法,其特征在于,该方法包括:搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;获取待预测类别的扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;若扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。

【技术特征摘要】
1.一种商品防窜货方法,其特征在于,该方法包括:搜集历史扫码数据,将历史扫码数据区分为正常扫码数据和有窜货风险的扫码数据两个类别;提取包含上述区分类别的历史扫码数据的第一特征值信息,并将该信息作为支持向量机的算法训练数据;获取待预测类别的扫码数据的第一特征值信息,并将其带入已训练好的支持向量机模型中进行分类预测;若扫码数据的第一特征值信息落入正常扫码数据类别的范围内,则扫码数据属于正常扫码数据,否则属于有窜货风险的扫码数据。2.根据权利要求1所述的方法,其特征在于,所述将扫码数据的第一特征值信息带入已训练好的支持向量机模型中进行分类预测具体包括:将训练数据中包含已知的有窜货风险的扫码数据和正常扫码数据作为支持向量机模型在建模时的分类依据;将每一个历史数据的第一特征值信息作为每一个历史数据的向量,并将该向量映射到一个高维空间中;根据已知的有窜货风险的扫码数据和正常扫码数据作为分类的标的,在上述空间里建造一个最大间隔超平面来完全区隔两种类别的数据;找出这个超平面之后,将待预测类别的扫码数据的第一特征值信息带入支持向量机模型;根据扫码数据坐落在超平面的位置,确定扫码数据为正常扫码数据还是有窜货风险的扫码数据。3.根据权利要求1所述的方法,其特征在于,所述获取待预测类别的扫码数据的第一特征值信息,具体是指获取待预测类别的扫码数据在扫码阶段的第一特征值信息。4.根据权利要求1或2或3所述的方法,其特征在于,所述扫码数据的第一特征值信息包括但不限于以下一种或多种:与设备信息相关的特征值信息;与位置信息相关的特征值信息;与时间信息相关的特征值信息;与扫码次数相关的特征值信息。5.根据权利要求1所...

【专利技术属性】
技术研发人员:赖秀娟石谢彬
申请(专利权)人:上海透云物联网科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1