本发明专利技术涉及基于单个不发生项的负序列模式在商品推荐中的应用,本发明专利技术应用在进行客户购买行为分析的过程中,可以充分表示顾客的真实购买行为,从而发现顾客真实的频繁购买或不购买商品的行为。这样顾客在购买商品时,利用本发明专利技术可以向其推荐一些其他客户购买频率比较大的连带购买的产品,从而增加顾客的交易机会,将网站浏览者转变为购买者,提高交叉销售能力,提高客户的忠诚度,从而提高网站的经济效益。
Application of negative sequence model based on single item deletion in commodity recommendation
The present invention relates to a negative sequence pattern does not occur based on the application of single item in the recommendation of the invention used in process analysis of customer purchase behavior, can fully represent the real purchase behavior of customers, so that customers really frequently buy or not buy goods behavior. So that customers in the purchase of goods, the invention can be used to recommend some other customers to buy a high frequency of joint purchase products, thereby increasing customer trading opportunities, website browsers into buyers, improve cross selling ability, improve customer loyalty, so as to improve the economic benefits of the site.
【技术实现步骤摘要】
基于单项缺失的负序列模式在商品推荐中的应用
本专利技术涉及基于单项缺失的负序列模式在商品推荐中的应用,属于负序列模式的应用
技术介绍
随着互联网的迅猛发展,网络购物从大型城市到中小型城市再到乡村已经逐渐代替了传统的购物形式成为购物的主流形式。网络购物是建立在互信互利的基础之上的,克服地域与时间的障碍,为消费者提供丰富的商品信息。消费者可以通过浏览多家商铺,多个网站,甚至可以海淘获取更有价格竞争力的,个性化的,定制化的商品。这样给消费者带来了更大的购物便利,更多的商品选择,购物中占有巨大的优势。因此,近几年网络购物呈爆发式增长,每年都以几何数级增长,与此同时很多大型的电子商务网站,如Amazon、阿里巴巴旗下的淘宝和天猫商城、京东等都积累了大量的客户交易数据。如何充分利用这些数据对客户购买行为进行有效的分析、组织利用,如何了解到客户尽可能多的爱好和价值取向,以优化网站设计,为客户提供个性化服务,成为电子商务发展迫切要解决的问题。与传统的经营方式相比,网络购物的产品信息量大,数量、种类丰富,选择范围广。在传统购物环境下,消费者获取商品信息的来源主要靠生活积累,搜集过程较长,得到的信息比较片面。在网络购物环境下,消费者就可以集中时间搜集、查找大量的有关商品的信息。网上商品种类丰富,有些商品消费者想要购买而传统商铺不容易找到,就可以通过网络商店方便的查询购买,补充了传统商店某些产品的短缺。但是目前的电子商务商家通常不能直观的去了解客户,获取的相关的数据有限(比如用户的注册信息,购买记录等)。通过对大量的客户购买记录进行分析和挖掘,发现客户的频繁访问序列模式,针对不同的客户属性和网上购物步骤,采用不同的商品推荐形式,适时的向客户推荐恰当的商品,并优化电子商务网站商品的摆放位置,可以有效的增加客户的交易机会,将网站浏览者转变为购买者,提高交叉销售能力,提高客户的忠诚度,以及提高购物网站的服务质量和经济效益。序列模式不但可以分析客户交易商品之间的关系规律,还可以分析交易之间的关系规律。使得售货方不但能够根据客户交易商品的情况给客户具有针对性的推荐,而且能够根据当前的商品买卖情况来预测以后的商品买卖情况,从而能够更好的安排商品的摆放。它的主要目的是研究商品购买的先后关系,找出其中的规律,即不仅需要知道商品是否被购买,而且需要确定该商品与其它商品购买的先后顺序,例如,在线购买DVD的一个典型的顺序是购买“星球大战”,之后很有可能继续购买“帝国反击战”,再是购买“杰达武士归来”。因此序列模式能够发现数据库中某一段时间内的频繁序列,即在这个时间段内哪些商品会被客户购买的比较多,多或少的标准是由最小支持度来决定的。每个序列是按照交易的时间排列的一个集合,可以设置最小支持度来挖掘满足不同频繁程度的序列。但在应用序列模式分析客户购买行为,解决个性化商品推荐问题时,他们仅考虑了已发生的事件,也称为正序列模式(PositiveSequentialPattern,PSP)挖掘。但是随着研究的深入,研究人员发现不发生事件中隐含着大量的有用信息,而这些信息在单纯的正序列模式挖掘中是根本得不到的。于是研究人员又将不发生事件考虑在内,提出了负序列模式挖掘。负序列模式(NegativeSequentialPattern,NSP)挖掘不仅考虑了已经发生的事件,还关注于未发生事件,它能够更深入地分析和理解数据中的潜在含义。例如,a代表面包,b代表咖啡,c代表茶,表示一个客户购买序列模式,该模式说明在某一段时间内,该客户在购买了商品a后,在没有购买商品b的情况下,购买了商品c而不是其它的商品。如今负序列模式的价值越来越被人们认可,在智能检测系统以及许多信息应用领域发挥着不可替代的作用,尤其是将客户的购买行为分析应用于商品推荐上,更是对商品成功交易了以及交易金额起到了巨大的推动作用。电子商务平台中的网站用户购买订单数据为挖掘的数据源。以5个客户在2个月内的交易为例,如表1是由客户ID和交易时间为关键字所排序的事务数据库。一个事务数据库,一个事务代表一笔交易,一个单项代表交易的商品,单项属性中的字母记录的是商品ID。表1进行数据预处理,将表1的事务数据库整理成表2的序列数据库。表2客户ID客户购买序列1<{c}{i}>2<{a,b}{c}{a,d,f,g}>3<{c,e,g,h}>4<{c}{c,d,g,h}{i}>5<{i}>一个客户在某个时间段内所有的交易记录构成一个有序的序列,序列用<>表示。在序列中,项/项集是有顺序的,每个项都代表交易的一种商品,而元素则是指该客户在某一个具体的时间点一次性购买的所有商品,用{}或()表示,该客户可能在不同的时间段购买同一件产品,即一个项可能在一个序列的不同元素中发生。如表2中ID为2的客户购买序列为<{a,b}{c}{a,d,f,g}>,该客户分别在第一次和第三次购物时购买了商品a,其中{a,b},{c},{a,d,f,g}这三个项目集可称为序列的元素,a,b,c,d,f,g则称为项,如果一个元素中只有一个项,则括号可以省略,如该序列中的元素{c}可直接写c。然而,现存的负序列模式挖掘算法比较少,例如,NSPM,PNSP,Neg-GSP,e-NSP等等。这些算法中的约束条件大多数是为了实现负序列模式挖掘和提高算法效率而提出的。事实上,这些约束条件比较严格从而使很多有意义的序列模式无法被挖掘。它们在实际应用中并不是必须的。例如,负元素约束,它要求负候选的最小负单位是元素,既允许整个元素(ab)为负,表示为而不允许元素(ab)中有负项,即是不允许的,这是非常严格,它无法真正的表示顾客在一次购物中买到的商品,和可能买但没有买的商品;格式约束,它要求序列中的负元素不能连续出现,既是不能出现的,而在现实生活中这种序列是经常发生的,它可以表示顾客的两次购物记录,第一次顾客在购买了商品b的同时没有购买a,第二次顾客在购买了商品c的同时没有购买b。但是我们目前没有找到任何有关于放宽这些约束条件的负模式挖掘方法的研究。这是因为放宽约束后会带来很多具有挑战性的问题,例如,产生数量巨大的负候选,如何给出更为复杂的负包含定义以及高计算花费等。
技术实现思路
专利技术概述本专利技术针对现存算法中约束条件过于严格致使在挖掘过程中丢失很多有意义的负序列模式,且无法真实的表示顾客的购买行为这些问题,提出了基于单项缺失的负序列模式挖掘算法NegI-NSP。它不但允许负候选的最小负单位为项(而不是元素),例如,允许元素(ab)中有负项,可以表示为或而且允许序列中存在连续的负元素,例如,序列是被允许的。这样不但能够反应出顾客购买行为中商品购买的先后顺序,还能反映出每次购物中顾客的真实购买行为。NegI-NSP算法的主要思想是:首先,通过现存的正序列模式挖掘算法挖掘出正序列模式;然后,利用转化策论生成负候选序列集,并利用已知的正序列模式的支持度计算负候选的支持度;最后,通过最小支持度(由用户指定)筛选得到最终的负序列模式。通过该算法挖掘得到的更为真实的能够反映顾客购买行为的负序列模式,从而可以更全面的分析客户购买行为,使得售货方能够根据当前的商品销售情况来预测本文档来自技高网...
【技术保护点】
基于单项缺失的负序列模式在商品推荐中的应用,其特征在于,包括步骤如下:(1)定义一个数据序列包含一个负序列顾客原本要购买但没有购买的商品为负项,也称为不发生行为;顾客的一次购物记录为元素;包含至少一个负项的元素为负元素;顾客在一段时间内的购物记录称之为数据序列,包含至少一个负元素的序列称之为负序列;MPSE是指一个顾客在一次购物记录中的最大正子元素;1‑negMPSE是指负元素s
【技术特征摘要】
1.基于单项缺失的负序列模式在商品推荐中的应用,其特征在于,包括步骤如下:(1)定义一个数据序列包含一个负序列顾客原本要购买但没有购买的商品为负项,也称为不发生行为;顾客的一次购物记录为元素;包含至少一个负项的元素为负元素;顾客在一段时间内的购物记录称之为数据序列,包含至少一个负元素的序列称之为负序列;MPSE是指一个顾客在一次购物记录中的最大正子元素;1-negMPSE是指负元素si的子元素,该子元素包括MPSE(si)和一个负项e,一个单项负元素的1-negMPSE是它本身;MPSE(si)是指负元素si的最大正子元素;MPS(ns)是指一个由顾客购买的商品组成的负序列ns的最大正子序列,其由ns中包含的所有正项按照原顺序组成;NSI-MSE是指负序列ns的子序列,该子序列包括单项负元素si以及MPSE(si+1);定义数据序列ds=<d1d2...dt>包含负序列ns=<s1s2...sm>;(2)利用NegI-NSP算法对客户的购物行为进行分析,具体步骤包括:A、使用正序列挖掘算法GSP挖掘得到所有的正序列模式,即在某一段时间内,客户频繁购买的商品;B、基于步骤A挖掘得到的正序列模式,生成相应的负候选序列,所述负候选序列用于判断在某一段时间内,哪些商品客户购买的多,哪些商品客户没有购买;C、利用负候选序列对应的正序列模式的支持度来计算负侯选序列的支持度;D、从步骤B生成的负侯选序列中筛选出符合最小支持度要求的负序列模式,即:从步骤B生成的负侯选序列中筛选出大于用户设定的最小支持度...
【专利技术属性】
技术研发人员:董祥军,邱萍,
申请(专利权)人:齐鲁工业大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。