本发明专利技术公开向目标用户推荐商品的方法,包括:将第一批用户的浏览日志作为训练数据,分析第一批用户的浏览日志,并对第一批用户进行聚类,得到多个用户类别,计算商品对于第一批用户的区分度,将区分度高的商品推荐给目标用户。
【技术实现步骤摘要】
本专利技术涉及向目标用户推荐商品的方法和系统。
技术介绍
在现有技术中,可以根据用户的购物偏好来通过例如互联网向用户推荐商品。然 而,对于初次使用购物网站、或者网上商户进行购物的用户来说,由于提供商品的计算机系 统不知晓用户的购物偏好,因此难以向用户进行推荐。 目前已知的方案中,可以通过以下手段获取用户的购物偏好:例如以平均或者随 机的方式设置用户的购物偏好,又例如根据用户的在系统中的注册信息(诸如性别、年龄、 职业、居住地)来预测用户的购物偏好,又例如根据与该用户相关的外部数据源(例如,该用 户在其它购物网站的历史行为)分析其购物偏好。 然而,上述通过已知手段构建购物偏好往往准确率较低、使用计算机资源较多、用 户配合度较低、或者需要麻烦地与第三方进行合作。
技术实现思路
本专利技术公开,向目标用户推荐商品的方法,包括: 步骤101 :将第一批用户的浏览日志作为训练数据,分析第一批用户的浏览日志,并对 第一批用户进行聚类,得到多个用户类别, 步骤102 :计算商品对于第一批用户的区分度, 步骤103 :将区分度高的商品推荐给目标用户。 在步骤101中: 第一批用户的浏览日志的记录可以包括:IP地址、URL地址、时间和用户ID。 合并相同IP地址的记录,并过滤距离当前时间超过时间段T的浏览日志来形成训 练数据。 建立用户和商品类别对应关系表,使得用户ID对应该用户浏览过的商品类别的 序列。 计算每个用户的商品类别序列中的商品类别个数,并作余弦归一化,使数据映射 到〇至1的范围内,以用于建立用户矩阵C。 基于建立的用户矩阵C,采用K-Means方法进行多次聚类得到用户数据聚类中心 集合Cen和各个聚类类别的用户类别集合Uset= {Uu U2, U3,…,UK}。还可以选取损失 值最小的聚类作为最后聚类结果。 在步骤102中: 计算商品对于第一批用户的区分度。这里,商品X的区分度In(x)可以根据用户类别 的可预测性H(U)、根据第一批用户的反馈计算的用户类别的可预测性H(U|X)、商品的流行 度来计算Pop 00。 在本专利技术的一个或多个实施例中,向目标用户推荐商品的方法还可以包括: 步骤201 :从目标用户获取反馈,并且根据该反馈向目标用户推荐商品,其中,将与该 反馈一致的第一批用户中的第二批用户的浏览日志作为训练数据,分析第二批用户的浏览 日志,并对第二批用户进行聚类,得到多个用户类别。 步骤202:计算商品对于第二批用户的区分度,并将区分度高的商品推荐给目标 用户。 在本专利技术的一个或多个实施例中,向目标用户推荐商品的方法还可以包括: 步骤301 :从目标用户获取反馈,并且根据该反馈查找与目标用户相似度高的用户。相 似度计算方法可以是目标用户和训练数据中的用户对于相同商品反馈结果的比例。 步骤302:根据所述与目标用户相似度高的用户的用户类别判断目标用户的用户 类别。 步骤303 :根据确定的目标用户的用户类别来向目标用户推荐商品。例如,将该用 户类别的所有用户的购买比例最高的商品推荐给目标用户。 本专利技术还公开一种向目标用户推荐商品的系统,包括: 第一装置,将第一批用户的浏览日志作为训练数据,分析第一批用户的浏览日志,并对 第一批用户进行聚类,得到多个用户类别, 第二装置,计算商品对于第一批用户的区分度, 第三装置,将区分度高的商品推荐给目标用户。 向目标用户推荐商品的系统还可以包括: 第四装置,从目标用户获取反馈,并且根据该反馈向目标用户推荐商品,其中,将与该 反馈一致的第一批用户中的第二批用户的浏览日志作为训练数据,分析第二批用户的浏览 日志,并对第二批用户进行聚类,得到多个用户类别, 第五装置,计算商品对于第二批用户的区分度,并将区分度高的商品推荐给目标用户。 向目标用户推荐商品的系统还可以包括: 第六装置,从目标用户获取反馈,并且根据该反馈查找与目标用户相似度高的用户,以 及 第七装置,根据所述与目标用户相似度高的用户的用户类别判断目标用户的用户类 别, 第八装置,根据确定的目标用户的用户类别来向目标用户推荐商品。【附图说明】 在参照附图阅读了本专利技术的【具体实施方式】以后,本领域技术人员将会更清楚地了 解本专利技术。本领域技术人员应当理解的是,附图仅仅用于配合【具体实施方式】说明本专利技术的 技术方案,而并非意在对本专利技术的保护范围构成限制。 图1是根据本专利技术实施例的向目标用户推荐商品的方法的步骤示意图。 图2是根据本专利技术实施例的一种反馈交互式的商品推荐引导方法示意图。 图3是根据本专利技术实施例的一种反馈交互式的商品推荐引导的总体流程示意图。【具体实施方式】 下面参照附图,对本专利技术的【具体实施方式】作进一步的详细描述。应当理解的是,可 对所描述的实施例进行结构的和功能的修改。另外,可针对任何给定的或特定的应用所期 望和有利的那样,一个实施例的一个或多个特征可以与另一个实施例的一个或多个特征相 组合。 图1是向目标用户推荐商品的方法的步骤示意图。如图所示,向目标用户推荐商 品的方法,包括: 步骤101 :将第一批用户的浏览日志作为训练数据,分析第一批用户的浏览日志,并对 第一批用户进行聚类,得到多个用户类别, 步骤102 :计算商品对于第一批用户的区分度, 步骤103 :将区分度高的商品推荐给目标用户。 如上所述,在步骤101中,第一批用户进行聚类,以下描述示例性的过程。 第一批用户的浏览日志的记录可以包括:IP地址、URL地址、时间和用户ID。可以 合并相同IP地址的记录,并过滤距离当前时间超过时间段T的浏览日志来形成训练数据。 这里,参数变量T可以预先被设置,T越小,则过滤的浏览日志距离当前时间越近,符合条件 的记录数量越少。 随后,可以建立用户和商品类别对应关系表。例如,用户ID对应该用户浏览过的 商品类别的序列。例如,用户u的浏览过的商品类别序列N(u) = {a,b,b,…},即用户 的行为数据。 计算每个用户的商品类别序列中的商品类别个数,并作余弦归一化,使数据映射 到〇至1的范围内,以用于建立用户矩阵C。例如,用户u的浏览过的商品类别序列N(u)= {a,b,b,c},那么统计商品类别个数得到{a=l,b=2,c=l},然后进行归一化得到: 如上所述,归一化的结果被用于建立用户矩阵C。其中,矩阵C中成员C= N(u) · N(v)|,即向量N(u)点乘向量N(v),该数值表示用户u和v (例如ID为u和v的 用户)所浏览页面集合之间的商品类别相似度,C 值域为0至1。C 越大,表示 用户u和V浏览相同商品类别的页面越多。如果C = 0,则表示N(u)和N(v)在向量 空间内垂直,即用户u和ν没有浏览过同一类别的商品。如果C = 1,表示用户u和 v浏览的商品类别完全相同。 基于建立的用户矩阵C,本领域技术人员可以理解,能够采用K-Means方法进行 多次聚类。在聚类过程中,使用用户矩阵C中对应成员的数值作为用户之间的相似度。 K-Means的参数包括聚类个数k、已浏览的当前第1页1 2 3 本文档来自技高网...
【技术保护点】
一种向目标用户推荐商品的方法,其特征在于,包括:将第一批用户的浏览日志作为训练数据,分析第一批用户的浏览日志,并对第一批用户进行聚类,得到多个用户类别,计算商品对于第一批用户的区分度,将区分度高的商品推荐给目标用户。
【技术特征摘要】
【专利技术属性】
技术研发人员:冯亮,尹亚伟,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。