基于区域特征的协同过滤推荐方法技术

技术编号:7759801 阅读:241 留言:0更新日期:2012-09-14 02:36
本发明专利技术公开了一种基于区域特征的协同过滤推荐方法,本发明专利技术包括采集用户信息;对所采集到的信息进行基础分析;根据买家所属地区进行筛选;推荐筛选结果的过程;前台将推荐结果在适当的页面场景展现给用户等步骤,本发明专利技术解决了目前电子商务B2B网站中向用户推荐属于同一区域且与其选择相同产品的其他用户也关注或购买的产品的问题。

【技术实现步骤摘要】

本专利技术涉及电子商务B2B交易领域,特别是一种。
技术介绍
随着电子商务网站规模的不断扩大,网上商品越来越丰富,人们在海量的信息资源中很难找到自己需要的产品及信息,往往会陷入信息过载的困境,为解决这个问题,有效指导用户在电子商务网站中购物,电子商务推荐系统应运而生。电子商务推荐系统可以根据已有的用户信息,向目标用户推荐其可能感兴趣的产品信息。目前,协同过滤利用相似用户购买行为也可能相似的特性进行推荐,已成为应用最广泛、最成功的推荐方法。现有的协同过滤推荐技术主要分为基于用户的协同过滤和基于产品的协同过滤。基于用户的协同过滤推荐根据相似用户群的观点来产生对目标用户的推荐,使用统计方法挑选出与目标用户最相似的若干用户,称为“邻居”,然后根据这些邻居的意见推测用户对目标商品的感兴趣程度;基于产品的协同过滤推荐是根据用户对与目标产品相似的产品的评分来预测该用户对目标产品的感兴趣程度,首先关注的是产品之间的联系。但是基于用户的协同过滤和基于产品的协同过滤都没有考虑用户需求具有区域性差异的问题,对于处在不同地区的目标用户,没有进行有区别的产品信息推荐。专利技术人在实现本专利技术的过程中发现,处于相同地区的用户,所选择的同类产品间往往具有一定的相似性,而处于不同地区的用户,对于同一类产品的需求往往存在很大差异。例如,在选择服装类产品时,美国的买家用户更偏好针织或钩编的服装及衣着附件,而巴西的买家用户则更偏好于非针织或非钩编的服装及衣着附件。对于电子商务网站推荐系统来说,当A地区的买家用户寻找某类产品时,系统向其推荐B地区买家普遍感兴趣的产品是不合理的,甚至还会引起目标买家用户的抵触,降低电子商务网站平台的服务能力,因此,考虑用户需求区域性差异的推荐才更能满足用户的信息需求。
技术实现思路
本专利技术的目的在于提供一种解决了目前电子商务B2B网站中向用户推荐属于同一区域的且与其选择相同产品的其他用户也关注或购买的产品的问题的。实现本专利技术目的的技术解决方案为一种,包括以下步骤 步骤一基于预先设定的规则从电子商务网站平台数据源中采集登陆网站的用户的全部基础信息; 步骤二 对所采集到的信息进行基础分析,并将所得分析结果存入数据库中; 步骤三将前台读取的当前用户的操作信息进行处理,并根据当前买家所属地区筛选出数据库中与买家所属地区匹配的产品及商情信息;、步骤四将前台传递来的产品或商情ID集与筛选出的历史记录进行比对,按照共现次数找出前X个推荐产品或商情,再对这些产品或商情按规则排序,得待推荐结果,并将待推荐结果传递给前台,其中X为系统预设定值; 步骤五前台排除待推荐结果中与当前用户操作历史记录中相同的产品或商情ID集,筛选出M个作为推荐结果,其中M为系统预设定值; 步骤六前台进行判断所筛选出的推荐结果个数是否满足,若个数满足,将推荐结果在 适当的页面场景展现给用户,若推荐结果个数不足M个,则前台将待推荐结果中的前N个产品或商情取出来,重复步骤四和步骤五,将得到的新的推荐结果补足之前的推荐结果不足M的部分; 步骤七前台将推荐结果在适当的页面场景展现给用户。本专利技术与现有技术相比,其显著优点 本专利技术提出一种,在向所述目标用户推荐与其选择相同产品的其他买家还关注的产品时,考虑用户需求区域性差异,保证所推荐的产品与用户所处的区域特征相一致,推荐结果与用户的需求更加匹配。同时,针对不同的推荐场景,本专利技术实施例设定不同的推荐算法规则,保证所推荐的产品或商情信息可以综合反映该产品或商情信息的被关注度、卖家信誉度以及被推荐买家对该类型产品或商情的喜好程度,进一步提高了推荐结果的质量。下面结合附图对本专利技术作进一步详细描述。附图说明图I为针对本专利技术实施例的推荐方法流程 图2为针对本专利技术实施例的推荐系统的结构示意图。具体实施例方式为使本专利技术的实施例的目的、技术方案和优点更加清楚,下面对本专利技术实施例中涉及的一些术语做简单解释。登陆用户在网站上用已注册账号进行登录的注册买家。非登陆用户未进行账号登陆的买家。活跃注册买家在近一个月内频繁登录使用所述电子商务网站的注册买家。供应商类别包括有认证供应商、金牌供应商和免费供应商,主要作用是辅助买家判断卖家信誉度。共现次数近一个月内用户访问序列中产品出现的次数。会话访问者在30分钟内与网站有交互活动则被认为是同一次进入网站,不记录新的用户会话数;当访问者持续30分钟与网站没有交互活动,当他再次访问网站时访问者被认为再一次进入了网站,记录新的用户会话数。为了更清晰的阐述本专利技术的目的、技术方案和优点,下面结合具体实施例和附图对本专利技术进行详细阐述。结合图1,显示了根据本专利技术实施例的推荐方法流程图,具体包括以下步骤 步骤101,基于预先设定的规则从电子商务网站平台数据源中采集登陆网站的用户的全部基础信息,其中,在本专利技术的实施例中,这一信息采集过程包括从结构化日志系统提取基础数据、数据清洗过滤、数值映射与转换、交叉检验、维表更新、历史表归档,并将基础数据按规则进行分类规整存储;所采集基础信息包括买家在一定时间内询盘、访问、收藏的产品或商情历史记录信息、买家操作的产品所属供应商信息、产品的基本属性信息、产品被询盘或访问量等。其中,在本专利技术的实施例中,对采集的数据进行加工分类时具体采用了以下映射规则,但不限于此 在本专利技术的实施例中,通过公司注册添加产品信息映射得到公司主营行业,与登录信息映射得到公司登录名等信息;、 在本专利技术的实施例中,通过映射得到各级目录的上级目录及根目录,将各级中英文目录转换成统一格式; 在本专利技术的实施例中,经过询盘和访问的URL映射得到各种询盘类型和访问类型; 在本专利技术的实施例中,通过询盘日志与公司维表映射得到收发询盘的公司号及相关信息,与国家维表映射得到买家所属国家号及相关信息; 在本专利技术的实施例中,通过访问日志与公司维表映射得到访问的公司号及相关信息,与国家维表映射得到买家所属国家、地区号及相关信息,与目录维表映射得到访问的目录信息,分析买家访问历史映射到当前坊问的上次访问时间; 在本专利技术的实施例中,将卖家注册的产品信息中的多个关键词转换成可进行相互关联单个关键词; 在本专利技术的实施例中,将国外买家IP地址转化成数值型的IP号; 在本专利技术的实施例中,将询盘、访问、捜索、登陆等买家操作行为的时间转换成以天为单位的数值型数据; 在本专利技术的实施例中,将产品信息与公司、目录维表映射转换得到产品所属公司号、目录号等产品信息。步骤102,推荐引擎I对所采集到的信息进行基础分析,并将所得分析结果存入数据库中。其中,在对基础信息进行分析时包括统计ー个月内所有产品或商情操作会话序列、买家进行各种操作时最后一次操作所属国家、买家所属地区以及其他反应买家操作行为的信息,得买家操作历史记录信息;对买家操作历史记录信息中的产品或商情分别统计其ー个月内买家的操作量、该产品或商情所属目录以及对应卖家的权重,得到产品或商情被操作量信息;根据买家在ー个月内进行的全部操作行为记录统计活跃买家的历史兴趣信息;统计买家所属具体地区,按照预先设定的规则将其对应到所述推荐系统可识别的地区表述。将以上各种统计所得信息存入数据库中以备后续推荐系统调用。其中,数据库中存储的预处理信息包括买家询盘、访问、捜索、收藏等操作本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:李莉魏宝军贾纺纺许应楠
申请(专利权)人:焦点科技股份有限公司南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1