当前位置: 首页 > 专利查询>中南大学专利>正文

一种商品数据的检索排序方法及系统技术方案

技术编号:13050289 阅读:220 留言:0更新日期:2016-03-23 15:55
本发明专利技术提供了一种商品数据的检索排序方法及系统,该方法包括步骤:根据用户提交的检索条件从商品数据库中查找与检索示例图像及与检索关键词相关的结果,并计算用户当前输入的检索条件与结果之间的相似度;从用户兴趣数据库中提取用户偏好的商品的属性信息,建立用户兴趣偏好模型,通过用户偏好模型计算商品与用户偏好之间的相似度;根据之前计算的两个相似度计算每个结果的排序度函数;按照排序度函数的函数值的大小将结果进行降序排列后,将排序返回给用户。该系统包括检索条件相似度计算模块、用户偏好相似度计算模块、排序度计算模块以及排序结果展示模块。本发明专利技术提供给用户更符合其检索意图的个性化的商品排序。

【技术实现步骤摘要】

本专利技术涉及数据库检索,尤其涉及一种商品数据的检索排序方法及系统
技术介绍
随着互联网和电子商务的迅猛发展,每天都有数以万计的商品交易在电商网站上完成。各大电商平台的商品种类、数量呈爆炸式增长。在纷繁多样的商品信息中,如何为用户提供一种检索服务,使其能够快速准确地检索到自己需要的商品,已经成为电子商务检索研究的一个重要问题。传统的电子商务检索系统采用关键字或者图像匹配来实现检索功能,可能存在一词多义、歧义、用户输入不规范以及图像与商品之间存在“语义鸿沟”等问题,导致检索结果出现偏差,这些在现有自然语言以及图像的处理水平上是没有办法完全避免的。传统电子商务系统的检索结果通常以与用户查询条件相似度的高低作为排序依据,仅结合用户当前的输入进行检索排序,由于用户存在不同的兴趣爱好,即使输入相同的检索请求,其检索意图也可能不同,这种传统的检索方式忽略了用户的背景、习惯、偏好等因素,容易造成检索结果不能符合用户的实际需求,且不能给每个用户提供个性化的服务。
技术实现思路
本专利技术目的在于提供一种商品数据的检索排序方法及系统,以解决传统检索易出现偏差且不能为用户提供个性化服务的技术问题。为实现上述目的,本专利技术提供了一种商品数据的检索排序方法,包括以下步骤:S2:根据用户提交的检索条件从商品数据库中查找与检索示例图像及与检索关键词相关的结果,并计算用户当前输入的检索条件与结果之间的相似度,其中,检索条件包括检索关键词和\或检索示例图像;S4:从用户兴趣数据库中提取用户偏好的商品的属性信息,建立用户兴趣偏好模型,通过用户偏好模型计算商品与用户偏好之间的相似度;S6:根据用户当前输入的检索条件与结果之间的相似度,以及商品与用户偏好之间的相似度,计算每个结果的排序度函数;S8:按照排序度函数的函数值的大小将结果进行降序排列后,将排序返回给用户。作为本专利技术的方法的进一步改进:步骤S2中计算用户当前输入的检索条件与结果之间的相似度,包括以下步骤:S201:计算用户当前输入的检索条件中的检索关键词与结果之间的文本相似度;S202:计算用户当前输入的检索条件中的检索示例图像与结果之间的图像相似度。步骤S201包括以下步骤:S2011:采用向量空间模型的方式,对商品的属性信息进行文本处理,文本处理包括依据属性信息进行分词和切割,并统计各属性信息在所有结果对应的商品中出现的次数,以及在一个结果对应的商品的属性信息中的出现次数;S2012:根据各属性信息在所有结果对应的商品中出现的次数,以及在一个结果对应的商品的属性信息中的出现次数,以TF-1DF算法计算用户输入的关键词在商品的属性信息中的权重;S2013:根据权重,通过余弦向量夹角计算关键词与商品的属性信息之间的文本相似度。步骤S202包括以下步骤:S2021:采用感知哈希算法提取图像的感知哈希值,然后以检索示例图像以及结果所对应的商品的图片之间的感知哈希值的汉明距离计算用户当前输入的检索条件与结果之间的图像相似度,计算公式如下:SimPic (G,Q) = log2 (2+1/(1+d (CodeG, CodeQ))) (1)其中,SimPic(G,Q)为用户当前输入的检索条件与结果之间的图像相似度,d(CodeG, CodeQ)是检索示例图像以及结果所对应的商品的图片之间的感知哈希值的汉明距离,CodeG为结果所对应的商品的感知哈希值,CodeQ为检索示例图像的感知哈希值;图像相似度与汉明距离呈反比。步骤S4包括以下步骤:S401:在用户浏览器的后台采集用户的兴趣偏好所指向的商品,存入用户兴趣数据库中;S402:从用户兴趣数据库中提取用户偏好的商品的属性信息,建立用户兴趣偏好丰旲型;S403:通过用户偏好模型计算商品与用户偏好之间的相似度。步骤S401包括以下步骤:S4011:通过页面脚本监测并记录用户在商品页面的操作行为,并根据操作行为判断用户对商品是否感兴趣以及兴趣浓度的大小,操作行为包括停留时长、鼠标滚动次数、收藏和/或购买;S4012:当判断用户对商品感兴趣时,提取商品对应的属性信息,计算并记录商品对应的属性信息以及商品对应的兴趣浓度权重。步骤S4012中,记录商品对应的兴趣浓度权重,包括以下步骤:S4012A:判断用户是否登录;S4012B:当用户未登录时,将商品对应的属性信息以及商品对应的兴趣浓度权重存储在客户端的cookie中;S4012C:当用户为登录状态时,将存储在客户端的cookie中的用户商品对应的属性信息以及商品对应的兴趣浓度权重上传到服务端并记录在与用户对应的用户兴趣数据库中。步骤S6中,排序度函数的计算公式如下:f (G, Q, P) = 0.7*Sim (G, Q) +0.3*Sim (P, Q) (2)其中,Sim(G, Q)为用户当前输入的检索条件与结果之间的相似度,Sim(P, Q)为商品与用户偏好之间的相似度。基于同一个技术构思,本专利技术还提供一种商品数据的检索排序系统,包括:检索条件相似度计算模块,用于根据用户提交的检索条件从商品数据库中查找与检索示例图像及与检索关键词相关的结果,并计算用户当前输入的检索条件与结果之间的相似度,其中,检索条件包括检索关键词和\或检索示例图像;用户偏好相似度计算模块,用于从用户兴趣数据库中提取用户偏好的商品的属性信息,建立用户兴趣偏好模型,通过用户偏好模型计算商品与用户偏好之间的相似度;排序度计算模块,用于根据用户当前输入的检索条件与结果之间的相似度,以及商品与用户偏好之间的相似度,计算每个结果的排序度函数;排序结果展示模块,用于按照排序度函数的函数值的大小将结果进行降序排列后,将排序返回给用户。作为本专利技术的系统的进一步改进:检索条件相似度计算模块包括:关键词相似度计算单元,用于计算用户当前输入的检索条件中的检索关键词与结果之间的文本的关键词相似度;图像相似度计算单元,用于计算用户当前输入的检索条件中的检索示例图像与结果之间的图像相似度。本专利技术具有以下有益效果:1、本专利技术的商品数据的检索排序方法,将用户输入的检索条件与用户的兴趣偏好相结合,计算二者综合的排序度函数,在不增加用户输入检索条件的情况下,对检索结果进行个性化的排序调整,从而把那些可能跟用户当前输入的检索条件相关,但与用户检索意图存在语义偏差的结果排序降低,返回更加符合用户检索意图的排序结果,提供给用户更符合其检索意图的个性化的商品排序。2、在优选方案中,本专利技术商品数据的检索排序方法,不需要用户显式地回馈偏好信息,在不增加用户输入检索条件的情况下,静默地收集用户的兴趣偏好,建立用户兴趣数据库,使得用户得获得更好、更精准的检索服务。3、本专利技术的商品数据的检索当前第1页1 2 3 4 本文档来自技高网...
一种商品数据的检索排序方法及系统

【技术保护点】
一种商品数据的检索排序方法,其特征在于,包括以下步骤:S2:根据用户提交的检索条件从商品数据库中查找与检索示例图像及与检索关键词相关的结果,并计算用户当前输入的检索条件与所述结果之间的相似度,其中,所述检索条件包括检索关键词和\或检索示例图像;S4:从用户兴趣数据库中提取用户偏好的商品的属性信息,建立用户兴趣偏好模型,通过所述用户偏好模型计算所述商品与用户偏好之间的相似度;S6:根据所述用户当前输入的检索条件与所述结果之间的相似度,以及所述商品与用户偏好之间的相似度,计算每个所述结果的排序度函数;S8:按照所述排序度函数的函数值的大小将所述结果进行降序排列后,将所述排序返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭克华石宏彬
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1