一种商品排重方法和系统技术方案

技术编号:12060667 阅读:181 留言:0更新日期:2015-09-17 11:07
本发明专利技术涉及电子商务领域,公开了一种商品排重方法,该方法包括:根据商品类型及属性定制排重模板;获取商家申请的所述商品类型及属性;根据所述商品类型调用相应模版,根据所述属性计算相似度分值;将所述相似度分值与所述排重模板的阈值比较,若大于阈值,则所述商品重复。本发明专利技术通过计算相似度分值和设置排重模板的阈值,解决了重复商品过多、商家、商品难以管理,以及同一商品多个商家重复申请的问题,避免了用户/消费者前台搜索时同一商品出现过多的情形。

【技术实现步骤摘要】

本专利技术涉及电子商务领域,尤其涉及一种商品排重方法和系统
技术介绍
随着互联网技术的飞速发展以及人们消费观念的逐渐转变,电子商务开始迅猛发 展,电子商务平台随着海量商家的入驻,对千万级商品的管理成为开放电子商务平台的难 题,商品重复过多,消费者在前台搜索后出现的商品太多,为消费者挑选商品造成了困难, 同时也为电子商务平台的管理带来了不便。
技术实现思路
本专利技术所要解决的技术问题是,提供一种商品排重方法和系统,以解决由于商品 重复过多,商家、商品难以管理,商家搜索商品造成的一品多商的问题。 本专利技术解决上述技术问题所采用的技术方案是提供一种商品排重方法,该方法包 括步骤: Sl、根据商品类型和商品属性定制排重模板; S2、获取商家申请商品的所述商品类型和商品属性; S3、根据所述商品类型调用相应模板,根据所述商品属性计算相似度分值; S4、将所述相似度分值与所述排重模版的排重阈值相比较; S5、若所述分值大于所述阈值,则所述商品重复; S6、若所述分值小于所述阈值,则新建所述商品。 优选地,步骤Sl中,所述排重模板包括所述商品属性的排重阈值、排重参数和所 述参数的权重,其中,所述排重参数包括品牌、重量和体积等参数。 优选地,步骤S3中,将所述商品属性输入到solr (企业级搜索应用服务器)中,查 询并打分,得到所述相似度分值。 优选地,在所述solr中得到所述相似度分值包括步骤: S301、读取用户输入的查询词; S302、所述solr对所述查询词进行分词处理,将所述分词输入到所述solr中进行 查询; S303、根据相似度计算公式 计算所述相似度分值,其中, q为所述查询词,t为所述分词,d为所述查询词需匹配的模板; tf (t in d)统计所述分词t在所述模板中的词频; boost (t,field in d)在索引过程中设置字段参数; lengthNorm(t, feild in d)计算在索引过程存储的分词的数目; S304、将得到的所述相似度分值由高到低排列并返回至商家。 优选地,步骤S303中,所述相似度分值score (t)在(0, 1]之间,分值越高,所述查 询词与所述模板d匹配度越高。 另一方面,本专利技术提供一种商品排重系统,所述系统包括: 模板制定单元,用于根据商品类型和商品属性制定排重模版; 第一输入单元,用于输入商家申请的所述商品类型和商品属性; solr计算单元,用于根据所述商品类型调用相应模板,并根据所述商品属性计算 相似度分值; 判断单元,用于判断所述相似度分值是否超过所述排重模板中的阈值,若超过,则 所述商品重复,若未超过,则新建所述商品。 优选地,所述排重模版包括所述商品属性的排重阈值、排重参数和所述参数的权 重,其中,所述排重参数包括品牌、重量和体积等参数。 优选地,所述solr计算单元将所述商品属性输入到solr(企业级搜索应用服务 器)中,查询并打分,得到所述相似度分值。 优选地,所述solr计算单元包括: 第二输入单元,用于将商家输入的查询词输入到所述solr中; 分词单元,用于对所述查询词进行分词处理; 打分单元,用于根据相似度计算公式计算所述相似度分值; 输出单元,用于按照得分高低排列所述相似度分值,并将查询结果输出至商家。 优选地,所述打分单元中得到的所述相似度分值在(0, 1]之间,分值越高,所述查 询词与所述排重模板匹配度越高。 本专利技术中,根据所述商品类型调用相应的排重模板,利用所述商品属性计算相似 度分值,并将所述相似度分值与设定好的阈值相比较,确定该商品是否重复,滤除掉大部分 重复商品,防止重复商品过多、商家和商品难以管理,同时,解决了同一商品多个商家重复 申请的问题。【附图说明】 图1是本专利技术的一个优选实施例中商品排重方法的流程图;图2是本专利技术的一个优选实施例中商品排重系统的结构图。【具体实施方式】 以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术 的保护范围。说明书后续描述为实施本专利技术的较佳实施方式,然所述描述乃以说明本专利技术 的一般原则为目的,并非用以限定本专利技术的范围。本专利技术的保护范围当视所附权利要求所 界定者为准。 下面结合附图和具体实施例对本专利技术做进一步详细说明。 如图1所示,为本专利技术的一个优选实施例,公开了一种商品排重方法,该方法包含 步骤: Sl、根据商品类型和商品属性定制排重模板; S2、获取商家申请商品的商品类型和商品属性; S3、根据商品类型调用相应模板,根据商品属性计算相似度分值; S4、将相似度分值与排重模版的排重阈值相比较; S5、若分值大于所述阈值,则商品重复; S6、若分值小于阈值,则新建商品。 本实施例中,根据商品类型调用相应的排重模板,利用商品属性计算相似度分值, 并通过与设定好的阈值相比较,确定该商品是否重复,这样可以根据对阈值的设定滤除掉 大部分重复商品,防止重复商品过多,商家和商品难以管理,解决了同一商品多个商家重复 申请的问题。 进一步地,步骤Sl中,排重模板包括商品属性的排重阈值、排重参数和参数的权 重,其中,排重参数包括品牌、重量和体积等参数。 本实施例中,排重模板包括阈值和品牌、重量以及体积等参数以及这些参数所占 的权重,能够使电子商务平台客观的根据商家输入的商品类型和属性判断该商品与排重模 板之间的相似度。 进一步地,步骤S3中,将商品属性输入到solr (企业级搜索应用服务器)中,查询 并打分,得到相似度分值。 进一步地,在solr中得到相似度分值包括步骤: S301、读取用户输入的查询词; S302、solr对查询词进行分词处理,将分词输入到solr中进行查询; S303、根据相似度计算公式 计算相似度分值,其中, q为查询词,t为分词,d为查询词需匹配的模板; tf (t in d)统计分词t在模板中的词频; boost (t,field in d)在索引过程中设置字段参数; lengthNorm(t, feild in d)计算在索引过程存储的分词的数目; S304、将得到的相似度分值由高到低排列并返回至商家。 更进一步地,步骤S303中,当前第1页1 2 本文档来自技高网...

【技术保护点】
一种商品排重方法,其特征在于,所述方法包括步骤:S1、根据商品类型和商品属性定制排重模板;S2、获取商家申请商品的所述商品类型和商品属性;S3、根据所述商品类型调用相应模板,根据所述商品属性计算相似度分值;S4、将所述相似度分值与所述排重模版的排重阈值相比较;S5、若所述分值大于所述阈值,则所述商品重复;S6、若所述分值小于所述阈值,则新建所述商品。

【技术特征摘要】

【专利技术属性】
技术研发人员:石业明肖建王建健
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1