【技术实现步骤摘要】
一种二手电商场景下的低质商品挖掘方法和系统
[0001]本专利技术涉及互联网应用
,特别地涉及一种二手电商场景下的低质商品挖掘方法和系统。
技术介绍
[0002]随着互联网应用及物流行业的发展,越来越多的商家与消费者倾向于在电子商业平台完成相应的交易。相应地,二手电商平台也逐渐发展起来,成为人们处理闲置物品的一种好的方式。二手电商平台与普通的一手电商平台一个显著的区别就是二手商品差异大、非标性强,即使是同一类商品,由于各种不同的使用情况,商品的实际情况也具有较大的差异。由于大部分的商品是经过使用的,因而存在不同程度的磨损,甚至存在损坏、某些功能不可用的情况。例如,对于3C产品(对电脑及其周边通讯和消费电子(Computer,Communications,Consumer
‑
Electronics)三种家用电器的总称)而言,屏幕损伤、机体磨损等是普遍容易存在的问题。又例如普通商品在外观上存在的破损、裂痕以及商品无法正常使用等。对于普通买家而言,即使是想买二手产品,大部分用户也不会希望买个破旧、功能受限的商品,当用户访问二手电商平台、看到的商品大部分都是具有一定程度损坏的商品时,会对该二手电商平台产生不好的印象,进而会影响用户的留存比例以及后续流程的转化。另外,由于各种原因,平台上出售的商品可能有价格异常的情况。例如1元钱的汽车,15元的全新游戏键盘等。异常的商品价格有可能是骗子发布或商品本身存在问题,或者在采用低价吸引流量等原因,很有可能会给买家用户带来损失,导致用户对平台的信任下降、体验差,进 ...
【技术保护点】
【技术特征摘要】
1.一种二手电商场景下的低质商品挖掘方法,其中包括:获取目标商品的挖掘物料,所述挖掘物料包括目标商品当前所属商品类目、价格、标题及文字描述;根据当前所属商品类目确定多种低质挖掘模板;将所述目标商品的挖掘物料分别与每个种类的一个或多个低质挖掘模板进行匹配;以及响应于匹配到的低质挖掘模板,确定所述目标商品为低质挖掘模板定义的低质商品并确定对应的低质内容。2.根据权利要求1所述的方法,其中所述低质挖掘模板包括第一类商品识别模板,所述第一类商品识别模板至少包括表达低质内容的第一词汇。3.根据权利要求2所述的方法,其中所述第一类商品为缺陷商品或同城商品,对应地,第一类商品识别模板为缺陷商品识别模板或同城商品识别模板,所述第一词汇为表达质量缺陷的词汇或表达同城的词汇;在所述目标商品的挖掘物料匹配到缺陷商品识别模板或同城商品识别模板时,确定所述目标商品为质量缺陷商品或同城商品。4.根据权利要求3所述的方法,其中获取第一类商品识别模板的过程包括:获取多个正则模板,其中所述正则模板包括多个替换项及一个或多个固定项;获取一个或多个多元组;其中所述多元组为多个共同出现次数大于阈值的词汇,其中至少一个词汇为表达低质内容的第一词汇;以及将所述多元组中的多个词汇分别填入所述正则模板中对应的替换项,从而得到第一类商品识别模板。5.根据权利要求4所述的方法,其中包括以下数据准备步骤:获取全量挖掘物料,所述全量挖掘物料包括全量商品的所属商品类目、价格、标题及文字描述;从全量挖掘物料中识别出表达质量缺陷和同城的多个第一词汇;提取包括表达质量缺陷或同城第一词汇的商品的标题及文字描述,分别作为第一物料和第二物料;对所述第一物料和第二物料分别进行分词和去停用词处理;在同一商品类目的第一物料中统计出现次数大于第一阈值的多个第一分词;在第二物料中统计出现次数大于第一阈值的多个第一分词;以及在同一商品类目的第一物料中统计共同出现次数大于第二阈值的多个分词以得到商品多元组,其中所述商品多元组中至少一个分词为第一词汇;在第二物料中统计共同出现次数大于第二阈值的多个分词以得到同城多元组,其中所述同城多元组中至少一个分词为第一词汇。6.根据权利要求5所述的方法,其中所述数据准备步骤还包括:按照正则表达式规则构造包括多个替换项和一个或多个固定项的正则模板,其中,所述固定项为第一分词。7.根据权利要求5所述的方法,其中进一步地,通过关键字从全量挖掘物料的文字信息中识别出表达低质内容的多个第一词汇。8.根据权利要求1所述的方法,其中所述低质挖掘模板包括商品价格模板,所述商品价
格模板包括与商品类目相应的合理商品价格区间;采用与目标商品同类目的商品价格模板匹配目标商品价格;响应于目标商品价格位于所述合理商品价格区间外,确定所述目标商品为价格异常商品。9.根据权利要求8所述的方法,其中进一步包括获取合理商品价格区间的步骤:获取一个商品类目的x1%分位数位置商品对应的第一价格p1、x2%分位数位置商品对应的第二价格p2及阈值,其中x1<x2,0≤x≤100;查询该商品类目下价格低于第一价格p1的多个第一商品和价格高于第二价格p2的多个第二商品;从多个第一商品中确定价格最高的商品及对应的价格pt1,从多个第二商品中确定价格最低的商品及对应的价格pt2;分别计算第一价格p1与商品价格pt1的第一差值pd1;第二价格p2与商品价格pt2的第二差值pd2;分别比较第一差值pd1与阈值的大小,第二差值pd2与阈值的大小;响应于第一差值pd1小于阈值,使用所述商品价格pt1替换第一价格p1得到新的第一价格p1;响应于第二差值pd2小于阈值,使用所述商品价格pt2替换第二价格p2得到新的第二价格p2;以及直至没有满足上述条件的商品,将第一价格p1设置为合理商品价格区间最低价格,将第二价格p2设置为合理商品价格区间最高价格。10.根据权利要求1所述的方法,其中所述低质挖掘模板包括商品类目模板,所述商品类目模板包括分类器;在采用商品类目模板与挖掘物料进行匹配时,应用所述分类器根据挖掘物料对目标商品进行分类得到第一...
【专利技术属性】
技术研发人员:范天岳,
申请(专利权)人:北京转转精神科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。