数据处理方法、装置、计算机系统及可读存储介质制造方法及图纸

技术编号:27291194 阅读:28 留言:0更新日期:2021-02-06 12:00
本公开提供了一种用于物品匹配的数据处理方法,包括:获取多个物品的物品特征信息;其中,所述物品特征信息包括物品文本信息和物品图像信息;将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息;其中,标准化物品特征信息与待匹配物品的物品特征信息的描述方式一致;建立与所述待匹配物品对应的匹配规则,其中,所述匹配规则包括基于目标物品特征信息进行匹配的规则;基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。本公开还提供了一种用于物品匹配的数据处理装置、计算机系统和计算机可读存储介质。计算机系统和计算机可读存储介质。计算机系统和计算机可读存储介质。

【技术实现步骤摘要】
数据处理方法、装置、计算机系统及可读存储介质


[0001]本公开涉及计算机
/互联网
,更具体地,涉及一种数据处理方法、装置、计算机系统及可读存储介质。

技术介绍

[0002]随着互联网技术的发展,线上购物成为一个非常重要的消费渠道。而现如今电商网站种类繁多,商品多种多样,商品信息维度多,信息维护不健全不统一,而且各个电商网站下的商品价格不等,因此存在消费者购买商品难免会出现买贵买错的情况。为了给消费者最好的购物体验,买到优质便宜的商品,比价系统应运而生。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:不同电商网站描述同一商品信息时一般以各自的描述喜好或习惯进行描述,描述方式具有个性化特点,导致在匹配相似商品时匹配结果不准确。

技术实现思路

[0004]有鉴于此,本公开提供了一种用于物品匹配的数据处理方法、装置、计算机系统及计算机可读存储介质。
[0005]本公开的一个方面提供了一种用于物品匹配的数据处理方法,包括:
[0006]获取多个物品的物品特征信息;其中,所述物品特征信息包括物品文本信息和物品图像信息;
[0007]将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息;其中,标准化物品特征信息与待匹配物品的物品特征信息的描述方式一致;
[0008]建立与所述待匹配物品对应的匹配规则,其中,所述匹配规则包括基于目标物品特征信息进行匹配的规则;
[0009]基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。
[0010]根据本公开的实施例,在基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品之后,所述方法还包括:
[0011]确定与所述待匹配物品相匹配的相似物品的第一数量;
[0012]从所述与所述待匹配物品相匹配的相似物品中,确定与所述待匹配物品正确匹配的相似物品的第二数量;
[0013]根据所述第二数量和所述第一数量确定所述待匹配物品的正确匹配率;
[0014]若所述正确匹配率大于或等于预设阈值,生成匹配数据库;其中,所述匹配数据库包含有与所述待匹配物品的物品特征信息相匹配的相似物品的标准化物品特征信息和所述待匹配物品的物品特征信息;
[0015]若所述正确匹配率小于预设阈值,则动态调整所述匹配规则;以及
[0016]基于调整后的匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。
[0017]根据本公开的实施例,所述建立与所述待匹配物品对应的匹配规则包括:
[0018]根据不同物品的物品特征信息,建立不同物品分别对应的匹配规则;并将所述不同物品分别对应的匹配规则加载至不同的缓存中,以便在基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品时从对应缓存中调用所述匹配规则;
[0019]所述动态调整所述匹配规则包括:
[0020]分别对所述加载至不同的缓存中的不同匹配规则进行更新。
[0021]根据本公开的实施例,所述物品文本信息包括物品品类信息、物品价格信息、物品属性信息和物品品牌信息。
[0022]根据本公开的实施例,所述将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息包括:
[0023]将所述多个物品的物品品类信息进行标准化转换,得到标准化物品品类信息;
[0024]将所述多个物品的物品属性信息进行标准化转换,得到标准化物品属性信息;
[0025]将所述多个物品的物品品牌信息进行标准化转换,得到标准化物品品牌信息;以及
[0026]将所述多个物品的物品图像信息进行标准化转化,得到物品图像hash值。
[0027]根据本公开的实施例,所述基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品包括:
[0028]基于所述匹配规则,根据所述多个物品的标准化物品品类信息与所述待匹配物品的物品品类信息,利用搜索引擎从所述多个物品中确定与所述待匹配物品相匹配的初始相似物品;
[0029]基于所述匹配规则,根据所述多个物品的除标准化物品品类信息之外的其他标准化物品特征信息与所述待匹配物品的除物品品类信息之外的其他物品特征信息,从所述初始相似物品中确定与所述待匹配物品相匹配的相似物品。
[0030]根据本公开的实施例,所述获取多个物品的物品特征信息包括:
[0031]利用爬虫技术,基于目标物品品类信息,获取多个物品的物品特征信息。
[0032]本公开另一方面还提供了一种用于物品匹配的数据处理装置,包括:
[0033]获取模块,用于获取多个物品的物品特征信息;其中,所述物品特征信息包括物品文本信息和物品图像信息;
[0034]转换模块,用于将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息;其中,标准化物品特征信息与待匹配物品的物品特征信息的描述方式一致;
[0035]建立模块,用于建立与所述待匹配物品对应的匹配规则,其中,所述匹配规则包括基于目标物品特征信息进行匹配的规则;
[0036]确定模块,用于基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。
[0037]根据本公开的实施例,所述建立模块,还用于根据不同物品的物品特征信息,建立不同物品分别对应的匹配规则;并将所述不同物品分别对应的匹配规则加载至不同的缓存中,以便在基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品时从对应缓存中调用所述匹配规则;
[0038]所述装置还包括:动态调整模块,用于分别对所述加载至不同的缓存中的不同匹配规则进行更新。
[0039]本公开的再一方面还提供了一种计算机系统,包括:
[0040]一个或多个处理器;
[0041]存储器,用于存储一个或多个程序,
[0042]其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
[0043]本公开的再一方面还提供了一种计算机可读存储介质,其上存储有可执行指令,所述指令被处理器执行时使处理器实现如上所述的方法。
[0044]根据本公开的实施例,因为采用了获取多个物品的物品特征信息;其中,所述物品特征信息包括物品文本信息和物品图像信息;将所述多个物品的物品特征信息进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于物品匹配的数据处理方法,包括:获取多个物品的物品特征信息;其中,所述物品特征信息包括物品文本信息和物品图像信息;将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息;其中,标准化物品特征信息与待匹配物品的物品特征信息的描述方式一致;建立与所述待匹配物品对应的匹配规则,其中,所述匹配规则包括基于目标物品特征信息进行匹配的规则;基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。2.如权利要求1所述的方法,在基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品之后,所述方法还包括:确定与所述待匹配物品相匹配的相似物品的第一数量;从所述与所述待匹配物品相匹配的相似物品中,确定与所述待匹配物品正确匹配的相似物品的第二数量;根据所述第二数量和所述第一数量确定所述待匹配物品的正确匹配率;若所述正确匹配率大于或等于预设阈值,生成匹配数据库;其中,所述匹配数据库包含有与所述待匹配物品的物品特征信息相匹配的相似物品的标准化物品特征信息和所述待匹配物品的物品特征信息;若所述正确匹配率小于预设阈值,则动态调整所述匹配规则;以及基于调整后的匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品。3.如权利要求2所述的方法,其中,所述建立与所述待匹配物品对应的匹配规则包括:根据不同物品的物品特征信息,建立不同物品分别对应的匹配规则;并将所述不同物品分别对应的匹配规则加载至不同的缓存中,以便在基于所述匹配规则,根据所述多个物品的标准化物品特征信息与所述待匹配物品的物品特征信息,从所述多个物品中确定与所述待匹配物品相匹配的相似物品时从对应缓存中调用所述匹配规则;所述动态调整所述匹配规则包括:分别对所述加载至不同的缓存中的不同匹配规则进行更新。4.如权利要求1所述的方法,所述物品文本信息包括物品品类信息、物品价格信息、物品属性信息和物品品牌信息。5.如权利要求4所述的方法,所述将所述多个物品的物品特征信息进行标准化转换,得到标准化物品特征信息包括:将所述多个物品的物品品类信息进行标准化转换,得到标准化物品品类信息;将所述多个物品的物品属性信息进行标准化转换,得到标准化物品属性信息;将所述多个物品的物品品牌信息进行标准化...

【专利技术属性】
技术研发人员:温程戚依楠
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1