商品库的生成方法和系统技术方案

技术编号:37186755 阅读:18 留言:0更新日期:2023-04-20 22:49
本发明专利技术提供了一种商品库的生成方法和系统,涉及电商平台技术领域,该方法包括获取待识别的图片,生成任务处理队列;依次调取任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;将商品基本信息进行标注划分得到图片对应的商品信息,并将所述商品信息进行存储获得商品库。解决了目前创建商品库存在的成本高、效率低的问题。效率低的问题。效率低的问题。

【技术实现步骤摘要】
商品库的生成方法和系统


[0001]本申请属于电商平台
,具体涉及商品库的生成方法和系统。

技术介绍

[0002]近年来,越来越多的电商平台出现,电商平台载体覆盖网页、小程序、手机软件等,而商品库的建设是每个电商平台面临的问题。目前建立商品库的方式主要有两种:一种是通过从付费平台获取,如中国商品信息服务平台,这种方式成本高,数据个性化程度低,可扩展性较差;另一种是通过人工识别信息的方式,通过将商品条码、规格、品牌名称手动录入到系统的方式,这种方式需要大量的人工成本,效率低


技术实现思路

[0003]为此,本申请提供商品库的生成方法和系统,有助于帮助解决目前创建商品库存在的成本高、效率低的问题。
[0004]为实现以上目的,本申请采用如下技术方案:
[0005]一方面,本申请提供一种商品库的生成方法,所述方法包括:
[0006]获取待识别的图片,生成任务处理队列;
[0007]依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
[0008]将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
[0009]进一步地,所述依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,包括:
[0010]利用条码解析库识别扫描所述图片中的条形码获得所述条码值;
[0011]利用第一种识别算法识别扫描所述图片中的文字得到所述商品的文字内
[0012]进一步地,所述将所述商品基本信息进行标注划分得到所述图片对应的商品信息,包括:
[0013]利用神经网络学将所述商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到所述图片对应的商品信息。
[0014]进一步地,所述获取待识别的图片,包括:
[0015]通过采样配置系统扫描商品获得缓存图片,对所述缓存图片进行预处理之后进行存储获得所述待识别的图片。
[0016]进一步地,还包括:
[0017]利用第二种识别算法识别扫描所述图片获得新的所述商品的文字内容,得到新的所述商品基本信息;
[0018]将所述商品基本信息和所述新的所述商品基本信息进行校对得到校对结果,并对所述校对结果中存在问题的商品基本信息进行标注,其中,第一种识别算法和第二种识别
算法不同。
[0019]另一方面,提供一种商品库的生成系统,包括:
[0020]采样模块,用于获取待识别的图片,生成任务处理队列;
[0021]扫描模块,用于依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
[0022]标注模块,用于将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
[0023]本申请采用以上技术方案,至少具备以下有益效果:
[0024]本申请通过获取待识别的图片,生成任务处理队列,依次调取任务处理队列的图片进行识别扫描获得商品基本信息;然后,基于识别扫描得到的商品基本信息进行分类标注,以此得到图片对应的商品信息,并将商品信息进行存储,进而实现通过自动化识别扫描得到商品库,解决了创建商品库成本高、效率低的问题。
[0025]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0026]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是根据一示例性实施例示出的一种商品库的生成方法的流程图;
[0028]图2是根据一示例性实施例示出的一种机器人流程自动化处理图片数据的流程图;
[0029]图3是根据一示例性实施例示出的一种商品库的生成系统框图示意图。
具体实施方式
[0030]为使本申请的目的、技术方案和优点更加清楚,下面将对本申请的技术方案进行详细的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本申请所保护的范围。
[0031]请参阅图1,图1是根据一示例性实施例示出的一种商品库的生成方法的流程图,该方法包括如下步骤:
[0032]S101、获取待识别的图片,生成任务处理队列;
[0033]S102、依次调取任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
[0034]S103、将商品基本信息进行标注划分得到图片对应的商品信息,并将商品信息进行存储获得商品库。
[0035]在一个实施例中,从商品图片大数据中获取待识别的图片生成任务处理队列,依次调取任务处理队列的图片进行识别扫描获得商品基本信息,商品基本信息包含商品的条
码值和商品的文字内容,之后基于该商品基本信息进行标注划分得到图片对应的商品信息,并将该商品信息进行存储,从而获得商品库。本申请中利用机器人流程自动化的方式自动化扫描识别商品图片,进而得到对应的商品信息,并将得到的商品信息存储于本地持久化数据库得到商品库,不需要人工录入信息,节约人工成本,同时大大提高信息录入效率。
[0036]具体的,待识别的商品图片存储于商品图片大数据,商品图片大数据通过数据服务提供拉取图片数据的接口获取数据,其中数据接口处理集群由4组,每组5台执行设备,共20台设备组成,每台设备的日处理能力在17万张商品图片,可以为创建商品库提供数据基础,不需要从付费平台获取,节约成本。
[0037]进一步地,利用条码解析库识别扫描待识别的图片中的条形码获得条码值。具体的,条码解析库采用TXDecoder(Decoder解析器)进行条码解析,也可以采用其他任何具备条码识别能力的解析库。
[0038]进一步地,利用第一种识别算法识别扫描待识别的图片中的文字得到商品的文字内容。
[0039]具体的,利用光学字符识别技术识别扫描待识别图片中的文字,光学字符识别技术采用BaiduOCR(Optical Character Recognition,光学字符识别)扫描识别图片中的文字,包含商品品牌名称、广告语、商品生产厂商、商品规格和商品配料等文字内容。
[0040]进一步地,利用神经网络学将获得商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到待识别的图片对应的商品信息。
[0041]具体的,通过NLP(Neuro

Linguistic Programming,神经语言程序学)神经网对上述识别扫描获取的商本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品库的生成方法,其特征在于,所述方法包括:获取待识别的图片,生成任务处理队列;依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。2.根据权利要求1所述的方法,其特征在于,所述依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,包括:利用条码解析库识别扫描所述图片中的条形码获得所述条码值;利用第一种识别算法识别扫描所述图片中的文字得到所述商品的文字内容。3.根据权利要求2所述的方法,其特征在于,所述将所述商品基本信息进行标注划分得到所述图片对应的商品信息,包括:利用神经网络学将所述商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到所述图片对应的商品信息。4.根据权利要求3所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:马山虎
申请(专利权)人:上海中通吉网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1