一种线上商品身份唯一性识别确认系统技术方案

技术编号:30644923 阅读:59 留言:0更新日期:2021-11-04 00:49
本发明专利技术公开一种线上商品身份唯一性识别确认系统,涉及商品信息识别领域。首先要收集品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,所述步骤S40建立商品对应表时,独热编码作为唯一识别的编码与商品链接对应,系统识别编码及识别商品本身属性。本发明专利技术通过建立商品品牌及属性词表,有利于转化为独热编码,从而组合确认商品的唯一性,促使整个系统便于使用,工作效率高。工作效率高。工作效率高。

【技术实现步骤摘要】
一种线上商品身份唯一性识别确认系统


[0001]本专利技术属于商品信息识别领域,特别涉及一种线上商品身份唯一性识别确认系统。

技术介绍

[0002]商品属性是指商品本身所固有的性质,是商品在不同领域差异性(不同于其他商品的性质)的集合。也就是说,商品属性是商品性质的集合,是商品差异性的集合。商品在每个属性领域所体现出来的性质在商品运作的过程中所起的作用不同、地位不同、权重不同。呈现在消费者眼前的商品就是这些不同属性交互作用的结果。
[0003]将原始的未经统一标准化的数据经过多种特定规则加工整理汇总后得到品类、品牌、商品等相关信息,确定商品的各种属性(特征值),来确定商品的唯一性,可用于完善公司供应链金融风控模型在商品准入、商品估值、动态跟踪采购、质押商品价格变动等场景的判断精度并及时预警,有效提升整体风控模型对风险把握以及贷中监管预警能力,因此,需要一种能够识别线上商品身份唯一性的系统。

技术实现思路

[0004]针对上述技术问题本专利技术提供一种线上商品身份唯一性识别确认系统,能够对线上商品的身份进行唯一性确认,工作效率高,节省成本。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:一种线上商品身份唯一性识别确认系统,其特征在于:首先要收集品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,具体步骤为:
[0006]步骤S10:首先对商品品牌及商品属性等信息收集,对信息进行人工核对、标记,构建品牌及属性词表数据库,根据词表的品牌或属性特征生成独热编码,供系统进行查询;
[0007]步骤S20:在系统内输入商品链接或推荐系统信息,系统访问商品链接详情页,通过信息提取器提取线上商品信息,将商品主要信息:品牌、子品牌、重量、产地等属性信息提取并进行统一化处理;
[0008]步骤S30:将上一步提取的商品信息返回给系统中,根据系统中已经建立的词表将商品信息转为对应的独热编码,首先建立品牌的独热编码,然后根据将能够描述商品最基本的信息的转换为对应的独热编码;能够描述商品的基本信息的属性不同,属性信息对应的独热编码的词表不同,独热编码表的长度不同,若有信息缺失,则使用缺省值填补;
[0009]步骤S40:将生成的独热编码进行组合,词表中存储的各类属性信息是无序的,通过循环神经网络计算属性对商品特征描述的权重,将商品信息的独热编码由商品特征的权重由高到低排列,将品牌独热编码和商品独热编码组合,生成商品唯一编码,并与对应的链接建立对应表,确认商品身份唯一识别有效性,并录入系统中。
[0010]进一步的,所述步骤S10中构建品牌及属性词表的具体过程为:
[0011]步骤S101:在商品销售网站上爬取商品的品牌及属性信息,包括商品品牌、子品
牌、产地、重量等属性分类,建立表格,并记录品牌及属性信息的索引;
[0012]步骤S102:通过人工对表格进行校准,使品牌下的属性分类正确、属性完备:1)品牌的属性信息能够对品牌特征达到最基本的信息描述;2)每种属性下子分类能够对属性进行信息描述;
[0013]步骤S103:使用校准后的数据建立产品的词表,分别按属性的子分类建立独热编码,使每一个单独属性具有唯一的编码,当需要扩充词表时,按照子分类对属性描述的权重插入到词表中。
[0014]进一步的,所述的信息提取器包括标题提取器A201、文字描述提取器A202、图片描述提取器A203,信息提取器具体工作步骤为:
[0015]步骤S201:使用标题提取器对标题信息或系统推荐信息进行获取,首先将数据信息进行分词,将分词结果保存到缓存区,通过循环神经网络计算缓存区中分词结果的向量权重,去除品牌以外的描述信息,获取权重最高的向量,保留权重最高的分词结果,校验是否为商品中英文名称;
[0016]步骤S202:获取文字描述信息,首先判断是否存在文字描述,若存在,将文字描述按照段落、标点等特征进行属性分割,建立{属性:属性分类}字典;
[0017]步骤S203:获取图片描述,判断图片描述是否存在,若存在,对图片描述进行OCR识别,返回图片上文字信息及信息坐标,对返回值进行品牌属性提取,并进行统一化处理,建立{属性:属性分类}字典,并与文字描述提取器的结果进行对比,将属性补全完整;
[0018]步骤S204:将信息提取器所提取信息进行整合,根据属性信息对品牌描述的权重进行由高到低排序,组成完整商品信息及属性分类。
[0019]进一步的,所述步骤S30根据词表生成独热编码,具体的:1)针对同一品类不同品牌,构建品牌名的中英文词表,词表中每个品牌名只存在一条,固定词表中品牌出现位置,每一品牌占有一位,如需添加新品牌,在词表末尾插入;生成品牌独热编码时,对应品牌位为1,其他位为0;2)针对同一品牌不同属性,每一个属性建立词表,生成独热编码时,对应属性分类位为1,其他位为0;将所有属性转为独热编码,根据属性的权重排序,将独特编码拼接到一起。
[0020]进一步的,所述的步骤S30生成独热编码时,对应属性下属性分类缺失时,缺省值填补,缺省值可有人工修改。
[0021]进一步的,所述步骤S40建立商品对应表时,独热编码作为唯一识别的编码与商品链接对应,系统识别编码及识别商品本身属性。
[0022]本专利技术与现有技术相比的有益效果是:(1)本专利技术基于信息提取器将线上商品的基本信息进行提取以及编码,确认链接商品的唯一性;(2)本专利技术通过建立商品品牌及属性词表,有利于转化为独热编码,从而组合确认商品的唯一性,促使整个系统便于使用,工作效率高。
附图说明
[0023]图1为本专利技术工作方法的流程图。
[0024]图2为本专利技术信息提取的工作流程。
[0025]图3为本专利技术信息提取器的组成结构。
[0026]图4、图5为本专利技术商品品牌及属性转为独热编码过程图。
具体实施方式
[0027]下面结合具体实施例对本专利技术作进一步描述,在此专利技术的示意性实施例以及说明用来解释本专利技术,但并不作为对本专利技术的限定。
[0028]实施例:本实施例以奶粉品牌为例,说明线上商品身份唯一性识别确认系统的工作流程,首先要收集奶粉品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,具体步骤为:
[0029]步骤S10:通过对商品品牌及属性等信息的收集,进行人工核对、标记,构建品牌及属性词表数据库,根据词表的品牌或属性特征生成独热编码,从而生成独热编码供系统进行查询;
[0030]步骤S20:在系统内输入商品链接,系统访问连接详情页,通过信息提取器提取线上商品信息,将商品主要信息:品牌、子品牌、重量、产地等属性信息提取并规格化;例如某奶粉品牌下系列品牌分为普通版、白金版、金装等,重量类别分为400g、800g、1200g等属性;
[0031]步骤S30:将上一步提取的商品信息返回给系统中,根据系统中已经建立的词表将商品信息转为对应的独热编码,首先建立品牌的独热编码,然后根据将能够描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种线上商品身份唯一性识别确认系统,其特征在于:首先要收集品牌信息,构建品牌数据库,然后通过访问商品链接识别商品,具体步骤为:步骤S10:首先对商品品牌及商品属性等信息收集,对信息进行人工核对、标记,构建品牌及属性词表数据库,根据词表的品牌或属性特征生成独热编码,供系统进行查询;步骤S20:在系统内输入商品链接或推荐系统信息,系统访问商品链接详情页,通过信息提取器提取线上商品信息,将商品主要信息:品牌、子品牌、重量、产地等属性信息提取并进行统一化处理;步骤S30:将上一步提取的商品信息返回给系统中,根据系统中已经建立的词表将商品信息转为对应的独热编码,首先建立品牌的独热编码,然后根据将能够描述商品最基本的信息的转换为对应的独热编码;能够描述商品的基本信息的属性不同,属性信息对应的独热编码的词表不同,独热编码表的长度不同,若有信息缺失,则使用缺省值填补;步骤S40:将生成的独热编码进行组合,词表中存储的各类属性信息是无序的,通过循环神经网络计算属性对商品特征描述的权重,将商品信息的独热编码由商品特征的权重由高到低排列,将品牌独热编码和商品独热编码组合,生成商品唯一编码,并与对应的链接建立对应表,确认商品身份唯一识别有效性,并录入系统中。2.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其特征在于:所述步骤S10中构建品牌及属性词表的具体过程为:步骤S101:在商品销售网站上爬取商品的品牌及属性信息,包括商品品牌、子品牌、产地、重量等属性分类,建立表格,并记录品牌及属性信息的索引;步骤S102:通过人工对表格进行校准,使品牌下的属性分类正确、属性完备:1)品牌的属性信息能够对品牌特征达到最基本的信息描述;2)每种属性下子分类能够对属性进行信息描述;步骤S103:使用校准后的数据建立产品的词表,分别按属性的子分类建立独热编码,使每一个单独属性具有唯一的编码,当需要扩充词表时,按照子分类对属性描述的权重插入到词表中。3.根据权利要求1所述的一种线上商品身份唯一性识别确认系统,其...

【专利技术属性】
技术研发人员:蔡毅辉陈明君贾艺璇
申请(专利权)人:上海普洛斯普新数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1