【技术实现步骤摘要】
一种店铺类目识别模型生成、店铺类目识别的方法及装置
[0001]本申请涉及数据处理领域,具体涉及一种店铺类目识别模型生成、店铺类目识别的方法及装置。
技术介绍
[0002]传统的店铺类目识别方法通过人工手段对店铺类目进行标注,依赖于业务人员手动点击店铺链接,根据店铺下的商品数量和商品类目主观对店铺类目进行定义。
[0003]对于传统的人工标注店铺类目方法而言,由于店铺下大量的在售商品数据和复杂繁多的商品层级分类体系,手动点击店铺链接不仅需要投入大量人力,导致低效率的类目标注,而且由于人工的主观性,易产生错误的标注结果。基于人工标注店铺类目方法表现出的低效率和高风险,需要提供更加高效科学的技术方案。
技术实现思路
[0004]本申请提供了一种店铺类目识别模型生成、店铺类目识别的方法及装置,可以实现快速地店铺类目识别,提高店铺类目识别的效率和准确度,进而减少人工参与及操作失误风险,本申请技术方案如下:一方面,提供了一种店铺类目识别模型的生成方法,所述方法包括:获取样本店铺的样本商品信息和所述样本商品信息对应的多级业务类目;确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和所述每个识别维度对应的类目识别约束信息;基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息;基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构,所述影响因子表征所述每个识别维度在店铺类目识别中的权重;基于所述目标识别信 ...
【技术保护点】
【技术特征摘要】
1.一种店铺类目识别模型的生成方法,其特征在于,所述方法包括:获取样本店铺的样本商品信息和所述样本商品信息对应的多级业务类目;确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和所述每个识别维度对应的类目识别约束信息;基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息;基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构,所述影响因子表征所述每个识别维度在店铺类目识别中的权重;基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型。2.根据权利要求1所述的方法,其特征在于,所述样本商品信息包括多个样本商品的商品信息,所述基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息包括:根据每个样本商品的商品信息和对应的多级业务类目确定所述每个样本商品在所述多个识别维度下对应的识别信息;针对每个识别维度,将所述多个样本商品对应的识别信息满足预设维度条件的样本商品的商品信息和对应的多级业务类目作为所述样本店铺在所述每个识别维度下的目标识别信息。3.根据权利要求1所述的方法,其特征在于,所述基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构包括:基于所述影响因子,确定所述每个识别维度的层级信息;根据所述层级信息和所述每个识别维度对应的至少一个分支节点,生成所述预设树结构。4.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型包括:根据所述目标识别信息,确定所述预设树结构中与所述目标识别信息匹配的目标分支节点,所述目标分支节点为识别维度区间中包含所述目标识别信息的分支节点;将所述预设树结构中包括所述目标分支节点的分支路径,作为目标分支路径;遍历所述目标分支路径中每一目标分支节点,在遍历到所述每一目标分支节点时,判断当前遍历到的分支节点对应识别维度的目标识别信息是否满足对应的类目识别约束信息;若满足,停止遍历,并从当前遍历到的分支节点对应识别维度下的目标识别信息包含的多级业务类目中确定所述样本店铺的类目信息;对所述类目信息进行验证分析,得到验证分析结果;基于所述验证分析结果,对所述每个识别维度的影响因子和对应的至少一个分支节点进行调整,更新所述预设树结构,基于更新后的预设树结构重复所述根据所述目标识别信息,确定所述预设树结构中与所述目标识别信息匹配的目标分支节点至所述对所述类目信息进行验证分析,得到验证分析结果的步骤,直至所述验证分析结果满足预设验证条件;
将所述验证分析结果满足预设验证条件时的预设树结构作为所述店铺类目识别模型。5.一种店铺类目识别方法,其特征在于,所述方法包括:获取待识别店铺的商品信息;将所述商品信息输入商品类目预测模型进行商品类目预测,得到所述商品信息对应的多级标准类目;基于店铺类目识别模型对所述商品信息对应的多级标准类目进行店铺类目识别,得到所述待识别店铺的类目信息;其中,所述店铺类目识别模型根据权利要求1至4任一所述生成方法生成后得到。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取标准类目数据和样本店铺的样本商品信息,所述标准类目数据包括多个标准类目;基于所述多个标准类目,确定所述样本商品信息对应的多级...
【专利技术属性】
技术研发人员:陈鑫亚,侯兴翠,王化楠,
申请(专利权)人:连连杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。