商品标识标签的方法、装置及商品导航的方法制造方法及图纸

技术编号:9835157 阅读:211 留言:0更新日期:2014-04-02 00:41
本发明专利技术涉及一种商品标识标签的方法、装置及商品导航的方法。该商品标识标签的方法,包括以下步骤:提取商品的描述信息;将所述商品的描述信息聚合生成文本;使用基于主题模型的文本分析方法对所述文本进行主题分析,得到若干主题,并定义主题名称;将与所述商品的描述信息相关联的主题名称作为所述商品的标签对所述商品进行标识。利用本发明专利技术可以为商品标识用户维度属性的标签,以便用户更直观快捷的找到自己需要的商品。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种。该商品标识标签的方法,包括以下步骤:提取商品的描述信息;将所述商品的描述信息聚合生成文本;使用基于主题模型的文本分析方法对所述文本进行主题分析,得到若干主题,并定义主题名称;将与所述商品的描述信息相关联的主题名称作为所述商品的标签对所述商品进行标识。利用本专利技术可以为商品标识用户维度属性的标签,以便用户更直观快捷的找到自己需要的商品。【专利说明】
本专利技术涉及电子商务网站导航领域,尤其涉及一种。
技术介绍
目前,电子商务网站基本上都采用类目导航和属性导航为用户提供导航信息。类目导航大多采用树状结构表示,用户通过点击类目导航中的内容缩小查找范围,然后利用属性导航精确的查找用户所需的商品。属性导航相较于其它类型的导航更加多元化,能够更好的吸引用户。但是无论是大众化的属性导航还是个性化的属性导航,现有的属性导航中显示的标签都是商品的固有属性,并且将这些标签标识在商品上,以便用户通过导航进行查找商品。这些标签是在卖家用户上传商品时提供的信息,然后经过人工审核,再将这些标签直接标识在商品上。并且属性导航中显示的内容也是这些对商品固有属性描述的标签。例如,服装类商品,在现有的属性导航中仅能显示出品牌,材质,尺寸,基本样式等对服装固有属性的描述。上述方案中,对商品标识的标签的形式过于单一,不能给商品标识便于用户挑选的标签,并且导航中显示的内容仅是对商品固有属性的描述的标签,有些标签对用户来说不够通俗易懂,不能直接反映用户的心理需求。现在,用户对商品关注的角度越来越多,相应地,商品种类、数量越来越多,每一件商品中的信息量也越来越大,对这些商品信息按照用户关注的角度对这些大量的商品信息进行分类处理也是亟需解决的问题。
技术实现思路
本专利技术的目的是,提供一种,便于用户查找商品。为实现上述目的,本专利技术提供了一种商品标识标签的方法,该方法包括以下步骤:提取商品的描述信息;将所述的商品的描述信息聚合生成文本;使用基于主题模型的文本分析方法对所述文本进行主题分析,得到若干主题,并定义主题名称;将与所述商品的描述信息相关联的主题名称作为所述商品的标签对所述商品进行标识。另外,本专利技术还提供了一种商品导航的方法,该方法包括以下步骤:提取商品的描述信息;将所述商品的描述信息聚合生成文本;使用主题模型的文本分析方法对所述文本进行主题分析,得到若干主题;将所述商品分别与所述主题关联;将所述商品按每一商品关联的主题分类导航。相应的,本专利技术提供了一种商品标识标签的装置,该装置包括:提取模块,用于提取商品的描述信息;生成模块,用于将所述商品的描述信息聚合生成文本;分析模块,用于使用基于主题模型的文本分析方法对所述文本进行主题分析,得到若干主题,并定义主题名称;第一标识模块,用于将与所述商品的描述信息相关联的主题名称作为所述商品的标签对所述商品进行标识。因此,本专利技术实施例通过对商品的描述信息的聚合文本进行分析,得到用于对商品进行标识的用户维度的标签,可以区别于传统的类目导航,便于对商品信息的分类及导航,能提高向用户提供商品信息的准确性和效率。通过上述方式建立的导航或对商品标识的标签更加多样化和智能化,能够使得用户更快更方便的找到自己喜欢的商品。【专利附图】【附图说明】图1为本申请实施例的商品标识标签的方法所涉及的系统架构示意图;图2为本申请实施例的商品标识标签的方法的流程图;图3为本申请实施例的商品导航的方法的流程图;图4为本申请实施例的商品标识标签的装置的结构示意图;图5为本申请实施例的另一种商品标识标签的装置的结构不意图。【具体实施方式】下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。本申请实施例提供一种商品标识标签的方法。该方法包括以下步骤:提取商品的描述信息,再将该商品的描述信息聚合生成文本,使用基于主题模型的文本分析方法对该文本进行主题分析,得到若干主题,并定义主题名称,最后将与商品的描述信息相关联的主题名称作为商品的标签对商品进行标识。首先,如图1所示,简单介绍本申请实施例的商品标识标签的方法所涉及的系统架构。该系统包括终端I和服务器2。终端I和服务器2通过互联网或者无线网络与服务器2进行通信。其中,终端I包括买家终端11和卖家终端12。当卖家通过卖家终端12进行商品上架时,服务器2通过互联网接收到卖家提供的上架商品的描述信息,描述信息包括:标题信息、属性信息(属性信息包括:商品的固有属性和用户维度属性)。例如,卖家上架的商品为一双女士皮鞋,卖家在上架皮鞋时,同时会上传该女士皮鞋的标题信息及其属性信息,如材质,样式,鞋跟高低等信息。服务器2提取商品的卖家上传的描述信息和/或数据库中原本保存的商品的描述信息,然后把商品的描述信息聚合生成文本,使用基于主题模型的文本分析方法对该文本进行主题分析,得到若干主题,并定义主题名称,最后将与商品的描述信息相关联的主题名称作为商品的标签对商品进行标识。需要说明是,其中定义的主题名称是根据商品的用户维度属性定义的。商品的用户维度属性是从用户的角度来描述一个商品。因此,将这些具有用户维度属性的主题名称作为标签为商品进行标识,更加贴近用户挑选商品的习惯,从而使得用户可以直观明确的查找到需要的商品。如图2所示,其为本申请实施例的商品标识标签的方法的流程图。其中,执行主体可以为服务器、软件或两者的结合。本申请实施例的商品标识标签的方法包括步骤201-204。步骤201,提取商品的描述信息。需要说明是,提取的商品的描述信息包括卖家在上传时提供的商品描述信息,还包括数据库中原本记录的商品描述信息。步骤202,将商品的描述信息聚合成文本。具体的,首先,根据商品图片相似或相同的程度,把同一款的商品聚合,然后把同款的商品的描述信息叠加,并对叠加后的描述信息进行分词,同时去除一些叠加后的商品描述信息中词频超过预设的第一阈值的词和低于预设的第二阈值的词(也即将描述信息中词频过高和过低的词去除),作为该同款商品的统一描述文本。其中,第一阈值大于第二阈值。因为商品的描述信息,尤其是商品的标题信息,一般由卖家根据用户的挑选习惯定义的,通过剔除商品描述信息题中词频过高和过低的词,可以剔除掉商品中的常用的类目词,同时也剔除了一些与商品固有属性相关的词。所以再经过上述处理所得到的统一描述文本包含了若干具有用户维度属性的词。例如,在女装类目下,共有将近9千万的商品数,可根据商品的相同或相似的图片把统一款式的商品聚合。因为不同的卖家对商品标题的叙述会有所不同,所以把这些同款商品的标题进行叠加,形成一个对商品全面描述的文本。叠加后的描述文本非常复杂且繁长,所以进行分词处理和除去词频过高和过低的搜索词的处理。例如,同一款女装叠加后的描述文本为“2012中长款女装优雅淑女弹力大码雪纺衫短袖上衣宽松蝙蝠T恤”,经过上述处理后,将其中“2012”,“女装”。“短袖上衣”,“T恤”等使用频率高的搜索词删除,则该款式的女装的统一描述文本为“中长款优雅淑女弹力大码雪纺衫宽松蝙蝠”。按照以上方法,分别获得其他各种款式的女装的统一描述文本。对各种款式的女装的统一描述文本聚合形成新的文本。步骤203,使用基于主题模型的文本分析方法对该文本进行主题分析,得到若干主题,并定义主题名称。利用基于主题模型的文本分本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201210326456.html" title="商品标识标签的方法、装置及商品导航的方法原文来自X技术">商品标识标签的方法、装置及商品导航的方法</a>

【技术保护点】
一种商品标识标签的方法,其特征在于:提取商品的描述信息;将所述商品的描述信息聚合生成文本;使用基于主题模型的文本分析方法对所述文本进行主题分析,得到若干主题,并定义主题名称;将与所述商品的描述信息相关联的主题名称作为所述商品的标签对所述商品进行标识。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙常龙曾安祥
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1