查询词融合方法、商品信息发布方法和搜索方法及系统技术方案

技术编号:10196186 阅读:123 留言:0更新日期:2014-07-10 23:02
本申请提供了一种查询词融合方法、商品信息发布方法和搜索方法及系统,其中,一种查询词的融合方法包括:获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息;从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息;将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的推荐关键词。一种查询词融合方法,解决了结构化查询只能维系在关键词部分上的问题,实现了将原始查询词、点击的商品层级类目信息和属性信息整合为推荐关键词的目的。

【技术实现步骤摘要】
查询词融合方法、商品信息发布方法和搜索方法及系统
本申请涉及网络
,特别是涉及一种查询词融合方法、商品信息发布方法和搜索方法及系统。
技术介绍
搜索引擎的相关性商品信息是目前效果较好的互联网商品信息形式之一,这类商品信息的特点是普遍实行竞价排名,如果商品信息的推广用户(全文可简称“商品信息用户”)想要在搜索引擎中获得第一位排名或者出现在搜索结果的首页,就需要参与竞价排名,而且出价高的商品信息被显示在比较靠前的位置。现有技术中的一种基于竞价排名的商品信息发布及搜索方法如下:商品信息用户购买关键词并以该关键词为竞价单元,将各自发布的商品信息参与竞价;其中,对于同一关键词可对应出价不同的若干个商品信息。搜索用户利用搜索引擎,通过关键词搜索商品信息。搜索引擎从参与竞价的商品信息中,检索得到符合所述关键词的商品信息,并依据商品信息的出价的高低,对检索得到的商品信息进行排序,然后将排序后的商品信息进行展现。上述方法是以关键词为竞价单元,在应用于搜索引擎的时候,存在以下缺点:1、从搜索引擎的角度分析:假设搜索用户在“手机”类目下搜索“苹果”时,卖苹果这种水果的商品信息用户也会加入关键词“苹果”的竞价,故在后续的商品信息展现时,搜索引擎不得不通过相关性的判断,过滤这部分商品信息用户的商品信息,只展现手机类目下卖苹果手机这部分商品信息用户的商品信息;而该过滤过程不仅增加了搜索引擎服务器的运算量,而且牺牲了搜索效率。2、从商品信息用户的角度分析:商品信息用户竞争搜索引擎流量展现机会的标的,就是竞价单元。其中,“流量”一词来源于美国,在美国流量用“traffic”来表示。用户发出一个搜索请求,也即发出了一次商品信息请求,一个搜索引擎将所有这些请求合起来,就形成了搜索流量。在网站中,除了搜索流量还有其他类型的流量,比如活动流量等不是通过用户传达搜索意图来显示的流量。结构化查询包括类目、属性和关键词三个层级的内容,比如第一层级是类目(例如:女装),第二层级是属性(例如:颜色、材质、品牌),第三层级是关键词(例如:2011新款),那么这样一个完整的查询由三个层级的内容来构成。而目前搜索推广的竞价单元通常是关键词,即结构化查询中的关键词部分,而不是完整的结构化,这就导致商品信息用户没有办法针对自己想要的流量进行出价和效果调整。商品信息用户面对的查询都是结构化的,但是却只能购买结构化查询中关键词部分来进行竞价,这样商品信息用户看到的推广质量也维系在结构化查询的关键词部分上。例如,对于结构化查询“连衣裙(关键词)+白色(属性)”、“连衣裙(关键词)+短袖(属性)”和“连衣裙(关键词)+童装(类目)”,目前商品信息用户只能通过购买“连衣裙”这个关键词来参与竞价,而且上述三种结构化查询的流量在搜索引擎后台都会被合并到“连衣裙”这个关键词上,商品信息用户只能针对“连衣裙”这个关键词进行调价,而无法得知上述三种结构化查询中,具体哪一种推广效果比较好。又如,以卖苹果手机的商品信息用户为例,只要其对“苹果”这个关键词竞价,将来就必须参与“苹果”、“苹果+手机类目”、“苹果+手机类目+运营商联通绑定预付费电话卡属性”三种搜索用户搜索的竞价排名;但是,在卖苹果手机的商品信息用户的商品信息针对港行手机的情况下,由于港行手机无法提供“运营商联通绑定预付费电话卡”的属性,按照CPC(Cost PerClick,点击付费)的原理,如果搜索用户点击了卖苹果手机的商品信息用户的商品信息,这不仅会无端克扣商品信息用户的费用,造成其经济损失,而且会对搜索用户提供错误的搜索结果及造成错误的导向,这不但浪费网络资源,而且影响用户体验。3、从搜索用户的角度分析:搜索用户如果想购买苹果手机,则可以通过如下三种结构化查询方式中的任一种来实现:“苹果手机(关键词)”、“手机类目+苹果(关键词)”或者“手机类目+苹果属性”;但是,由于搜索引擎仅仅依据层级内容中的关键词进行商品信息的检索,三种结构化查询方式得到的商品信息检索结果是不同的;因此,对于搜索用户,同样的搜索意图却看到不同的商品信息检索结果,这就影响了搜索用户的使用体验。总之,目前的商品信息发布及商品信息搜索都是基于关键词进行,对搜索引擎、商品信息用户和搜索用户会带来如上所分析的问题。
技术实现思路
本申请提供了 一种查询词融合方法、商品信息发布方法和搜索方法及系统,其中一种查询词融合方法,解决了结构化查询只能维系在关键词部分上的问题,实现了将原始查询词、点击的商品层级类目信息和属性信息整合为推荐关键词的目的;一种商品信息发布方法,解决了商品信息竞价词不准确的问题;一种商品信息搜索方法,解决了商品信息搜索结果不准确的问题。为了解决上述问题,本申请公开了一种查询词的融合方法,包括:获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息;从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息;将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的推荐关键词。可选地,所述将所提取的原始查询词、商品层级类目信息和属性信息进行融合,包括:将所提取的原始查询词、商品层级类目信息和属性信息经过分词、同义词去重、近义词合并、重点内容分析和重排序处理中的至少一个步骤。可选地,所述同义词去重和近义词合并包括:针对经过分词处理后得到的各个分词单元,计算任意两个分词单元之间的相似度;通过将所述相似度与预置的同义词判定阈值和近义词判定阈值进行比较,判定所述任意两个分词单元是否属于同义词或近义词;将判定为同义词的两个重复的分词单元去除任意一个并保留另一个分词单元;将判定为近义词的两个分词单元按照预设条件保留其中一个分词单元。可选地,所述重点内容分析包括:针对同义词去重和近义词合并后的各个分词单元,获取各个分词单元对应的分析元素,所述分析元素包括各个分词单元所属的查询词部分、层级类目、类目下的属性的层级权重,和/或,各个分词单兀的点击率;依据所述分析元素确定各个分词单元的重要度;按照重要度的高低从各个分词单元中确定出重点内容。可选地,所述重排序包括:按照重要度的高低,将重要度高的分词单元排在重要度低的分词单元之后。可选地,所述分词和同义词去重之间还包括:对分词后得到的各个分词单元进行中英文和/或大小写归一化处理。本申请还公开了一种商品信息发布方法,包括:获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息;从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息;将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的竞价词;接收各个商品信息用户选定的竞价词,以及对应所选竞价词投放的商品信息信息和出价信息;以竞价词为索引,按照出价信息将对应同一竞价词的各个商品信息用户投放的商品信息信息进行排序;将排序后的商品信息信息以竞价词为索引发布到商品信息数据库。可选地,还包括:以竞价词为索引,统计所述商品信息数据库中的竞价词对应的商品信息推广效果数据,所述商品信息推广效果数据包括以下数据中的一项或多项:商本文档来自技高网
...
查询词融合方法、商品信息发布方法和搜索方法及系统

【技术保护点】
一种查询词的融合方法,其特征在于,包括:获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息;从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息;将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的推荐关键词。

【技术特征摘要】
1.一种查询词的融合方法,其特征在于,包括: 获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息; 从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息; 将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的推荐关键词。2.根据权利要求1所述的方法,其特征在于,所述将所提取的原始查询词、商品层级类目信息和属性信息进行融合,包括: 将所提取的原始查询词、商品层级类目信息和属性信息经过分词、同义词去重、近义词合并、重点内容分析和重排序处理中的至少一个步骤。3.根据权利要求2所述的方法,其特征在于,所述同义词去重和近义词合并包括: 针对经过分词处理后得到的各个分词单元,计算任意两个分词单元之间的相似度; 通过将所述相似度与预置的同义词判定阈值和近义词判定阈值进行比较,判定所述任意两个分词单元是否属于同义词或近义词; 将判定为同义词的两个重复的分词单元去除任意一个并保留另一个分词单元; 将判定为近义词的两个分词单元按照预设条件保留其中一个分词单元。4.根据权利要求2所述的方法,其特征在于,所述重点内容分析包括: 针对同义词去重和近义词合并后的各个分词单元,获取各个分词单元对应的分析元素,所述分析元素包括各个分词单元所属的查询词部分、层级类目、类目下的属性的层级权重,和/或,各个分词单元的点击率; 依据所述分析元素确定各个分词单元的重要度; 按照重要度的高低从各个分词单元中确定出重点内容。5.根据权利要求4所述的方法,其特征在于,所述重排序包括: 按照重要度的高低,将重要度高的分词单元排在重要度低的分词单元之后。6.根据权利要求2所述的方法,其特征在于,所述分词和同义词去重之间还包括: 对分词后得到的各个分词单元进行中英文和/或大小写归一化处理。7.—种商品信息发布方法,其特征在于,包括: 获取搜索行为信息,所述搜索行为信息中包含在搜索过程中输入的原始查询词、点击的商品层级类目信息和属性信息; 从所述搜索行为信息中提取出原始查询词、商品层级类目信息和属性信息; 将所提取的原始查询词、商品层级类目信息和属性信息进行融合,得到综合了查询词部分、层级类目、类目下的属性三个部分的竞价词; 接收各个商品信息用户选定的竞价词,以及对应所选竞价词投放的商品信息信息和出价信息; 以竞价词为索引,按照出价信息将对应同一竞价词的各个商品信息用户投放的商品信息信息进行排序; 将排序后的商品信息信息以竞价词为索引发布到商品信息数据库。8.根据权利要求7所述的方法,其特征在于,还包括: 以竞价词为索引,统计所述商品信息数据库中的竞价词对应的商品信息推广效果数据,所述商品信息推广效果数据包括以下数据中的一项或多项:商品信息页面的浏览数据、商品信息中推广的商品或服务页面的点击数据和商品信息中推广的商品或服务的成交日志数据; 以竞价词为索引,将所述商品信息推广效果数据进行展现。9.一种商...

【专利技术属性】
技术研发人员:孙尧
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1