本申请公开了一种推荐搜索关键词的方法和装置,用以解决现有技术中向没有明确搜索意图的用户推荐搜索关键词时推荐效果不佳,造成搜索引擎服务器系统资源浪费的问题。方法包括:接收输入的搜索关键词;比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。
【技术实现步骤摘要】
本申请涉及信息搜索
,尤其涉及一种推荐搜索关键词的方法和装置。
技术介绍
现有搜索引擎通常都提供搜索关键词推荐的功能。例如,用户在搜索栏中输入搜索关键词,并点击“开始搜索”的按钮后,跳转到的页面中不仅包含搜索结果(对网页搜索来说,搜索结果是匹配搜索关键词的网页的链接地址和其他展示信息),还包括搜索引擎推荐的与用户输入的搜索关键词相关的其他搜索关键词或搜索关键词的组合。或者,用户在搜索栏中输入搜索关键词,会在搜索栏的下拉菜单中弹出与用户输入的搜索关键词相关的推荐关键词,以便用户选择某一推荐关键词后进行搜索。现有的推荐搜索关键词的方案通常都是基于搜索日志的,将搜索日志中与用户输入的搜索关键词相关度较高的搜索关键词作为推荐的搜索关键词的,基本原理如下首先建立搜索日志。搜索日志中包含的搜索关键词有以下来源其一为用户每次在搜索栏中输入的搜索关键词;其二为搜索引擎推荐的搜索关键词。并确定搜索日志中的搜索关键词对应的重要性参数的参数值,搜索日志中的搜索关键词对应的重要性参数的参数值主要取决于以下因素,具体可以按照各因素加权求和的方式来确定每个搜索关键词重要性参数的参数值1、点击因素,即该搜索关键词的搜索结果是否存在被用户点击的记录、被点击的次数以及点击的位置等,具体地,若用户只利用该搜索关键词进行了搜索但未点击搜索结果中的网页链接地址,则该搜索关键词的点击因素的参数值较低,例如设定的该因素的参数值为0 ;若用户利用该搜索关键词进行了搜索后且点击了搜索结果,则该搜索关键词的点击因素的参数值较高,例如设定该因素的参数值为搜索结果被点击的次数。如果搜索关键词存在点击记录、且被点击的次数较多,则该搜索关键词的点击参数的参数值更高,从而使得加权求和后重要性参数的参数值较高。2、该搜索关键词的质量因素。搜索关键词的质量因素包括搜索关键词的长度、语义项数目、以及是否包含预定搜索关键词集合中的搜索关键词等。搜索关键词的长度即搜索关键词包含的字符数目,具体地,为不同字符数目分别预先设定对应的该因素的参数值, 例如设定长度为2的搜索关键词对应的该因素的参数值为1、设定长度为3的搜索关键词对应的该因素的参数值为0. 8、设定长度为4的搜索关键词对应的该因素的参数值为0. 5 等等;语义项数目是指对该搜索关键词进行分词处理后,将分词处理获得的语义项(Term) 数目与设定的比较阈值进行比较,根据比较结果确定搜索关键词对应的语义项因素的参数值;预定的搜索关键词集合例如违禁词集合、产品品牌词集合或特殊商业意图词集合等,根据比较搜索关键词中是否包含这些预定的搜索关键词集合中的样本词,来确定搜索关键词对应的该因素的参数值。在进行搜索关键词推荐时,搜索引擎接收到用户在搜索栏中输入搜索关键词后, 针对搜索日志中包含的每个搜索关键词,执行确定搜索日志中包含的各搜索关键词与输入的搜索关键词的相似度值,具体确定两个搜索关键词相似度值的方法有很多,例如基于两个搜索关键词最长公共子串等方法, 然后对确定出的相似度值和搜索日志中包含的该搜索关键词的重要性参数的参数值进行加权求和的方式来确定搜索日志中包含的该搜索关键词的推荐度值。按照对应的推荐度值由高到底的顺序,对搜索日志中包含的搜索关键词进行排序,选择排序靠前的N个搜索关键词作为推荐给用户的搜索关键词。上述基于搜索日志的推荐搜索关键词的方案的优点在于能够逐步引导具有明确搜索意图的用户完成或修正搜索过程。例如,用户输入的搜索关键词为“手机”,按照上述基于搜索日志的推荐搜索关键词的方案第一次推荐出的搜索关键词为“S品牌手机”,用户点击了推荐的搜索关键词“S品牌手机”进一步进行搜索时,相当于本次输入的搜索关键词为 “S品牌手机”,按照上述基于搜索日志的推荐搜索关键词的方案第二次推荐出的搜索关键词为“S品牌智能手机”,依此类推。然而对于没有明显搜索意图的用户而言,例如用户输入的搜索关键词为“代理加盟”,上述不断细化的推荐方式难以满足需求,推荐出的搜索关键词往往是与输入的搜索关键词语义上基本一致或在输入的搜索关键词基础上添加其他限定词后的词,并且推荐出的搜索关键词往往局限于某个特定的领域,推荐搜索关键词的效果不佳,即推荐出的关键词很少被用户进一步点击。并且,由于搜索引擎服务器进行相关关键词的推荐时,需要调取搜索日志、进行相似度值的计算、排序等操作,占用了搜索引擎服务器的系统资源,然而推荐的相关关键词确无法满足用户的需求,因此,这造成了搜索引擎服务器系统资源的浪费,影响了搜索引擎服务器的处理效率。
技术实现思路
本申请实施例提供一种推荐搜索关键词的方法和装置,用以解决现有技术中向没有明确搜索意图的用户推荐搜索关键词时推荐效果不佳,造成搜索引擎服务器系统资源浪费的问题。本申请实施例提供的技术方案如下一种推荐搜索关键词的方法,包括接收输入的搜索关键词;比较接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图词集合中的样本词;当比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式,以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。一种推荐搜索关键词的装置,包括接收单元,用于接收输入的搜索关键词;比较单元,用于比较接收单元接收的搜索关键词与设定的非意图词集合中的样本词以及设定的意图此集合中的样本词;第一推荐单元,用于在比较单元得到的比较结果为接收的搜索关键词包含非意图词集合中的样本词而不包含意图词集合中的样本词时,以第一预定推荐方式为确定推荐搜索关键词的主方式, 以除第一预定推荐方式外的其他推荐方式为确定搜索关键词的辅助方式的策略,确定推荐搜索关键词,其中,第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式。本申请实施例通过首先对用户输入的搜索关键词进行搜索意图识别,识别搜索关键词是否有明显搜索意图;对于没有明显搜索意图的搜索关键词,以第一预定推荐方式为确定推荐搜索关键词的主方式,而以其他推荐方式为确定搜索关键词的辅助方式的策略来确定推荐的搜索关键词,由于第一预定推荐方式为适用于在没有明显搜索意图情况下的基于知识库的推荐方式和/或基于会话相关性的推荐方式,因此改善了搜索关键词的推荐效果,提高了搜索引擎服务器的处理效率。附图说明图1为本申请实施例的主要实现原理流程图;图2为本申请实施例一中推荐搜索关键词的装置的原理示意图;图3a为本申请实施例一提供搜索关键词推荐方案的流程图;图北为本申请实施例一中动态调整a、b、c值的流程图;图4为本申请实施例一中基于知识库的推荐方式的原理示意图;图5为本申请实施例一中四个包含不同词条类型词条的集合的示意图;图6为本申请实施例一中基于会话相关性的推荐方式的原理示意图;图7为本申请实施例二提供搜索关键词推荐方案的流程图;图8为本申请实施例提供的一种推荐搜索关键词的装置的具体结构示意图。具体实施例方式针对现有搜索关键词推荐方案存在的为没有明显搜索意图的用户推荐搜索关键词时效果不佳,造成搜索引擎服务器系统资源浪费的问题。本申请实施例提出了一种关键词推荐方案,该方案首先对本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:朱力,朱小聪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。