【技术实现步骤摘要】
进行数据搜索的方法及搜索服务器
本专利技术涉及数据处理技术,尤其涉及进行数据搜索的方法及搜索服务器。
技术介绍
现有技术中,进行数据搜索时,用户在搜索网页的查询栏中输入查询词,向搜索服 务器发送包含查询词的查询请求,接收搜索服务器反馈关于查询词的搜索条目;之后,用户 可点击搜索条目,以切换到该搜索条目对应的网页查询详细内容。 在用户输入查询词的过程中,搜索服务器会根据用户输入的过程信息反馈联想 词,以显示在网页的智能提示栏中;用户可直接点击联想词,以作为查询词,发送给搜索服 务器。并且,在显示搜索条目时,网页在相关搜索栏还会显示与查询词关联的相关搜索词, 一般地,相关搜索栏置于网页下端。 举例进行说明,想要输入的查询词为ABC,当输入到AB时,即过程信息为AB,联想 词里包括ABC、阿波罗、ABB等,这时可以直接选中ABC;进行查询之后,相关搜索栏中显示的 相关搜索词包括智能ABC输入法、ABC儿歌等。 用户的搜索行为记录在搜索日志中,搜索服务器对搜索日志进行分析,来确定各 查询词的联想词和相关搜索词。分析方法有多种,举例说明:对于查询词ABC,如果搜索日 志中记录的以ABC公司最好为查询词进行查询的次数大于设定阈值,则将ABC公司最 好作为ABC的联想词和相关搜索词,分别放入联想词库和相关搜索词库中。这里,将联想 词和相关搜索词统称为提示词。 在实际运用中,存在采用机器操作频繁输入查询词,以增加某查询词的搜索次数, 进而将其设置到联想词库和相关搜索词库中,以提高该查询词为用户点击的几率。这导致 搜索时显示提示词 ...
【技术保护点】
一种进行数据搜索的方法,其特征在于,该方法包括:从搜索日志中提取出设定时间段内的搜索记录;从搜索记录中统计出对应查询词的特征参数,所述特征参数包括查询词被查询的总次数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv;由查询词的特征参数确定查询词是否为异常查询词;对异常查询词进行标记,以使异常查询词不用于后续的搜索处理。
【技术特征摘要】
1. 一种进行数据搜索的方法,其特征在于,该方法包括: 从搜索日志中提取出设定时间段内的搜索记录; 从搜索记录中统计出对应查询词的特征参数,所述特征参数包括查询词被查询的总次 数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv ; 由查询词的特征参数确定查询词是否为异常查询词; 对异常查询词进行标记,以使异常查询词不用于后续的搜索处理。2. 如权利要求1所述的方法,其特征在于,所述特征参数还包括CQv、NoEentryQv、 SentryQv和URLQv中的至少一种。3. 如权利要求1所述的方法,其特征在于,所述由查询词的特征参数确定查询词是否 为异常查询词,包括:判断NoReferQv/Qv是否大于第一设定阈值,如果是,则将查询词确定 为异常查询词。4. 如权利要求3所述的方法,其特征在于,所述特征参数还包括对查询词对应的查询 结果有点击行为的查询次数CQv,判断NoReferQv/Qv不大于第一设定阈值之后,该方法还 包括: 判断是否满足CQv/Qv小于第二设定阈值且Qv大于第三设定阈值,如果是,则将查询词 确定为异常查询词。5. 如权利要求4所述的方法,其特征在于,所述判断NoReferQv/Qv是否大于第一设定 阈值之前,该方法还包括: 判断Qv是否大于第四设定阈值,如果是,则执行所述判断NoReferQv/Qv是否大于第一 设定阈值的步骤,第四设定阈值小于第三设置阈值;否则,将查询词确定为非异常查询词。6. 如权利要求4或5所述的方法,其特征在于,所述特征参数还包含查询词对应的搜索 行为没有标明来源渠道的查询次数NoEentryQv,以及查询词对应的搜索行为来源渠道为特 定渠道的查询次数SentryQv ;判断不满足CQv/Qv小于第二设定阈值且Qv大于第三设定阈 值之后,该方法还包括: 判断SentryQv/Qv是否大于第五设定阈值,如果是,则将查询词确定为异常查询词;否 则判断NoEentryQv/Qv是否大于第六设定阈值,如果是,则将查询词确定为异常查询词。7. 如权利要求6所述的方法,其特征在于,所述特征参数还包含统一资源定位符URL信 息错误次数URLQv,所述URLQv表示查询词对应的URL信息中含有的标签与实际情况不相符 合的次数;所述判断NoEentryQv/Qv不大于第六设定阈值之后,该方法还包括: 判断URLQv/Qv是否大于第七设定阈值,如果是,则将查询词确定为异常查询词。8. 如权利要求1所述的方法,其特征在于,该方法还包括: 接收包含过程信息的查询过程输入信息; 从联想词库中获取与过程信息关联的联想词,去除其中标记为异常查询词的联想词, 将剩余的联想词反馈给搜索客户端在智能提示栏中进行显示; 接收包含查询词的查询请求; 从相关搜索词库中获取与查询词关联的相关搜索词,反馈给搜索客户端在相关搜索栏 中进行显示。9. 一种进行数据搜索的搜索服务器,其特征在于,该搜索服务器包括搜索记录提取单 元、特征参数统计单元、异常查询词确定单元和标记单元; 所述搜索记录提取单元,从搜索日志中提取出设定时间段内的搜索记录,发送给所述 特征参数统计单元; 所述特征参数统计单元,从搜索记录中统计出对应查询词的特征参数,发送给所述异 常查询词...
【专利技术属性】
技术研发人员:王顼,唐文宁,禹荣凌,岑植旺,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。