The invention provides a device and a method for generating the search, the method includes: acquiring and user input queries related to the target site; and get the user user portrait, the portrait of the user is used to describe the user search habits, search preferences, search frequency, consumer habits, search for at least one focus in finally, according to the above query; and the user generates the address corresponding to the target image search and display the search in the abstract. The embodiment of the invention, the user portrait into the search summary generating and display process, the user will generate search Abstract portrait as the basis, can effectively guarantee that the generated abstract search more accord with user search habits, preferences and concerns, which enables users to search according to the abstract can quickly and accurately identify whether the link to for users of the link, thus improving the user's search efficiency and accuracy.
【技术实现步骤摘要】
一种搜索摘要生成方法及装置
本专利技术涉及搜索引擎
,具体而言,涉及一种搜索摘要生成方法及装置。
技术介绍
目前,随着网络信息技术的发展,基于快速而准确的找到所需的信息需求,搜索引擎应运而生。用户在搜索系统中进行检索时,搜索引擎根据用户提交的检索请求提供大量对应网站的统一资源定位符(UniformResourceLocator,URL,也称网址)和摘要,用户通过阅读摘要来决定是否浏览该摘要对应的网站。因此,摘要的意义在于指导用户判断URL的价值。一般来说,摘要指的是一篇文章的简短介绍,能准确全面地反映某一篇文章中心内容的简洁连贯的短文,但是搜索引擎采用的摘要概念不一样,它不一定是文章的简短介绍,它只是按照一定的规则在网页中提取的一段信息。搜索引擎中的摘要按照获取的方式不同可以分为两种摘要,一种是静态摘要,另一种是动态摘要,其中,静态摘要只是关于页面内容的一般信息,与用户输入的查询词无关,以文档的内容为中心;动态摘要就是在响应用户查询时,根据查询词在文档中出现的位置,提取出查询词周围相关的文字,在显示时将查询词标出并返回给用户,以查询为中心。当采用动态摘要时,对于一篇文档而言,当用户输入的查询词不同时,最终生成的摘要有所不同。对于现有的技术方案,虽然动态摘要与用户输入的查询词关联起来,由文档中的若干与查询词相关的片段构成,该动态摘要包含了与用户输入的查询词相关的信息,但是,现有技术中的每个链接对应的动态摘要对于不同的用户而言存在针对性差的问题,导致用户根据现有的动态摘要不能快速、准确地识别出该链接是否为用户所需的链接,进而降低用户的搜索效率和准确性。专 ...
【技术保护点】
一种搜索摘要生成方法,其特征在于,所述方法包括:获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要;展示各个所述目标网址对应的所述搜索摘要。
【技术特征摘要】
1.一种搜索摘要生成方法,其特征在于,所述方法包括:获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要;展示各个所述目标网址对应的所述搜索摘要。2.根据权利要求1所述的方法,其特征在于,所述获取所述用户的用户画像之前,还包括:获取所述用户的历史行为数据,所述历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,获取所述用户当前搜索行为的上下文信息,所述上下文信息包括当前时间、当前地点、当前环境、所述用户最近搜索的词语、所述用户最近浏览的网页中的至少一种;根据所述用户的历史行为数据和/或所述上下文信息建立所述用户的用户画像。3.根据权利要求1所述的方法,其特征在于,所述根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要,包括:根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句;设置所述用户画像中各个特征标签的权重值;按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序;选取排序靠前的预设数量的所述候选摘要句生成所述目标网址相应的搜索摘要。4.根据权利要求3所述的方法,其特征在于,所述根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句,包括:对所述目标网址对应的网页中的文档进行分词;将所述查询词与分词后的所述文档进行匹配,计算出所述查询词在所述文档中出现的位置;以及将所述查询词的近义词与分词后的所述文档进行匹配,计算出所述查询词的近义词在所述文档中出现的位置;在所述文档中,以所述查询词出现的位置和所述查询词的近义词出现的位置为基准,截取多个候选摘要句。5.根据权利要求3所述的方法,其特征在于,所述设置所述用户画像中各个特征标签的权重值,包括:计算用户历史上对所述用户画像中每个所述特征标签的操作集中度;根据所述操作集中度确定各个所述特征标签的权重值。6.根据权利要求3所述的方法,其特征在于,所述按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序,包括:采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序。7.一种搜索摘要生成装置,其特征在于,所述装置包括:目标网址获取模块,用于获取根据用户...
【专利技术属性】
技术研发人员:聂鹏宇,石晓巍,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。