当前位置: 首页 > 专利查询>深圳大学专利>正文

一种基于位置的关键字查询推荐方法及系统技术方案

技术编号:15542716 阅读:62 留言:0更新日期:2017-06-05 11:32
本发明专利技术提供的基于位置的关键字查询推荐方法或系统,对关键字‑文档图中边的权重进行调整得到调整后的边的权重,并按照预设的分组规则将所述关键字‑文档图中的关键字和文档分别进行分组,基于用户提交的查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组采用基于分组的算法进行计算,最终得到符合预设条件的关键字,并将所述关键字推荐给用户。此方法推荐的关键字查询的结果文档不仅与用户提交的查询关键字的内容语义相关,而且其空间位置离用户的查询位置较近,因此,其推荐的关键字查询结果或文档质量更高,更能满足用户的需求。

Location based keyword query recommendation method and system

The invention provides a location based on keyword query recommendation method or system, the weight of the weight of keywords document edges are adjusted to obtain adjusted edges, and in accordance with the grouping rules preset the key figure in the document keywords and documents were divided into groups, the weight, the user submits a query keyword the adjusted edge based on the combination of random walk process group calculated using the grouping algorithm based on the obtained accords with the preset condition key, and the key is recommended to the user. This method recommended semantic keyword query results query keyword not only with the user submitted the relevant, and the position of space from the user's query location is near, therefore, the recommended keyword query results or document of higher quality, better meet the needs of users.

【技术实现步骤摘要】
一种基于位置的关键字查询推荐方法及系统
本专利技术属于信息检索领域,尤其涉及一种基于位置的关键字查询推荐方法及系统。
技术介绍
在信息检索中,关键字查询推荐是指用户在提交查询关键字时,系统为用户自动推荐若干与该查询关键字相关的关键字供用户选择,这若干被系统推荐的关键字能够快速查找和定位用户所需要检索的目标,从而满足用户的信息检索需求。目前,在信息检索领域主要采用以下三种查询推荐方法来为用户进行关键字查询推荐。随机漫步方法:基于随机漫步过程的推荐模型是比较常用的一种方法,这种方法利用查询系统日志的信息建立一个查询-数据二部图或者查询流图,在图模型上应用不同种类的随机漫步过程计算出推荐的查询。机器学习方法:基于机器学习的推荐模型方法通过历史数据训练一个模型,采用概率的方法计算待推荐的查询。聚类方法:采用聚类思想的推荐方法试图找出与原查询具有相同特征的查询作为推荐。现有的查询推荐方法只能满足查询关键字语义上相关,而忽略了用户的查询位置上相关,无法保证推荐的查询所获取的结果在用户的查询位置附近,因此很难给予用户期望的查询结果,推荐的查询结果质量很低。
技术实现思路
本专利技术提供了一种基于位置的关键字查询推荐方法及系统,旨在解决现有的关键字查询推荐的查询结果质量低的问题。为解决上述技术问题,本专利技术了一种基于位置的关键字查询推荐方法,所述方法包括下述步骤:步骤1:基于关键字查询日志建立关键字与文档之间的映射关系,并根据所述映射关系、关键字与文档之间的边的权重绘制关键字-文档图,所述边的权重是基于与关键字具有映射关系的文档的被点击次数进行预设标准化计算得到的;步骤2:接收用户提交的查询关键字,并基于所述查询关键字的查询位置、所述关键字-文档图中与所述查询关键字相关的文档的空间位置,对所述关键字-文档图中边的权重进行调整得到调整后的边的权重;步骤3:按照预设的分组规则将所述关键字-文档图中的关键字和文档分别进行分组,基于所述查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组进行计算,得到符合预设条件的关键字,并将所述关键字推荐给所述用户。进一步地,所述步骤2包括:接收用户提交的查询关键字,所述查询关键字信息包含查询关键字kq和查询位置λq;对所述查询关键字kq到与其具有映射关系的文档dj的边e的权重进行调整,调整公式为:其中,ω(e)表示关键字-文档图中边e的权重初始值,dist(λq,dj.λ)表示所述查询位置λq和所述文档dj的空间位置之间的欧氏距离,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数;对所述文档dj到所述查询关键字kq的边e'的权重进行调整,调整公式为:其中,D(kq)表示所述关键字-文档图中与所述查询关键字kq相连的文档的集合,mindist(λq,D(kq))表示所述查询位置λq与所述D(kq)中最近的文档的空间位置之间的欧氏距离,ω(e')表示关键字-文档图中边e'的权重初始值,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数。进一步地,所述步骤3包括:步骤A:将所述关键字-文档图中的关键字和文档分别按照预设分组规则进行分组,得到关键字分组的集合pk={PjK},及文档分组的集合pD={PiD},其中,PjK表示第j个关键字分组,PiD表示第i个文档分组;建立所述关键字分组PjK与所述文档分组PiD之间的映射关系,所述映射关系按照如下方式建立:若关键字kj至少与所述文档分组PiD中的一个文档相连,则将所述关键字kj所在的关键字分组PjK连接到所述文档所在的文档分组PiD,其中,所述关键字kj表示所述关键字分组PjK中的关键字;若文档di至少与所述关键字分组PjK中的一个关键字相连,则将所述文档di所在的文档分组PiD连接到所述关键字所在的关键字分组PjK,其中,所述文档di表示所述文档分组PiD中的文档;步骤B:按照预设的语义相关判断方法,得到与所述查询关键字kq语义相关的关键字分组;基于所述调整后的边的权重计算各所述关键字分组PjK与文档分组PiD的墨水量;基于所述墨水量,所述语义相关的关键字分组首先对与其具有映射关系的所述文档分组PiD散发墨水,接收墨水的所述文档分组PiD再对与其具有映射关系的所述关键字分组PjK散发墨水,接收墨水的所述关键字分组PjK再对与其具有映射关系的所述文档分组PiD散发墨水,返回所述接收墨水的所述文档分组PiD再对与其具有映射关系的所述关键字分组PjK散发墨水,依次迭代循环;同时,对所述关键字分组PjK和所述文档分组PiD按照墨水量进行综合降序排列,并按照预设处理规则依次处理队列中的所述关键字分组PjK或所述文档分组PiD,直至所述关键字分组PjK或所述文档分组PiD达到预设终止条件则迭代循环及处理结束,得到关键字排列;将获得墨水量高的前n个关键字推荐给用户,其中,n为正整数。进一步地,步骤B中所述的按照预设处理规则依次处理队列中的所述关键字分组PjK或所述文档分组PiD包括:当队列中的所述关键字分组PjK到达队列头的位置时,所述关键字分组PjK中的每个关键字kj收到墨水,若所述关键字kj待散发给与其具有映射关系的文档分组PiD的墨水总量小于预设阈值∈,则所述关键字分组PjK暂停对所述文档分组PiD散发墨水,所述墨水被暂存至关键字分组PjK中,直至所述墨水总量大于所述阈值∈,则所述关键字分组PjK继续对与所述文档分组PiD散发墨水;或,当队列中的所述文档分组PiD到达队列头的位置时,所述文档分组PiD中的每个文档di收到墨水,若所述文档di待散发给与其具有映射关系的关键字分组PjK的墨水总量小于预设阈值∈,则所述文档分组PiD暂停对所述关键字分组PjK散发墨水,所述墨水被暂存至文档分组PiD中,直至所述墨水总量大于所述阈值∈,则所述文档分组PiD继续对所述关键字分组PjK散发墨水。进一步地,所述预设终止条件包括:当所述队列中的队列头位置的所述分组中的墨水量恒定不变且低于阈值时,或所述队列为空时,迭代终止。本专利技术还提供了一种关键字查询推荐系统,所述系统包括:关键字-文档图建立模块,用于基于关键字查询日志建立关键字与文档之间的映射关系,并根据所述映射关系、关键字与文档之间的边的权重绘制关键字-文档图,所述边的权重是基于与关键字具有映射关系的文档的被点击次数进行预设标准化计算得到的;权重调整模块,用于接收用户提交的查询关键字,并基于所述查询关键字的查询位置、所述关键字-文档图中与所述查询关键字相关的文档的空间位置,对所述关键字-文档图中边的权重进行调整得到调整后的边的权重;分组计算模块,用于按照预设的分组规则将所述关键字-文档图中的关键字和文档分别进行分组,基于所述查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组进行计算,得到符合预设条件的关键字,并将所述关键字推荐给所述用户。进一步地,所述权重调整模块具体用于:接收用户提交的查询关键字,所述查询关键字信息包含查询关键字kq和查询位置λq;对所述查询关键字kq到与其具有映射关系的文档dj的边e的权重进行调整,调整公式为:其中,ω(e)表示关键字-文档图中边e的权重初始值,dist(λq,dj.λ)表示所述查询位置λq和所述文档dj的空间位置之间的欧氏距离,β∈本文档来自技高网...
一种基于位置的关键字查询推荐方法及系统

【技术保护点】
一种基于位置的关键字查询推荐方法,其特征在于,所述方法包括下述步骤:步骤1:基于关键字查询日志建立关键字与文档之间的映射关系,并根据所述映射关系、关键字与文档之间的边的权重绘制关键字‑文档图,所述边的权重是基于与关键字具有映射关系的文档的被点击次数进行预设标准化计算得到的;步骤2:接收用户提交的查询关键字,并基于所述查询关键字的查询位置、所述关键字‑文档图中与所述查询关键字相关的文档的空间位置,对所述关键字‑文档图中边的权重进行调整得到调整后的边的权重;步骤3:按照预设的分组规则将所述关键字‑文档图中的关键字和文档分别进行分组,基于所述查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组进行计算,得到符合预设条件的关键字,并将所述关键字推荐给所述用户。

【技术特征摘要】
1.一种基于位置的关键字查询推荐方法,其特征在于,所述方法包括下述步骤:步骤1:基于关键字查询日志建立关键字与文档之间的映射关系,并根据所述映射关系、关键字与文档之间的边的权重绘制关键字-文档图,所述边的权重是基于与关键字具有映射关系的文档的被点击次数进行预设标准化计算得到的;步骤2:接收用户提交的查询关键字,并基于所述查询关键字的查询位置、所述关键字-文档图中与所述查询关键字相关的文档的空间位置,对所述关键字-文档图中边的权重进行调整得到调整后的边的权重;步骤3:按照预设的分组规则将所述关键字-文档图中的关键字和文档分别进行分组,基于所述查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组进行计算,得到符合预设条件的关键字,并将所述关键字推荐给所述用户。2.如权利要求1所述的方法,其特征在于,所述步骤2包括:接收用户提交的查询关键字,所述查询关键字信息包含查询关键字kq和查询位置λq;对所述查询关键字kq到与其具有映射关系的文档dj的边e的权重进行调整,调整公式为:其中,ω(e)表示关键字-文档图中边e的权重初始值,dist(λq,dj.λ)表示所述查询位置λq和所述文档dj的空间位置之间的欧氏距离,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数;对所述文档dj到所述查询关键字kq的边e'的权重进行调整,调整公式为:其中,D(kq)表示所述关键字-文档图中与所述查询关键字kq相连的文档的集合,mindist(λq,D(kq))表示所述查询位置λq与所述D(kq)中最近的文档的空间位置之间的欧氏距离,ω(e')表示关键字-文档图中边e'的权重初始值,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数。3.如权利要求2所述的方法,其特征在于,所述步骤3包括:步骤A:将所述关键字-文档图中的关键字和文档分别按照预设分组规则进行分组,得到关键字分组的集合pk={PjK},及文档分组的集合pD={PiD},其中,PjK表示第j个关键字分组,PiD表示第i个文档分组;建立所述关键字分组PjK与所述文档分组PiD之间的映射关系,所述映射关系按照如下方式建立:若关键字kj至少与所述文档分组PiD中的一个文档相连,则将所述关键字kj所在的关键字分组PjK连接到所述文档所在的文档分组PiD,其中,所述关键字kj表示所述关键字分组PjK中的关键字;若文档di至少与所述关键字分组PjK中的一个关键字相连,则将所述文档di所在的文档分组PiD连接到所述关键字所在的关键字分组PjK,其中,所述文档di表示所述文档分组PiD中的文档;步骤B:按照预设的语义相关判断方法,得到与所述查询关键字kq语义相关的关键字分组;基于所述调整后的边的权重与计算各所述关键字分组PjK与文档分组PiD的墨水量;基于所述墨水量,所述语义相关的关键字分组首先对与其具有映射关系的所述文档分组PiD散发墨水,接收墨水的所述文档分组PiD再对与其具有映射关系的所述关键字分组PjK散发墨水,接收墨水的所述关键字分组PjK再对与其具有映射关系的所述文档分组PiD散发墨水,返回所述接收墨水的所述文档分组PiD再对与其具有映射关系的所述关键字分组PjK散发墨水,依次迭代循环;同时,对所述关键字分组PjK和所述文档分组PiD按照墨水量进行综合降序排列,并按照预设处理规则依次处理队列中的所述关键字分组PjK或所述文档分组PiD,直至所述关键字分组PjK或所述文档分组PiD达到预设终止条件则迭代循环及处理结束,得到关键字排列;将获得墨水量高的前n个关键字推荐给用户,其中,n为正整数。4.如权利要求3所述的方法,其特征在于,所述按照预设处理规则依次处理队列中的所述关键字分组PjK或所述文档分组PiD包括:当队列中的所述关键字分组PjK到达队列头的位置时,所述关键字分组PjK中的每个关键字kj收到墨水,若所述关键字kj待散发给与其具有映射关系的文档分组PiD的墨水总量小于预设阈值∈,则所述关键字分组PjK暂停对所述文档分组PiD散发墨水,所述墨水被暂存至关键字分组PjK中,直至所述墨水总量大于所述阈值∈,则所述关键字分组PjK继续对与所述文档分组PiD散发墨水;或,当队列中的所述文档分组PiD到达队列头的位置时,所述文档分组PiD中的每个文档di收到墨水,若所述文档di待散发给与其具有映射关系的关键字分组PjK的墨水总量小于预设阈值∈,则所述文档分组PiD暂停对所述关键字分组PjK散发墨水,所述墨水被暂存至文档分组PiD中,直至所述墨水总量大于所述阈值∈,则所述文档分组PiD继续对所述关键字分组PjK散发墨水。5.如权利要求3所述的方法,其特征在于,所述预设终止条件包括:当所述队列中的队列头位置的所述分组中的墨水量恒定不变且低于阈值时,或所述队列为空时,迭代终止。6.一种关键字查询推荐系统,...

【专利技术属性】
技术研发人员:吴定明齐书尧尼克斯·孟每恩贾晋
申请(专利权)人:深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1