基于深度问答的提问型搜索词搜索方法及装置制造方法及图纸

技术编号:15253989 阅读:81 留言:0更新日期:2017-05-02 19:49
本发明专利技术提出一种基于深度问答的提问型搜索词的搜索方法和装置,其中,方法包括:通过对提问型搜索词进行扩展,得到语义相关的扩展搜索词之后,根据扩展搜索词进行搜索,得到与该扩展搜索词匹配的页面,进而通过对页面的各段落进行特征分析,得到各段落的分值之后,根据分值从各段落中选择出作为搜索结果的目标段落。由于对提问型搜索词进行了扩展,从而扩大了搜索到的页面范围,解决了搜索结果覆盖不够全面,搜索效率较差的技术问题。

Method and device for searching question type search words based on depth question answering

The present invention includes a search method and apparatus, word question type deep question answering based on the method of question type: through expanding the search term, after obtaining the related semantics of the extended search words, according to the search terms to search, and the extended search word matching page, and then through the passage the page feature after each paragraph of the score, according to the score is selected as the search results from the target paragraph paragraph. Due to the expansion of the search term, the scope of the search page is enlarged, and the technical problem that the search result is not comprehensive enough and the search efficiency is poor is solved.

【技术实现步骤摘要】

本专利技术涉及信息搜索
,尤其涉及一种基于深度问答的提问型搜索词搜索方法及装置。
技术介绍
深度问答(Deepquestionandanswer),是指理解人类的语言,智能识别问题的含义,并从海量的互联网数据中针对问题提取答案的技术。在现有技术的信息搜索过程中,用户可以自行设置搜索词,从而搜索引擎根据搜索词进行搜索,将搜索结果返回给用户。在搜索引擎运行的过程中,专利技术人发现:用户在一些情况下会提出一个问题作为搜索词,也就是说搜索词为提问型搜索词,在这种情况下,如果采用现有技术中的信息搜索技术,搜索引擎将用户所提出的问题作为搜索词,进行分词处理,进而将包含各个分词的页面作为搜索结果。在一些情况下,页面是搜索词的答案,但并未出现搜索词,从而无法作为搜索结果呈现给用户。例如:当搜索词为“当归的功效与作用”,搜索结果中不含“当归补血,性温,润肠”的页面,因此,现有技术中,针对提问型搜索词进行搜索时,搜索结果覆盖不够全面,搜索效率较差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于深度问答的提问型搜索词的搜索方法,以解决现有技术中在采用提问型搜索词进行搜索时,搜索效率较差的技术问题。本专利技术的第二个目的在于提出一种提问型搜索词的搜索装置。本专利技术的第三个目的在于提出另一种提问型搜索词的搜索装置。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种提问型搜索词的搜索方法,包括:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。本专利技术实施例的基于深度问答的提问型搜索词的搜索方法,通过对提问型搜索词进行扩展,得到语义相关的扩展搜索词之后,根据扩展搜索词进行搜索,得到与该扩展搜索词匹配的页面,进而通过对页面的各段落进行特征分析,得到各段落的分值之后,根据分值从各段落中选择出作为搜索结果的目标段落。由于对提问型搜索词进行了扩展,从而扩大了搜索到的页面范围,解决了搜索结果覆盖不够全面,搜索效率较差的技术问题。为达上述目的,本专利技术第二方面实施例提出了一种基于深度问答的提问型搜索词的搜索装置,包括:扩展模块,用于对提问型搜索词进行扩展,得到语义相关的扩展搜索词;搜索模块,用于根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;分析模块,用于对所述页面的各段落进行特征分析,得到各段落的分值;选择模块,用于根据所述分值从各段落中选择出作为搜索结果的目标段落。本专利技术实施例的基于深度问答的提问型搜索词的搜索装置,通过对提问型搜索词进行扩展,得到语义相关的扩展搜索词之后,根据扩展搜索词进行搜索,得到与该扩展搜索词匹配的页面,进而通过对页面的各段落进行特征分析,得到各段落的分值之后,根据分值从各段落中选择出作为搜索结果的目标段落。由于对提问型搜索词进行了扩展,从而扩大了搜索到的页面范围,解决了搜索结果覆盖不够全面,搜索效率较差的技术问题。为达上述目的,本专利技术第三方面实施例提出了另一种基于深度问答的提问型搜索词的搜索装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器被执行时,使得服务器能够执行一种基于深度问答的提问型搜索词的搜索方法,所述方法包括:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于深度问答的提问型搜索词的搜索方法,所述方法包括:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例所提供的一种基于深度问答的提问型搜索词的搜索方法的流程示意图;图2为本专利技术实施例所提供的另一种提问型搜索词的搜索方法的流程示意图;图3为本专利技术实施例所提供的又一种提问型搜索词的搜索方法的流程示意图;图4为搜索结果的对比示意图;图5为本专利技术实施例提供的一种基于深度问答的提问型搜索词的搜索装置的结构示意图;图6为本专利技术实施例提供的一种扩展模块51的结构示意图;图7为本专利技术实施例提供的另一种扩展模块51的结构示意图;以及图8为本专利技术实施例提供的又一种提问型搜索词的搜索装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于深度问答的提问型搜索词的搜索方法和装置。图1为本专利技术实施例所提供的一种基于深度问答的提问型搜索词的搜索方法的流程示意图。本专利技术实施例提供的搜索方法可以应用于具有搜索功能的搜索引擎上。如图1所示,该提问型搜索词的搜索方法包括:步骤101,对提问型搜索词进行扩展,得到语义相关的扩展搜索词。其中,提问型搜索词是指用于提出问题以搜索到该问题的答案的搜索词。具体地,基于语义对提问型搜索词进行扩展,从而得到与提问型搜索词语义相关的扩展搜索词。本实施例中对于扩展的步骤,提供了两种可能的实现方式:作为一种可能的实现方式,查询历史记录,确定同一个用户在采用同一个搜索词进行搜索时,所选择查看的至少两个页面;所述至少两个页面中的目标页面的标题包含所述提问型搜索词。进而在至少两个页面中,将除目标页面以外的页面的标题,确定为提问型搜索词的扩展搜索词。作为另一种可能的实现方式,提取提问型搜索词的主题词,在历史记录中查询包含该主题词的历史搜索词,将所查询到的历史搜索词作为提问型搜索词的扩展搜索词。步骤102,根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面。具体地,可以将扩展搜索词与网络中的各个页面进行匹配,这里的匹配可以采用字面匹配的方式,得到与扩展搜索词匹配的页面。步骤103,对页面的各段落进行特征分析,得到各段落的分值。具体地,针对上一步骤中匹配得到的每一个页面进行分段处理,得到语义上相互本文档来自技高网...

【技术保护点】
一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。

【技术特征摘要】
1.一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。2.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述对提问型搜索词进行扩展,得到语义相关的扩展搜索词,包括:查询历史记录,确定同一个用户在采用同一个搜索词进行搜索时,所选择查看的至少两个页面;所述至少两个页面中的目标页面的标题包含所述提问型搜索词;在所述至少两个页面中,将除所述目标页面以外的页面的标题,确定为所述提问型搜索词的扩展搜索词。3.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述对提问型搜索词进行扩展,得到语义相关的扩展搜索词,包括:提取所述提问型搜索词的主题词;在历史记录中查询包含所述主题词的历史搜索词;将所查询到的历史搜索词作为所述提问型搜索词的扩展搜索词。4.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述对所述页面的各段落进行特征分析,得到各段落的分值,包括:对所述页面进行分段处理,得到语义上相互独立的各段落;根据所提取的各段落的特征,进行特征分析,得到各段落的分值。5.根据权利要求4所述的提问型搜索词的搜索方法,其特征在于,所述根据所提取的各段落的特征,进行特征分析,得到各段落的分值,包括:针对每一个段落,对所述段落进行特征提取,得到各特征的特征分值;所述特征包括:数字特征、实体特征、对齐特征、聚合特征和列表特征中的一个或多个组合;根据各特征的特征分值,利用预先进行特征权重训练的机器学习模型进行打分,得到所述段落的分值。6.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述根据所述分值从各段落中选择出作为搜索结果的目标段落,包括:从各段落中,选择分值超过预设阈值的目标段落。7.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述根据所述分值从各段落中选择出作为搜索结果的目标段落之后,还包括:建立包含所述目标段落的所述提问型搜索词的页面库;所述页面库,用于用户利用所述提问型搜索词进行搜索时,从所述页面库中选择...

【专利技术属性】
技术研发人员:孙兴武
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1