The present invention includes a search method and apparatus, word question type deep question answering based on the method of question type: through expanding the search term, after obtaining the related semantics of the extended search words, according to the search terms to search, and the extended search word matching page, and then through the passage the page feature after each paragraph of the score, according to the score is selected as the search results from the target paragraph paragraph. Due to the expansion of the search term, the scope of the search page is enlarged, and the technical problem that the search result is not comprehensive enough and the search efficiency is poor is solved.
【技术实现步骤摘要】
本专利技术涉及信息搜索
,尤其涉及一种基于深度问答的提问型搜索词搜索方法及装置。
技术介绍
深度问答(Deepquestionandanswer),是指理解人类的语言,智能识别问题的含义,并从海量的互联网数据中针对问题提取答案的技术。在现有技术的信息搜索过程中,用户可以自行设置搜索词,从而搜索引擎根据搜索词进行搜索,将搜索结果返回给用户。在搜索引擎运行的过程中,专利技术人发现:用户在一些情况下会提出一个问题作为搜索词,也就是说搜索词为提问型搜索词,在这种情况下,如果采用现有技术中的信息搜索技术,搜索引擎将用户所提出的问题作为搜索词,进行分词处理,进而将包含各个分词的页面作为搜索结果。在一些情况下,页面是搜索词的答案,但并未出现搜索词,从而无法作为搜索结果呈现给用户。例如:当搜索词为“当归的功效与作用”,搜索结果中不含“当归补血,性温,润肠”的页面,因此,现有技术中,针对提问型搜索词进行搜索时,搜索结果覆盖不够全面,搜索效率较差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于深度问答的提问型搜索词的搜索方法,以解决现有技术中在采用提问型搜索词进行搜索时,搜索效率较差的技术问题。本专利技术的第二个目的在于提出一种提问型搜索词的搜索装置。本专利技术的第三个目的在于提出另一种提问型搜索词的搜索装置。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种提问型搜索词的搜索方法,包括:对 ...
【技术保护点】
一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。
【技术特征摘要】
1.一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:对提问型搜索词进行扩展,得到语义相关的扩展搜索词;根据所述扩展搜索词进行搜索,得到与所述扩展搜索词匹配的页面;对所述页面的各段落进行特征分析,得到各段落的分值;根据所述分值从各段落中选择出作为搜索结果的目标段落。2.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述对提问型搜索词进行扩展,得到语义相关的扩展搜索词,包括:查询历史记录,确定同一个用户在采用同一个搜索词进行搜索时,所选择查看的至少两个页面;所述至少两个页面中的目标页面的标题包含所述提问型搜索词;在所述至少两个页面中,将除所述目标页面以外的页面的标题,确定为所述提问型搜索词的扩展搜索词。3.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述对提问型搜索词进行扩展,得到语义相关的扩展搜索词,包括:提取所述提问型搜索词的主题词;在历史记录中查询包含所述主题词的历史搜索词;将所查询到的历史搜索词作为所述提问型搜索词的扩展搜索词。4.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述对所述页面的各段落进行特征分析,得到各段落的分值,包括:对所述页面进行分段处理,得到语义上相互独立的各段落;根据所提取的各段落的特征,进行特征分析,得到各段落的分值。5.根据权利要求4所述的提问型搜索词的搜索方法,其特征在于,所述根据所提取的各段落的特征,进行特征分析,得到各段落的分值,包括:针对每一个段落,对所述段落进行特征提取,得到各特征的特征分值;所述特征包括:数字特征、实体特征、对齐特征、聚合特征和列表特征中的一个或多个组合;根据各特征的特征分值,利用预先进行特征权重训练的机器学习模型进行打分,得到所述段落的分值。6.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述根据所述分值从各段落中选择出作为搜索结果的目标段落,包括:从各段落中,选择分值超过预设阈值的目标段落。7.根据权利要求1-3任一项所述的提问型搜索词的搜索方法,其特征在于,所述根据所述分值从各段落中选择出作为搜索结果的目标段落之后,还包括:建立包含所述目标段落的所述提问型搜索词的页面库;所述页面库,用于用户利用所述提问型搜索词进行搜索时,从所述页面库中选择...
【专利技术属性】
技术研发人员:孙兴武,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。