基于人工智能的信息搜索方法和装置制造方法及图纸

技术编号:15197164 阅读:148 留言:0更新日期:2017-04-21 04:44
本发明专利技术公开了一种基于人工智能的信息搜索方法和装置,其中,方法包括以下步骤:接收输入的查询问句;基于预先建立的实体与关系词典,将查询问句切分为多个候选片段;从多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,组合路径的长度为多个互不交叠的片段数;合并组合路径中的多个互不交叠的片段,直至组合路径的长度等于1;将组合路径的长度等于1时的片段作为搜索结果。该方法能够处理复杂的问句,并且不需要人工标注数据,人工成本低。

Information searching method and device based on Artificial Intelligence

The invention discloses an information search method and device based on artificial intelligence. The method comprises the following steps: receiving the query input; pre established entities and relations based on the dictionary, the query is divided into a plurality of candidate fragments; select multiple nonoverlapping fragments from multiple candidate fragments of the orderly combination, generate a combined path, the path length for the number of pieces of combination of multiple non overlapping; multiple nonoverlapping fragments with combination of the path, until the combination path length is equal to 1; the combination of path length is equal to 1 of the fragments as search results. The proposed method is able to deal with complex questions, and does not require manual annotation.

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种基于人工智能的信息搜索方法和装置
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,自然语言处理是人工智能的重要研究方面。随着搜索技术的不断发展,人们利用搜索技术,通过输入自然语言问句便可查询到问句的答案。目前,可通过字符串匹配来搜索答案。或者,训练人工标注的数据得到语义解析器,通过语义解析器对输入的问句进行深层解析后,获取搜索答案。但是,目前字符串匹配的准确性较差,当查询问句存在歧义时准确性更差,从而影响搜索答案的准确性。另外,虽然也可利用语义解析器来搜索答案,但语义解析器的训练比较复杂,并且需要大量的人工标注数据,以及人工设定词典,人工成本高。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人工智能的信息搜索方法,该方法能够处理复杂的问句,并且不需要人工标注数据,人工成本低。本专利技术的第二个目的在于提出一种基于人工智能的信息搜索装置。为了实现上述目的,本专利技术第一方面实施例提出了一种基于人工智能的信息搜索方法,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将查询问句切分为多个候选片段;从多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,组合路径的长度为多个互不交叠的片段数;合并组合路径中的多个互不交叠的片段,直至组合路径的长度等于1;将组合路径的长度等于1时的片段作为搜索结果。本专利技术实施例的基于人工智能的信息搜索方法,通过将查询语句切分为多个候选片段,从候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,合并组合路径中的片段,直至组合路径的长度为1,将组合路径的长度为1时的片段作为搜索结果。该方法能够处理复杂的问句,并且不需要人工标注数据,人工成本低。为达上述目的,本专利技术第二方面实施例提出了一种基于人工智能的信息搜索装置,包括:接收模块,用于接收输入的查询问句;切分模块,用于基于预先建立的实体与关系词典,将查询问句切分为多个候选片段;生成模块,用于从多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,组合路径的长度为多个互不交叠的片段数;合并模块,用于合并组合路径中的多个互不交叠的片段,直至组合路径的长度等于1;获得模块,用于将组合路径的长度等于1时的片段作为搜索结果。本专利技术实施例的基于人工智能的信息搜索装置,通过将查询语句切分为多个候选片段,从候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,合并组合路径中的片段,直至组合路径的长度为1,将组合路径的长度为1时的片段作为搜索结果。该方法能够处理复杂的问句,并且不需要人工标注数据,人工成本低。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1是根据本专利技术一个实施例的基于人工智能的信息搜索方法的流程图;图2是根据本专利技术一个具体实施例的基于人工智能的信息搜索方法的流程图;图3是根据本专利技术一个实施例的查询问句有多个搜索结果的效果示意图;图4是根据本专利技术一个实施例的基于人工智能的信息搜索装置的结构示意图;图5是根据本专利技术一个具体实施例的基于人工智能的信息搜索装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于人工智能的信息搜索方法和装置。图1是根据本专利技术一个实施例的基于人工智能的信息搜索方法的流程图。如图1所示,该基于人工智能的信息搜索方法包括:S101,接收输入的查询问句。具体地,用户可通过搜索引擎提供的文字输入框或者语音输入接口,通过文字输入或者语音输入的方式输入查询问句。例如,用户想查询姚明的身高,可打开手机中的搜索引擎,按住语音输入键,说话:“姚明的身高是多少”,从而语音输入查询问句。S102,基于预先建立的实体与关系词典,将查询问句切分为多个候选片段。具体地,在接收到输入的查询问句后,根据建立的实体与关系词典,将查询问句切分为多个候选片段。其中,可预先通过抓取各个网页的内容建立实体与关系词典。例如,用户输入查询问句“2046的服装设计师有什么代表作”,根据建立的实体与关系词典将该查询问句切分为多个候选片段,即{20[0,1],204[0,2],2046[0,3],04[1,2],046[1,3],46[2,3],6[3,3],的服装设计师[4,9],服装[5,6],服装设计[5,8],服装设计师[5,9],服装设计师有[5,10],设计[7,8],设计师[7,9],什么[11,12],代表[13,14],代表作[13,15]本文档来自技高网...
基于人工智能的信息搜索方法和装置

【技术保护点】
一种基于人工智能的信息搜索方法,其特征在于,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将所述查询问句切分为多个候选片段;从所述多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,所述组合路径的长度为多个互不交叠的片段数;合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1;将所述组合路径的长度等于1时的片段作为搜索结果。

【技术特征摘要】
1.一种基于人工智能的信息搜索方法,其特征在于,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将所述查询问句切分为多个候选片段;从所述多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,所述组合路径的长度为多个互不交叠的片段数;合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1;将所述组合路径的长度等于1时的片段作为搜索结果。2.如权利要求1所述的方法,其特征在于,合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1,包括:获取所述组合路径中的多个互不交叠的片段所对应的候选资源;基于实体知识库对所述组合路径中前两个片段的候选资源进行三元组查询,并获取答案片段,以实现所述组合路径中前两个片段的合并;重复上一步骤,直至所述组合路径的长度等于1。3.如权利要求1所述的方法,其特征在于,还包括:当所述搜索结果为多个时,计算每个搜索结果对应的组合路径的得分;选取得分最高的组合路径对应的搜索结果,作为搜索答案。4.如权利要求1所述的方法,其特征在于,计算每个搜索结果对应的组合路径的得分,包括:提取组合路径的特征,将所述特征输入至最大可能组合模型,并输出所述组合路径的得分,其中,所述最大可能组合模型具有预设参数。5.如权利要求4所述的方法,其特征在于,所述特征包括组合特征、等同特征以及全局特征中的一个或多个。6.如权利要求4所述的方法,其特征在于,所述预设参数通过隐变量结构感知机训练获得。7.如权利要求6所述的方法,其特征在于,通过隐变量结构感知机训练所述预设参数,包括:获取问题答案样本;将所述问题答案样本输入至具有初始参数的最大可能组合模型;获取得分最高的组合路径及其对应的答案的得分;如果得分最高的组合路径对应的答案为正确答案,则保持初始参数不变,并进行下一轮训练;如果得分最高的组合路径对应的答案不为正确答案,则获取得到正确答案的得分最高的组合路径,并对所述初始参数进行更新;重复训练步骤,直至训练完所有问题答案样本。8.一种基于人工智能的信息搜索装置,其特征在于,包括:接收模块...

【专利技术属性】
技术研发人员:张元哲
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1