The invention discloses an information search method and device based on artificial intelligence. The method comprises the following steps: receiving the query input; pre established entities and relations based on the dictionary, the query is divided into a plurality of candidate fragments; select multiple nonoverlapping fragments from multiple candidate fragments of the orderly combination, generate a combined path, the path length for the number of pieces of combination of multiple non overlapping; multiple nonoverlapping fragments with combination of the path, until the combination path length is equal to 1; the combination of path length is equal to 1 of the fragments as search results. The proposed method is able to deal with complex questions, and does not require manual annotation.
【技术实现步骤摘要】
本专利技术涉及互联网
,尤其涉及一种基于人工智能的信息搜索方法和装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,自然语言处理是人工智能的重要研究方面。随着搜索技术的不断发展,人们利用搜索技术,通过输入自然语言问句便可查询到问句的答案。目前,可通过字符串匹配来搜索答案。或者,训练人工标注的数据得到语义解析器,通过语义解析器对输入的问句进行深层解析后,获取搜索答案。但是,目前字符串匹配的准确性较差,当查询问句存在歧义时准确性更差,从而影响搜索答案的准确性。另外,虽然也可利用语义解析器来搜索答案,但语义解析器的训练比较复杂,并且需要大量的人工标注数据,以及人工设定词典,人工成本高。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人工智能的信息搜索方法,该方法能够处理复杂的问句,并且不需要人工标注数据,人工成本低。本专利技术的第二个目的在于提出一种基于人工智能的信息搜索装置。为了实现上述目的,本专利技术第一方面实施例提出了一种基于人工智能的信息搜索方法,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将查询问句切分为多个候选片段;从多个候选片段中选取多个互不交叠的片 ...
【技术保护点】
一种基于人工智能的信息搜索方法,其特征在于,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将所述查询问句切分为多个候选片段;从所述多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,所述组合路径的长度为多个互不交叠的片段数;合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1;将所述组合路径的长度等于1时的片段作为搜索结果。
【技术特征摘要】
1.一种基于人工智能的信息搜索方法,其特征在于,包括:接收输入的查询问句;基于预先建立的实体与关系词典,将所述查询问句切分为多个候选片段;从所述多个候选片段中选取多个互不交叠的片段进行有序组合,生成组合路径,所述组合路径的长度为多个互不交叠的片段数;合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1;将所述组合路径的长度等于1时的片段作为搜索结果。2.如权利要求1所述的方法,其特征在于,合并所述组合路径中的多个互不交叠的片段,直至所述组合路径的长度等于1,包括:获取所述组合路径中的多个互不交叠的片段所对应的候选资源;基于实体知识库对所述组合路径中前两个片段的候选资源进行三元组查询,并获取答案片段,以实现所述组合路径中前两个片段的合并;重复上一步骤,直至所述组合路径的长度等于1。3.如权利要求1所述的方法,其特征在于,还包括:当所述搜索结果为多个时,计算每个搜索结果对应的组合路径的得分;选取得分最高的组合路径对应的搜索结果,作为搜索答案。4.如权利要求1所述的方法,其特征在于,计算每个搜索结果对应的组合路径的得分,包括:提取组合路径的特征,将所述特征输入至最大可能组合模型,并输出所述组合路径的得分,其中,所述最大可能组合模型具有预设参数。5.如权利要求4所述的方法,其特征在于,所述特征包括组合特征、等同特征以及全局特征中的一个或多个。6.如权利要求4所述的方法,其特征在于,所述预设参数通过隐变量结构感知机训练获得。7.如权利要求6所述的方法,其特征在于,通过隐变量结构感知机训练所述预设参数,包括:获取问题答案样本;将所述问题答案样本输入至具有初始参数的最大可能组合模型;获取得分最高的组合路径及其对应的答案的得分;如果得分最高的组合路径对应的答案为正确答案,则保持初始参数不变,并进行下一轮训练;如果得分最高的组合路径对应的答案不为正确答案,则获取得到正确答案的得分最高的组合路径,并对所述初始参数进行更新;重复训练步骤,直至训练完所有问题答案样本。8.一种基于人工智能的信息搜索装置,其特征在于,包括:接收模块...
【专利技术属性】
技术研发人员:张元哲,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。