本发明专利技术公开了一种基于人工智能的口语查询识别方法及装置,其中方法包括:根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型;根据口语检索语料标注的与查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与查询领域对应的检索意图识别模型。本发明专利技术实施例,通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型,能够准确获取用户口语查询的意图及其对应的参数信息,提高了口语查询识别的效率和准确度。
【技术实现步骤摘要】
本专利技术涉及人工智能
,尤其涉及一种基于人工智能的口语查询识别方法及装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。随着人工智能的发展,计算机与人的自然交互已经是人工智能的核心问题。如何让机器准确地获取用户口语查询意图及其对应的参数信息是一个非常重要的技术问题。传统的模板匹配方法是通过人工总结一些案例,找出该类案例的固定模式存入词典,在接收到一个查询的口语时,与已有模板进行匹配,从而分析出查询的意图及其对应的参数信息。然而,口语表达方式复杂多样,模板是有限的,依靠模板匹配并不能完全覆盖所有的表达形式,以及模板匹配方法无法利用跨领域信息,各个领域之间是相互独立的,不能相互迁移。例如,总结好订票相关的查询模板,当需要处理打车的查询时,订票的模板不能完全适用,这时需要人工去总结新的类别上的模板。另外,模板匹配需要人工参与总结,自动化程度不高。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人工智能的口语查询识别方法,该方法通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型,能够准确获取用户口语查询的意图及其对应的参数信息,提高了口语查询识别的效率和准确度。本专利技术的第二个目的在于提出了一种基于人工智能的口语查询识别装置。为达上述目的,根据本专利技术第一方面实施例提出的一种基于人工智能的口语查询识别方法,包括以下步骤:根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型;根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。本专利技术实施例的基于人工智能的口语查询识别方法,首先根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型,接着根据口语检索语料标注的与查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与查询领域对应的检索意图识别模型。由此,通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型,能够准确获取用户口语查询的意图及其对应的参数信息,提高了口语查询识别的效率和准确度。为达上述目的,根据本专利技术的第二方面实施例提出的一种基于人工智能的口语查询识别装置,包括:第一生成模块,用于根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型;第二生成模块,用于根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。本专利技术实施例的基于人工智能的口语查询识别装置,首先根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型,接着根据口语检索语料标注的与查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与查询领域对应的检索意图识别模型。由此,通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型,能够准确获取用户口语查询的意图及其对应的参数信息,提高了口语查询识别的效率和准确度。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术一个实施例的基于人工智能的口语查询识别方法的流程图;图2是根据本专利技术另一个实施例的基于人工智能的口语查询识别方法的流程图;图3是根据本专利技术一个实施例的检索领域识别模型的结构示意图;图4是根据本专利技术又一个实施例的基于人工智能的口语查询识别方法的流程图;图5是根据本专利技术一个实施例的检索意图识别模型的结构示意图;图6是根据本专利技术再一个实施例的基于人工智能的口语查询识别方法的流程图;图7是根据本专利技术一个实施例的基于人工智能的口语查询识别装置的结构示意图;图8是根据本专利技术另一个实施例的基于人工智能的口语查询识别装置的结构示意图;图9是根据本专利技术再一个实施例的基于人工智能的口语查询识别装置的结构示意图;以及图10是根据本专利技术又一个实施例的基于人工智能的口语查询识别装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于人工智能的口语查询识别方法及装置。图1是根据本专利技术一个实施例的基于人工智能的口语查询识别方法的流程图。如图1所示,本专利技术实施例的基于人工智能的口语查询识别方法包括以下步骤:步骤101,根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型。通常,在人机对话的查询过程中,为了符合人类的自然表达以口语形式出现,但是口语表达具有多样性和复杂性。举例说明如下:查询=“帮我订张从北京到天津的火车票”,查询=“我想坐火车从北京到天津”,这两个查询都表达了用户想“订火车票”,起始地是“北京”,目的地是“天津”。如何让计算机准确理解这类口语的查询意图以及该意图所需要的参数信息是人机对话中需要解决的问题。因此,本专利技术实施例提出一种基于人工智能的口语查询识别方法,能够准确获取用户口语查询的意图及其对应的参数信息,提高了口语查询识别的效率和准确度。首先,根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型,生成的检索领域识别模型能够确定输入的口语查询属于哪个领域。需要说明的是,卷积神经网络本质上是一种输入到输出的映射,能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式。进而,只要根据口语检索语料标注的查询领域对卷积神经网络进行训练,生成的检索领域识别模型具有输入输出对之间的映射能力。其中,口语检索语料有很多种,可以通过预设规则对口语检索语料进行处理得到标注检索领域的口语检索语料作为训练样本,从而可自动地获取样本数据,当然也可通过例如人工标注检索领域的方式获取训练样本,标注完毕的多个口语检索语料存入训练样本集合。为了本领域人员更加清楚如何生成检索领域识别模型,输入已标注查询领域的口语检索语料,训练卷积神经网络,具体得训练过程如下:第一步,向前传播阶段,从训练样本集合中取一个样本,将样本输入卷积神经网络计算相应的实际输出,在此阶段,信息从输入层经过逐级的变换,传送到输出层;第二步,向后传播阶段,计算实际输出与样本对应的理想输出的差,按极小化误差的方法,反向传播调整权矩阵;第三步,重复第一步和第二步的操作,直到卷积神经网络分类层Softmax之后的输出的目标函数J(θ)≤0.0001为止,得到检索领域识别模型。其中,J(θ)表示目标函数,m表示样本数量,θ表示训练参数,x表示隐层向量。进一步地,本文档来自技高网...
【技术保护点】
一种基于人工智能的口语查询识别方法,其特征在于,包括以下步骤:根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型;根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。
【技术特征摘要】
1.一种基于人工智能的口语查询识别方法,其特征在于,包括以下步骤:根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型;根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息,对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。2.如权利要求1所述的方法,其特征在于,还包括:对用户输入的口语检索语句进行分词处理并进行词性标注,并将分词结果以向量形式依序输入所述检索领域识别模型的输入层;通过所述检索领域识别模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取所述口语检索语句的实数向量;通过所述检索领域识别模型的输出层对所述实数向量进行概率分析,获取所述口语检测语句的查询领域。3.如权利要求2所述的方法,其特征在于,在所述获取所述口语检测语句的查询领域之后,还包括:将所述分词结果以向量形式依序输入与所述查询领域对应的检索意图识别模型;通过所述检索意图识别模型的隐层将当前输入的词语与历史输入的词语融合,根据所有词语的融合结果获取所述口语检索语句的实数向量;通过所述检索意图识别模型的意图分类输出层对所述实数向量进行概率计算,获取所述口语检测语句的查询意图;通过所述检索意图识别模型的序列化分类输出层对所述实数向量进行概率计算,获取与所述查询意图对应的参数信息。4.如权利要求1-3任一所述的方法,其特征在于,还包括:将所述检索领域识别模型标注的查询领域的置信度低于预设阈值的口语检索语句重新由人工标注,并作为口语检索语料重新训练。5.如权利要求1-3任一所述的方法,其特征在于,还包括:将所述检索意图识别模型标注的查询意图和参数信息的置信度低于预设阈值的口语检索语句重新由人工标注,并作为口语检索语料重新训练。6.一种基于人工智能的口语查询识别装置,其特征在于,包括:第一生成模...
【专利技术属性】
技术研发人员:孙宇,王硕寰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。