基于人工智能的口语查询识别方法及装置制造方法及图纸

技术编号：14637028 阅读：68 留言：0更新日期：2017-02-15 11:11

本发明专利技术公开了一种基于人工智能的口语查询识别方法及装置，其中方法包括：根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型；根据口语检索语料标注的与查询领域对应的查询意图和参数信息，对循环神经网络进行训练生成与查询领域对应的检索意图识别模型。本发明专利技术实施例，通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型，能够准确获取用户口语查询的意图及其对应的参数信息，提高了口语查询识别的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能
，尤其涉及一种基于人工智能的口语查询识别方法及装置。
技术介绍
人工智能(ArtificialIntelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。随着人工智能的发展，计算机与人的自然交互已经是人工智能的核心问题。如何让机器准确地获取用户口语查询意图及其对应的参数信息是一个非常重要的技术问题。传统的模板匹配方法是通过人工总结一些案例，找出该类案例的固定模式存入词典，在接收到一个查询的口语时，与已有模板进行匹配，从而分析出查询的意图及其对应的参数信息。然而，口语表达方式复杂多样，模板是有限的，依靠模板匹配并不能完全覆盖所有的表达形式，以及模板匹配方法无法利用跨领域信息，各个领域之间是相互独立的，不能相互迁移。例如，总结好订票相关的查询模板，当需要处理打车的查询时，订票的模板不能完全适用，这时需要人工去总结新的类别上的模板。另外，模板匹配需要人工参与总结，自动化程度不高。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此，本专利技术的第一个目的在于提出一种基于人工智能的口语查询识别方法，该方法通过训练生成高适用性和高自动化的检索领域识别模型和检索意图识别模型，能够准确获取用户口语查询的意图及其对应的参数信息，提高了口语查询识别的效率和准确度。本专...
基于人工智能的口语查询识别方法及装置

【技术保护点】
一种基于人工智能的口语查询识别方法，其特征在于，包括以下步骤：根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型；根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息，对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。

【技术特征摘要】
1.一种基于人工智能的口语查询识别方法，其特征在于，包括以下步骤：根据口语检索语料标注的查询领域对卷积神经网络进行训练生成检索领域识别模型；根据所述口语检索语料标注的与所述查询领域对应的查询意图和参数信息，对循环神经网络进行训练生成与所述查询领域对应的检索意图识别模型。2.如权利要求1所述的方法，其特征在于，还包括：对用户输入的口语检索语句进行分词处理并进行词性标注，并将分词结果以向量形式依序输入所述检索领域识别模型的输入层；通过所述检索领域识别模型的隐层将当前输入的词语与历史输入的词语融合，根据所有词语的融合结果获取所述口语检索语句的实数向量；通过所述检索领域识别模型的输出层对所述实数向量进行概率分析，获取所述口语检测语句的查询领域。3.如权利要求2所述的方法，其特征在于，在所述获取所述口语检测语句的查询领域之后，还包括：将所述分词结果以向量形式依序输入与所述查询领域对应的检索意图识别模型；通过所述检索意图识别模型的隐层将当前输入的词语与历史输入的词语融合，根据所有词语的融合结果获取所述口语检索语句的实数向量；通过所述检索意图识别模型的意图分类输出层对所述实数向量进行概率计算，获取所述口语检测语句的查询意图；通过所述检索意图识别模型的序列化分类输出层对所述实数向量进行概率计算，获取与所述查询意图对应的参数信息。4.如权利要求1-3任一所述的方法，其特征在于，还包括：将所述检索领域识别模型标注的查询领域的置信度低于预设阈值的口语检索语句重新由人工标注，并作为口语检索语料重新训练。5.如权利要求1-3任一所述的方法，其特征在于，还包括：将所述检索意图识别模型标注的查询意图和参数信息的置信度低于预设阈值的口语检索语句重新由人工标注，并作为口语检索语料重新训练。6.一种基于人工智能的口语查询识别装置，其特征在于，包括：第一生成模...

【专利技术属性】
技术研发人员：孙宇，王硕寰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人