一种用于信息检索的查询语句分析方法与系统技术方案

技术编号：3894497 阅读：307 留言：0更新日期：2012-04-11 18:40

一种用于信息检索的查询语句分析方法，其步骤为：　１）对输入的中文查询语句进行自动分词、命名实体识别和词性标注；　２）对分词后的句子进行句法结构分析，得到句法结构树；对词性标注后的句子采用知网的义原表示体系来确定每个词的词义；　　３）根据句子的句法结构和每个词的词义，对句子中目标动词进行语义角色标注；　４）根据识别的命名实体、目标动词的语义角色标注结果分别进行关键词扩展，得到扩展后的关键词。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息检索
，具体涉及一种基于自然语言理解的查询语句分析方法与系统。
技术介绍
随着互联网在全球范围内的迅速发展与成熟，网络上的信息资源不断丰富，信息数据量也在飞速膨胀。在当今社会中，通过搜索引擎上网査信息己成为现代人的主要信息获取方式。于是，为用户提供更加便捷而有效的査询服务，便成为搜索引擎技术在当今和未来的发展方向。目前大多数搜索引擎所接受的査询方式仍是关键词查询。这种査询方式要求用户将个人的查询意图概括为几个最有效的词汇，这不仅增加了用户的负担，而且会带来一定的査询歧义。例如，现如今当用户在某一搜索引擎中输入关键词"苹果"，返回的检索结果中排在前几位的条目很可能都是关于苹果电脑的信息。如果用户想购买苹果笔记本，那么检索结果会符合他的期望。然而，如果用户想了解"苹果的营养价值"，那么这些结果则明显地"答非所问"了。未来更具智能化的搜索引擎应支持用户以自然语言方式进行语句査询。这种像日常对话一样的查询方式不仅能使用户感到方便自然，而且还能够根据上下文语境判断用户的査询意图，克服査询歧义问题。基于当前的自然语言处理技术，可以通过对用户输入的査询语句进行自动分析，在理解用户信息需求的基础上，确定出合适的无歧义的关键词检索项。近年来，自然语言处理的研究取得了很多突破性的进展。词法、句法和语义分析技术的进步使得自然语言处理技术在机器翻译、信息检索等领域得到了广泛的应用。目前已经有一些基于自然语言理解的查询分析系统(参考申请号200810046936、申请日2008-02-26、申请人华中科技大学、专利技术名称基于...

【技术保护点】
一种用于信息检索的查询语句分析方法，其步骤为：　１）对输入的中文查询语句进行自动分词、命名实体识别和词性标注；　２）对分词后的句子进行句法结构分析，得到句法结构树；对词性标注后的句子采用知网的义原表示体系来确定每个词的词义；　　３）根据句子的句法结构和每个词的词义，对句子中目标动词进行语义角色标注；　４）根据识别的命名实体、目标动词的语义角色标注结果分别进行关键词扩展，得到扩展后的关键词。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：吴玺宏，迟惠生，罗定生，林小俊，张猛，
申请(专利权)人：北京大学，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人