基于语义树的索引方法和系统技术方案

技术编号:13514064 阅读:84 留言:0更新日期:2016-08-11 21:45
本发明专利技术主要涉及全文搜索领域,公开了一种构建语义树,并提供基于语义树的索引方法和系统。按语句中的文字的顺序对语句进行增量散列编码处理,形成特定的语义信息编码,存储前置语义特征信息,文字和语义特征,构建语义树;通过语义树,语义树和文档关联表,和文档的存储,建立基于语义的索引基础,提供基于语义树的全文搜索引擎。本发明专利技术的优点是不再依赖于分词服务,存储空间小,查询速度快等特点,适合文字信息的全文索引,和基于语义树的语义理解和处理。

【技术实现步骤摘要】
201610238991

【技术保护点】
基于语义树的索引方法和系统,主要特征包括:构建语义特征信息序列;语义树的建立;语义特征信息和文档关系的建立;基于语义树的全文搜索引擎和语义理解系统。

【技术特征摘要】
1.基于语义树的索引方法和系统,主要特征包括:构建语义特征信息序列;语义树的建立;语义特征信息和文档关系的建立;基于语义树的全文搜索引擎和语义理解系统。2.按权利1构建语义特征信息序列,其特征在于:根据文件的编码格式确定文字的最小单元,按语句中的文字的顺序对语句进行增量散列编码处理,形成特定的语义特征信息编码。3.按权利1语义树的建立,其特征如下:按权利2组建语义特征信息序列,通过语义特征信息和前语义特征信息构成语义链,按以下方式存储语义树。语义树存储的基本格式:语义特征信息,基本文字单元,前语义特征信息,该文字单元在句中的位置标识(句首、句中和句尾)。4.建立特征信息序列和文档关系表,其特征在于:按权利2形成含有句尾标识的语义特征信息...

【专利技术属性】
技术研发人员:张留学朱小姣
申请(专利权)人:上海泥娃通信科技有限公司张留学朱小姣
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1