本发明专利技术公开了一种基于空间实体融合的智能搜索方法,包括以下实施步骤:步骤1)、获取数据信息存储至分布式数据库中,并构建词库;步骤2)、用户在客户端输入搜索语句,做分词处理;步骤3)、调用实体识别模型,将输入的搜索字段实现实体识别;步骤4)、判断是否引入空间分析:步骤5)、若引入空间分析,通过空间分析获取结果集;若不需引入空间分析,进行ES搜索流程,直至成功获得结果集。本发明专利技术是一种融合全文搜索、实体识别、空间搜索的智能化空间搜索方法,实现空间实体融合智能搜索功能,能显著提高搜索精度和搜索效率,并针对已有的海量搜索数据,挖掘出用户潜在关注信息,为用户提供更加友好、精度高的智能搜索服务。精度高的智能搜索服务。精度高的智能搜索服务。
【技术实现步骤摘要】
一种基于空间实体融合的智能搜索方法
[0001]本专利技术涉及一种搜索方法,尤其涉及一种基于空间实体融合的智能搜索方法。
技术介绍
[0002]随着计算机技术和地理信息系统技术的快速发展,智能搜索成为用户获取信息的重要工具。用户在进行目标搜索时,不易表达需求,先在搜索引擎输入待搜索内容,搜索引擎根据输入内容提取关键词进行相关信息的搜索,将搜索结果展示在客户端,用户需要在客户端多次搜索,多次交互,逐条筛选所需的信息,才能逐步达到请求目标。这种根据关键词进行目标搜索的方法,获取的结果往往是零散化、碎片化、低效率、精确度低,并且缺少关联性,还可能具有歧义性,最终搜索结果还需人为地甄别有用信息。基于此,亟需提供一种基于空间实体融合的智能搜索方法,以解决现有技术的不足。
技术实现思路
[0003]为了解决上述技术所存在的不足之处,本专利技术提供了一种基于空间实体融合的智能搜索方法。
[0004]为了解决以上技术问题,本专利技术采用的技术方案是:一种基于空间实体融合的智能搜索方法,包括以下实施步骤:
[0005]步骤1)、获取数据信息存储至分布式数据库中,并构建词库;
[0006]步骤2)、用户在客户端输入搜索语句,做分词处理;
[0007]步骤3)、调用实体识别模型,将输入的搜索字段,实现实体识别;
[0008]步骤4)、根据是否有空间实体,判断是否引入空间分析:
[0009]步骤5)、若引入空间分析,通过空间分析获取数据集;若不需引入空间分析,进行ES搜索流程,直至成功获取数据集。
[0010]进一步地,步骤3)中,搜索语句识别为实体识别的具体过程为:将搜索语句的文本信息做分词处理,实现文本识别;通过实体识别模型进行实体识别,并利用空间分析方法实现空间实体识别,最后输出为空间实体对象。
[0011]进一步地,步骤4)中,是否引入空间分析的判别条件为:识别实体模型输出的实体识别结果是否有空间实体,判断是否引入空间分析。
[0012]进一步地,步骤5)中,空间分析的具体过程为:根据实体识别模型,获取实体识别;通过空间分析服务,将空间实体映射为空间实体范围;再根据空间实体范围,在空间分析服务中,检索出对应的结果,最后输出结果集。
[0013]进一步地,步骤5)中,ES搜索流程为:根据步骤3)中的实体识别模型,构建搜索语句,增加同义词搜索,并构建聚合分组语句,进行ES搜索。
[0014]进一步地,若ES搜索匹配成功,召回,获得结果集。
[0015]进一步地,若ES搜索未成功,召回结果为空,修改搜索语句,扩大搜索范围,进行再召回。
[0016]本专利技术公开了一种基于空间实体融合的智能搜索方法,是一种融合全文搜索、实体识别、空间搜索的智能化空间搜索方法,实现空间融合智能搜索功能,能显著提高搜索精度和搜索效率,并针对已有的海量搜索数据,挖掘出用户潜在关注信息,为用户提供更加友好、交互性强的智能搜索服务。
附图说明
[0017]图1为本专利技术的整体流程示意图。
[0018]图2为本专利技术空间分析流程图。
具体实施方式
[0019]下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0020]一种基于空间实体融合的智能搜索方法,如图1所示,其实施步骤为:
[0021]步骤1)、获取构建词库所需的相关关键词数据信息,将数据信息存储至分布式数据库中,并构建词库;
[0022]步骤2)、用户在客户端输入搜索语句,做分词处理;
[0023]步骤3)、调用实体识别模型,将输入的搜索语句(即key字段)实现实体识别;
[0024]实体识别模型是采用深度学习技术,使用大量生态环境行业数据训练得到的实体识别模型。该实体识别模型可将文本中所对应的实体,识别出来,如图2所示,搜索字段识别为空间实体的具体过程为:用户在搜索框输入文本信息(例如:朝阳区生态环境黑臭水体)进行搜索,先将文本信息做分词处理(将朝阳区生态环境黑臭水体分词为“朝阳区”+“生态/环境”+“黑/臭/水体”),然后通过实体识别模型进行实体识别,并利用空间分析方法实现空间实体识别,最后输出为空间实体对象。
[0025]步骤4)、根据是否有空间实体,判断是否引入空间分析:
[0026]通过识别实体模型输出的实体识别结果是否有空间实体,判断是否引入空间分析。
[0027]当匹配时,引入空间分析,通过空间分析获取数据集,具体过程为:将空间实体映射为空间实体范围。再根据空间实体范围,在空间分析服务中,检索出对应的结果,输出结果集。
[0028]当不匹配时,则不需引入空间分析,进行ES搜索流程;或者空间分析未获取数据时,也进行ES搜索。ES搜索流程为:根据步骤3)中的实体识别模型,构建搜索语句;增加同义词搜索,并构建聚合分组语句,进行ES搜索;若ES搜索匹配成功,召回,将结果返回给客户;若ES搜索未成功,召回结果为空,修改搜索语句,扩大搜索范围,进行再召回。
[0029]对于本专利技术所公开的基于空间实体融合的智能搜索方法,实现空间融合智能搜索空间,能显著提高搜索精度和搜索效率,并针对已有的海量搜索数据,挖掘出用户潜在关注信息,为用户提供更加友好、交互性强的搜索服务。
[0030]本专利技术采用人工智能实体识别技术,通过读取词库、分词、遍历分词结果,识别出输入关键字中的空间实体对象。再通过空间分析,将文本识别转化为空间实体识别,即通过空间分析服务获取空间搜索全量数据,从而得到省市县实体行政区划边界。全文搜索采用Elasticsearch(简称ES)实时搜索功能,可以有效处理庞大的搜索数据以及非结构化数据,
能够实现全文搜索和搜寻功能,能够将不同字段纳入搜索引擎之中。全文搜索和空间搜索融合技术,提供强大的搜索功能,能为用户提供实时的、多维的、交互式的搜索功能,具有高扩展性、高通用性、高性能的特点,能够融合不同数据类型、不同业务系统的数据,让秒级搜索变为现实。
[0031]下面结合具体的案例,对本专利技术的基于空间实体融合的智能搜索方法的使用做进一步介绍。
[0032]以输入的搜索字段为“朝阳区黑臭水体”文本为例:
[0033]1)用户在搜索引擎输入“朝阳区黑臭水体”文本;
[0034]2)调用实体识别模型,识别出两个实体:区县实体“朝阳区”、生态环境分类实体“黑臭水体”;
[0035]3)空间分析服务通过映射,将朝阳区转换成实际的边界;
[0036]4)ES搜索实现搜索“黑臭水体”实体与朝阳区边界相交或被包含的黑臭水体数据。
[0037]上述实施方式并非是对本专利技术的限制,本专利技术也并不仅限于上述举例,本
的技术人员在本专利技术的技术方案范围内所做出的变化、改型、添加或替换,也均属于本专利技术的保护范围。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于空间实体融合的智能搜索方法,其特征在于:包括以下实施步骤:步骤1)、获取数据信息存储至分布式数据库中,并构建词库;步骤2)、用户在客户端输入搜索语句,做分词处理;步骤3)、调用实体识别模型,将输入的搜索字段,实现实体识别;步骤4)、根据是否有空间实体,判断是否引入空间分析:步骤5)、若引入空间分析,通过空间分析获取数据集;若不需引入空间分析,进行ES搜索流程,直至成功获取数据集。2.根据权利要求1所述的基于空间实体融合的智能搜索方法,其特征在于:步骤3)中,搜索语句识别为实体识别的具体过程为:将搜索语句的文本信息做分词处理,实现文本识别;通过实体识别模型进行实体识别,并利用空间分析方法实现空间实体识别,最后输出为空间实体对象。3.根据权利要求2所述的基于空间实体融合的智能搜索方法,其特征在于:步骤4)中,是否引入空间分析的判别条件为:识别实体...
【专利技术属性】
技术研发人员:李绍俊,李少杰,陈嘉威,姚子赫,王云飞,
申请(专利权)人:北京嘉诚瑞杰信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。