一种基于开关设计模式优化检索的方法技术

技术编号:25914889 阅读:12 留言:0更新日期:2020-10-13 10:33
本方法涉及大数据搜索技术领域,具体而言是一种基于开关设计模式优化检索的方法,适用于一种基于开关设计模式自动选择大数据搜索入口优化检索的方法。用户在进行搜索时,可以智能化的选择搜索的入口,结合Elasticsearch与Solr在不同方面的搜索优势,提升搜索的效率。在实际的应用中,本方法支持集群的扩展,随着搜索引擎集群节点的增加,本方法还可配置搜索入口选择的策略,自主性较强。

【技术实现步骤摘要】
一种基于开关设计模式优化检索的方法
本方法涉及大数据搜索
,具体而言是一种基于开关设计模式优化检索的方法,适用于一种基于开关设计模式自动选择大数据搜索入口优化检索的方法。技术背景大数据搜索是指计算机索引程序通过输入的查询条件,借助大数据搜索引擎,在搜索引擎数据库中进行检索,并将符合查找条件的结果反馈给用户的搜索方式。在本文中采用Elasticsearch与Solr两种搜索引擎。ElasticSearch是一个基于分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用ElasticSearch的水平伸缩性,能使数据在生产环境变得更有价值。ElasticSearch的实现原理主要分为以下几个步骤,首先用户将数据提交到ElasticSearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。Solr是开源企业级搜索引擎,其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成。Solr是高度可扩展的,并提供了分布式搜索和索引复制。在服务器配置、集群节点数量、数据内容(数据量)、查询条件都相同的情况下,ElasticSearch与Solr性能对比表如下:由测试结果可见,在数据量低于2000万且搜索引擎数据库中没有数据插入的的情况下,solr的搜索速度明显高于Elasticsearch;而在数据量高于2000万或者搜索引擎数据库中有数据插入时,Elasticsearch的搜索效率明显高于Solr。因此我们可以结合二者的优点,制定一种智能化的选择搜索引擎入口的方法,来提升搜索的性能。
技术实现思路
为了实现上述功能,本专利技术提供一种基于开关设计模式自动选择大数据搜索入口优化检索的方法,该方法基于大数据搜索引擎工具与数据总线开发,通过监控数据流入与库中数据量,在用户使用关键字搜索时,根据配置的选择入口的策略,自动选择符合策略的大数据搜索引擎入口进行查询。本专利技术解决其技术问题所采用的技术方案为:一种基于开关设计模式优化检索的方法,包括如下步骤:A、采用数据总线的架构,监控Solr数据插入的接口,若检测有数据流入solr瞬间获取到并获取solr中实时的数据量;B、创建两个接口分别对elasticsearch和solr进行数据查询,保持两个接口入参与返回值格式一致;C、使用开关设计模式,创建一个开关接口,该接口同时监管步骤B中创建的两个接口,并且根据传入的条件切换使用elasticsearch查询接口或使用solr查询接口;D、创建用户搜索接口,该接口作为用户查询的入口,对外接收用户的查询条件,调用步骤A中实时数据量,并将获取到的数据结果传入步骤3中的开关接口,获取搜索到的数据返回用户;所述步骤C中判断实时获取数据量,传入实时数据的表达式为solrInsert=true或者num>n;solrInsert=true代表有数据插入solr;num代表当前solr中数据量,n代表solr性能降低的临界值,通过该开关接口瞬间将查询接口切为elasticsearch的搜索入口;反之切换为solr的搜索入口,该接口会将elasticsearch或solr接口查询出的数据作为返回值。本专利技术的有益效果是:采用本专利技术方法,用户在进行搜索时,可以智能化的选择搜索的入口,结合Elasticsearch与Solr在不同方面的搜索优势,提升搜索的效率。在实际的应用中,本方法支持集群的扩展,随着搜索引擎集群节点的增加,本方法还可配置搜索入口选择的策略,自主性较强。附图说明图1为本专利技术的实现逻辑图。具体实施方式下面结合附图对本专利技术作进一步进行详细说明。一种基于开关设计模式优化检索的方法,包括如下步骤:A、采用数据总线的架构,监控Solr数据插入的接口,若检测有数据流入solr瞬间获取到并获取solr中实时的数据量;B、创建两个接口分别对elasticsearch和solr进行数据查询,保持两个接口入参与返回值格式一致;C、使用开关设计模式,创建一个开关接口,该接口同时监管步骤B中创建的两个接口,并且根据传入的条件切换使用elasticsearch查询接口或使用solr查询接口;D、创建用户搜索接口,该接口作为用户查询的入口,对外接收用户的查询条件,调用步骤A中实时数据量,并将获取到的数据结果传入步骤3中的开关接口,获取搜索到的数据返回用户;所述步骤C中判断实时获取数据量,传入实时数据的表达式为solrInsert=true或者num>n;solrInsert=true代表有数据插入solr;num代表当前solr中数据量,n代表solr性能降低的临界值,通过该开关接口瞬间将查询接口切为elasticsearch的搜索入口;反之切换为solr的搜索入口,该接口会将elasticsearch或solr接口查询出的数据作为返回值。本专利技术的具体说明如下:A、采用数据总线的架构,管理并监控Solr数据插入的接口,若有数据流入solr可以通过监控程序瞬间获取到,同时该监控程序可以获取solr中实时的数据量。B、创建两个接口分别对elasticsearch和solr进行数据查询,需要保持两个接口入参与返回值格式一致。C、使用开关设计模式,创建一个开关接口,该接口同时监管步骤B中创建的两个接口,并且根据传入的条件可以判断使用elasticsearch查询接口还是使用solr查询接口,例如传入的solrInsert=true或者num>n(solrInsert=true代表有数据插入solr,num代表当前solr中数据量,n代表solr性能降低的临界值),通过该开关接口可以瞬间将查询接口切为elasticsearch的搜索入口;反之切换为solr的搜索入口。该接口会将elasticsearch或solr接口查询出的数据作为返回值。D、创建用户搜索接口,该接口作为用户查询的入口,对外接收用户的查询条件,对内调用solr的监控接口获取solr数据量以及数据插入情况(即solrInsert是否为true),并将获取到的结果传入步骤C中的开关接口,获取搜索到的数据返回用户。通过以上步骤可以知道,我们使用数据总线架构对solr进行监控,通过开关模式对两个搜索入口进行封装,可以自动化的切换大数据搜索入口,结合Elasticsearch与solr在各自搜索领域的优势,提升搜索的效率。应用案例案例一:政府网站文档库功能,存在大量的政策性文件与相关办公文档,为了实现对文档的快速查询,可以采用搜索引擎作为文档的检索工具。由于文档库中的文件是定期更新、非实时的,所以在没有数据插入并且数据量低于设定的阀值的情况下,采用本本文档来自技高网
...

【技术保护点】
1.一种基于开关设计模式优化检索的方法,其特征在于包括如下步骤:/nA、采用数据总线的架构,监控Solr数据插入的接口,若检测有数据流入solr瞬间获取到并获取solr中实时的数据量;/nB、创建两个接口分别对elasticsearch和solr进行数据查询,保持两个接口入参与返回值格式一致;/nC、使用开关设计模式,创建一个开关接口,该接口同时监管步骤B中创建的两个接口,并且根据传入的条件切换使用elasticsearch查询接口或使用solr查询接口;/nD、创建用户搜索接口,该接口作为用户查询的入口,对外接收用户的查询条件,调用步骤A中实时数据量,并将获取到的数据结果传入步骤C中的开关接口,获取搜索到的数据返回用户。/n

【技术特征摘要】
1.一种基于开关设计模式优化检索的方法,其特征在于包括如下步骤:
A、采用数据总线的架构,监控Solr数据插入的接口,若检测有数据流入solr瞬间获取到并获取solr中实时的数据量;
B、创建两个接口分别对elasticsearch和solr进行数据查询,保持两个接口入参与返回值格式一致;
C、使用开关设计模式,创建一个开关接口,该接口同时监管步骤B中创建的两个接口,并且根据传入的条件切换使用elasticsearch查询接口或使用solr查询接口;
D、创建用户搜索接口,该接口作为用户查询的入口,对外接收用户的查询条件,调用步骤A中实时数据量,并将...

【专利技术属性】
技术研发人员:王旭锋刘涛刘磊魏帮财蒋永录
申请(专利权)人:中电万维信息技术有限责任公司
类型:发明
国别省市:甘肃;62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1