一种快速搜索方法和服务器、计算机设备及可读存储介质技术

技术编号:34533125 阅读:10 留言:0更新日期:2022-08-13 21:26
一种快速搜索方法和服务器、计算机设备及可读存储介质,所述快速搜索方法包括:获取待搜索的关键词信息;根据所述关键词信息进行分词得到分词集;引入Painlenss脚本与所述分词集基于ElasticSsarch引擎进行搜索;将返回的结果集进行展示。本发明专利技术以搜索引擎为支撑,自动进行繁体转换为简体,整合jieba分词算法,配合动态维护的分词库和同义词库,通过在搜索界面输入商品信息或关键词进行繁体转简体,兼容繁体字搜索的场景,再进行jieba智能分词,经过智能补全算法组合成预期的分词集,再结合智能排序算法,对搜索引擎发送单次查询请求,返回预期的搜索结果集,不仅提升了搜索精准度也提升了查询的效率。升了查询的效率。升了查询的效率。

【技术实现步骤摘要】
一种快速搜索方法和服务器、计算机设备及可读存储介质


[0001]本专利技术涉及搜索引擎辅助
,特别是一种快速搜索方法和服务器、计算机设备及可读存储介质。

技术介绍

[0002]基于商城服务搜索准度不高,关键词搜索查询出来的商品不是用户想要的商品,也不是卖家以及运营想要推广的商品,这种现象不利于卖家推广商品以及用户快速找到商品。尤其是内购活动时,用户需要快速且精准找到心仪的商品,搜索的精准匹配尤为重要。将jieba分词整合搜索服务,并加入关键词和同义词动态维护,解决了商城目前搜索不精准的问题。

技术实现思路

[0003]针对上述在业务上搜索不精准的问题,本专利技术提供一种快速搜索方法和服务器、计算机设备及可读存储介质,提升了搜索的精准度和查询效率,有效提升用户的体验。
[0004]为实现上述目的,本专利技术选用如下技术方案:一种快速搜索方法,包括:
[0005]获取待搜索的关键词信息;
[0006]根据所述关键词信息进行分词得到分词集;
[0007]引入Painlenss脚本与所述分词集基于ElasticSsarch引擎进行搜索;
[0008]将返回的结果集进行展示。
[0009]优选地,所述快速搜索方法还包括:
[0010]识别所述关键词信息是否携带繁体字;
[0011]当所述关键词信息中携带繁体字时,利用集成的国家繁体字以内存操作将所述关键词信息中携带的繁体字进行快速转换为简体字;
[0012]得到简体字形式的关键词信息。
[0013]优选地,所述快速搜索方法还包括:
[0014]集成jieba分词库、同义词库,对所述关键词信息进行智能分词;
[0015]将所述关键词信息进行精准切分后所得集合通过智能补全算法,递归计算,得到分词集。
[0016]优选地,所述智能分词无需IO,服务内存计算。
[0017]优选地,所述快速搜索方法还包括:
[0018]引入Painlenss脚本,并将所述分词集一次性发送到ElasticSsarch引擎;
[0019]ElasticSsarch引擎对分词集进行单次IO查询,快速且精准地在服务数据库中搜索,得到结果集并展示。
[0020]优选地,应用所述的快速搜索方法以使待搜索商品信息在商城业务中搜索且精准快速得到对应待售商品信息并展示。
[0021]优选地,所述快速搜索方法还包括:
[0022]获取待搜索商品信息,当所述待搜索商品信息中携带繁体字时,利用集成的国家繁体字以内存操作将所述待搜索商品信息中携带的繁体字进行快速转换为简体字,得到简体字形式的待搜索商品信息;
[0023]将所述待搜索商品信息通过集成jieba分词库、同义词库进行智能分词,并通过智能补全算法,递归计算,得到分词集。
[0024]引入Painlenss脚本与所述分词集基于ElasticSsarch引擎进行搜索,ElasticSsarch引擎对分词集进行单次IO查询,快速且精准地在商城业务服务数据库中搜索,得到待售商品信息结果集并展示。
[0025]另一方面,本专利技术选用如下技术方案:一种快速搜索服务器,包括处理器和存储器,所述存储器用于存储执行上述的一种快速搜索方法的应用程序;所述处理器被配置为用于执行所述存储器中存储的应用程序。
[0026]另一方面,本专利技术选用如下技术方案:一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种快速搜索方法。
[0027]另一方面,本专利技术选用如下技术方案:一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述的一种快速搜索方法。
[0028]相较于现有技术,本专利技术具有以下有益效果:
[0029]本专利技术以搜索引擎为支撑,自动进行繁体转换为简体,整合jieba分词算法,配合动态维护的分词库和同义词库,通过在搜索界面输入商品信息或关键词进行繁体转简体,兼容繁体字搜索的场景,再进行jieba智能分词,经过智能补全算法组合成预期的分词集,再结合智能排序算法,对搜索引擎发送单次查询请求,返回预期的搜索结果集,不仅提升了搜索精准度也提升了查询的效率。
附图说明
[0030]为了更清楚地说明技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0031]图1为实施案例一的流程示意图。
[0032]图2为实施案例二的流程示意图。
具体实施方式
[0033]为了能够清楚、完整地理解技术方案,现结合实施例和附图对本专利技术进一步说明,显然,所记载的实施例仅仅是本专利技术部分实施例,所属领域的技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0035]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目
的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0036]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0037]为了便于理解本申请实施例,下面对本申请涉及到的部分术语进行解释说明。
[0038]jieba分词库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组。除了分词,jieba分词库还提供增加自定义中文单词的功能。jieba分词库支持三种分词模式:精确模式,将句子最精确的切开,适合文本分析;全模式,把句子中所有成词的词语都扫描出来,速度非常快,但不能解决歧义;搜索引擎模式,在精确模式基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
[0039]同义词库是在同义词扩展中人工构造的同义词库、蕴含词库等辅助词库,或是从语料库中自动取得同义词关系,使得检索系统能自动“联想”到与其同义或者意思相近的词,提高信息匹配的准确度,从而提高检索系统的整体性能。把意义相同或相近的词称为同义词,当用户输入预想的关键词时,检索系统将自动进行一系列的预处理,从而得到单个的关键词。这些预处理包括分词、过滤无效词和去除非法字符等,然后对预处理后的关键词进行同义词扩展。
[0040]实施案例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种快速搜索方法,其特征在于,包括:获取待搜索的关键词信息;根据所述关键词信息进行分词得到分词集;引入Painlenss脚本与所述分词集基于ElasticSsarch引擎进行搜索;将返回的结果集进行展示。2.根据权利要求1所述的一种快速搜索方法,其特征在于,所述快速搜索方法还包括:识别所述关键词信息是否携带繁体字;当所述关键词信息中携带繁体字时,利用集成的国家繁体字以内存操作将所述关键词信息中携带的繁体字进行快速转换为简体字;得到简体字形式的关键词信息。3.根据权利要求1所述的一种快速搜索方法,其特征在于,所述快速搜索方法还包括:集成jieba分词库、同义词库,对所述关键词信息进行智能分词;将所述关键词信息进行精准切分后所得集合通过智能补全算法,递归计算,得到分词集。4.根据权利要求3所述的一种快速搜索方法,其特征在于:所述智能分词无需IO,服务内存计算。5.根据权利要求1所述的一种快速搜索方法,其特征在于,所述快速搜索方法还包括:引入Painlenss脚本,并将所述分词集一次性发送到ElasticSsarch引擎;ElasticSsarch引擎对分词集进行单次IO查询,快速且精准地在服务数据库中搜索,得到结果集并展示。6.一种快速搜索方法,其特征在于:应用权利要求1

5任一项所述的快速搜索方法以使待搜索商品信息在商城业务中搜索且精准快速得到...

【专利技术属性】
技术研发人员:王奇栋
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1