System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及信息检索,尤其涉及一种信息搜索方法、装置、电子设备及计算机可读存储介质。
技术介绍
1、随着互联网的发展,互联网中网络数据的数量已经达到惊人级别。传统的搜索引擎,在提供搜索服务时,预先爬取互联网上大量网页中的信息建立索引,在收到用户的查询请求时基于查询关键词在索引中进行匹配,从而返回对应的结果。
2、然而随着网络数据、信息数量级的爆发式增长,搜索引擎基于用户的查询请求返回的匹配结果较多,难以准确满足用户需求,用户需要从返回的匹配结果中主动分辨和查找自己需要的内容,耗费时间和较多。
3、因此,如何提供一种解决上述技术问题的方案是目前本领域技术人员需要解决的问题。
技术实现思路
1、有鉴于此,本申请实施例提供了一种信息搜索方法、装置、电子设备及计算机可读存储介质,以解决现有技术中搜索引擎无法精准满足用户查询需求的问题。
2、本申请实施例的第一方面,提供了一种信息搜索方法,包括:
3、获取一个或多个目标数据接口的初始数据;
4、基于数据结构类型的分类,对初始数据进行数据分类,对数据分类后的初始数据进行特征提取得到初始特征向量,对分类后的初始数据及初始特征向量标注对应的初始关键词;
5、将分类后的初始数据、初始特征向量和初始关键词存储至预设数据库中;
6、当获取到查询请求,基于数据结构类型的分类,对查询请求中的查询数据进行数据分类,对数据分类后的查询数据进行特征提取得到查询特征向量,对查询数据及查
7、在预设数据库中执行匹配操作,得到匹配结果;
8、基于匹配结果,从初始数据中确定对应查询请求的目标初始数据作为查询结果返回;
9、其中,匹配操作包括以下多种:
10、基于分类后的查询数据对初始数据进行匹配;
11、基于查询特征向量对初始特征向量进行匹配;
12、基于查询关键词对初始关键词进行匹配。
13、本申请实施例的第二方面,提供了一种信息搜索装置,包括:
14、获取模块,用于获取一个或多个目标数据接口的初始数据;
15、处理模块,用于基于数据结构类型的分类,对初始数据进行数据分类,对数据分类后的初始数据进行特征提取得到初始特征向量,对分类后的初始数据及初始特征向量标注对应的初始关键词;
16、存储模块,用于将分类后的初始数据、初始特征向量和初始关键词存储至预设数据库中;
17、处理模块,还用于当获取到查询请求,基于数据结构类型的分类,对查询请求中的查询数据进行数据分类,对数据分类后的查询数据进行特征提取得到查询特征向量,对查询数据及查询特征向量标注对应的查询关键词;
18、匹配模块,用于在预设数据库中执行匹配操作,得到匹配结果,并基于匹配结果,从初始数据中确定对应查询请求的目标初始数据作为查询结果返回;
19、其中,匹配操作包括以下多种:
20、基于分类后的查询数据对初始数据进行匹配;
21、基于查询特征向量对初始特征向量进行匹配;
22、基于查询关键词对初始关键词进行匹配。
23、本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
24、本申请实施例的第四方面,提供了一种可读存储介质,该可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
25、本申请实施例与现有技术相比存在的有益效果至少包括:本申请实施例通过对初始数据、查询数据进行数据分类、特征提取和关键词标注,从而能够在收到查询请求时进行数据、特征向量和关键词多维度的匹配,以在所有初始数据中确定出多维度匹配、更符合查询请求的目标初始数据作为查询结果返回,查询结果的准确度明显提高,节省用户的精力和时间成本,提升用户使用体验。
本文档来自技高网...【技术保护点】
1.一种信息搜索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将分类后的所述初始数据、所述初始特征向量和所述初始关键词存储至预设数据库中的过程,包括:
3.根据权利要求1所述的方法,其特征在于,基于所述匹配结果,从所述初始数据中确定对应所述查询请求的目标初始数据作为查询结果返回的过程,包括:
4.根据权利要求1所述的方法,其特征在于,基于数据结构类型的分类,对所述初始数据进行数据分类,对数据分类后的所述初始数据进行特征提取得到初始特征向量,包括:
5.根据权利要求4所述的方法,其特征在于,基于音频结构类型的分类,对所述音频数据进行内容识别和分类,基于分类结果对所述音频数据进行相应的音频特征提取,得到对应所述音频数据的初始特征向量的过程,包括:
6.根据权利要求1所述的方法,其特征在于,对分类后的所述初始数据及所述初始特征向量标注对应的初始关键词的过程,包括:
7.根据权利要求1至6中任一项所述的方法,其特征在于,对数据分类后的所述查询数据进行特征提取得到查询特征向量的过程,包括:
...【技术特征摘要】
1.一种信息搜索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将分类后的所述初始数据、所述初始特征向量和所述初始关键词存储至预设数据库中的过程,包括:
3.根据权利要求1所述的方法,其特征在于,基于所述匹配结果,从所述初始数据中确定对应所述查询请求的目标初始数据作为查询结果返回的过程,包括:
4.根据权利要求1所述的方法,其特征在于,基于数据结构类型的分类,对所述初始数据进行数据分类,对数据分类后的所述初始数据进行特征提取得到初始特征向量,包括:
5.根据权利要求4所述的方法,其特征在于,基于音频结构类型的分类,对所述音频数据进行内容识别和分类,基于分类结果对所述音频数据进行相应的音频特征提取,得到对应所述音频数据的初...
【专利技术属性】
技术研发人员:陈洋,熊勇,曾文强,
申请(专利权)人:重庆赛力斯凤凰智创科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。