一种数据检索方法及设备技术

技术编号:36770277 阅读:21 留言:0更新日期:2023-03-08 21:41
本申请公开了一种数据检索方法、设备及介质,方法包括:根据检索请求,确定检索类型与检索词;若为结构化数据检索,根据预设结构化基本信息索引对检索词进行匹配,得到第一匹配结果;判断是否具有未匹配的第一未匹配检索词;若是,根据预设的维度字典索引,对第一未匹配检索词进行匹配;若匹配到对应的匹配维度,确定匹配维度所在结构化数据的目标基本信息;根据目标基本信息与第一匹配结果,得到第二匹配结果;判断是否具有未匹配的第二未匹配检索词;若是,根据预设结构化全文索引,对第二未匹配检索词进行匹配,得到全文匹配值;确定全文匹配值所在结构化数据的目标维度;根据目标维度与第二匹配结果,生成检索结果。提高数据检索效率。索效率。索效率。

【技术实现步骤摘要】
一种数据检索方法及设备


[0001]本申请涉及数据处理
,尤其涉及一种数据检索方法及设备。

技术介绍

[0002]目前,主流数据中台软件,可创建数据湖仓进行各个内部业务系统以及外部数据进行各种结构化、非结构化数据的采集存储,并基于存储的数据提供数据分析等数据服务。
[0003]但是,各类数据和服务应用分散管理,部分有单独的检索功能,如对非结构化文档的检索,用户需要到各个功能中分散检索或者到数据库中检索;检索功能只针对被检索内容的标题、描述等基本信息,无法根据业务关键词快速找到相关的所有数据内容,导致数据检索效率低。

技术实现思路

[0004]本申请实施例提供一种数据检索方法及设备,用于解决数据检索效率低的问题。
[0005]本申请实施例采用下述技术方案:
[0006]一方面,本申请实施例提供了一种数据检索方法,该方法包括:接收用户终端设备的检索请求,根据所述检索请求,确定当前的检索类型与待检索的检索词;若所述检索类型为结构化数据检索,则根据预设结构化基本信息索引对所述检索词进行匹配,得到第一匹配结果;所述预设结构化基本信息索引与标题名称、内容描述相关;根据所述第一匹配结果,判断是否具有未匹配的第一未匹配检索词;若是,则根据预设的维度字典索引,对所述第一未匹配检索词进行匹配;所述维度字典索引与结构化数据的维度有关;若匹配到对应的匹配维度,确定所述匹配维度所在结构化数据的目标基本信息;根据所述目标基本信息与所述第一匹配结果,得到第二匹配结果;根据所述第二匹配结果,判断是否具有未匹配的第二未匹配检索词;若是,则根据预设结构化全文索引,对所述第二未匹配检索词进行匹配,得到全文匹配值;所述预设结构化全文索引与结构化数据的内容有关;确定所述全文匹配值所在结构化数据的目标维度;根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果。
[0007]一个示例中,所述根据所述检索请求,确定当前的检索类型与待检索的检索词之后,所述方法还包括:若所述检索类型为非结构化数据检索,则根据预设非结构化基本信息索引对所述检索词进行匹配,得到第三匹配结果;根据所述第三匹配结果,判断是否具有未匹配的第三未匹配检索词;若是,则根据预设非结构化全文索引,对所述第三未匹配检索词进行匹配,得到全文匹配值;确定所述全文匹配值所在结构化数据的目标基本信息;根据所述全文匹配值所在结构化数据的目标基本信息与所述第三匹配结果,生成所述检索词的检索结果。
[0008]一个示例中,所述根据所述目标基本信息与所述第一匹配结果,得到第二匹配结果,具体包括:若所述第一匹配结果为非空,则在所述第一匹配结果中,通过所述基本信息索引,对所述目标基本信息进行匹配,得到第二匹配结果;若所述第一匹配结果为空,则根
据所述匹配维度所在结构化数据,生成第二匹配结果。
[0009]一个示例中,所述根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果,具体包括:若所述第二匹配结果为非空,则在所述第二匹配结果中,通过所述维度字典索引对所述目标维度进行匹配,生成所述检索词的检索结果;若所述第二匹配结果为空,则根据所述全文匹配值所在结构化数据,生成所述检索词的检索结果。
[0010]一个示例中,所述根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果,生成所述检索词的检索结果之后,所述方法还包括:若所述检索结果为多个,则确定每个检索结果的检索次数;按照检索次数由高到低的顺序,对所述每个检索结果进行排序;根据排序结果,向所述用户终端设备显示所述每个检索结果。
[0011]一个示例中,所述根据排序结果,向所述用户终端设备显示所述每个检索结果,具体包括:判断所述检索词是否包括预先设定形式的维度条件;所述维度条件与所述匹配维度有关;若是,则根据所述维度条件,对所述每个检索结果中的检索内容进行过滤;根据所述排序结果,向所述用户终端设备显示过滤后的每个检索结果。
[0012]一个示例中,所述接收用户终端设备的检索请求之前,所述方法还包括:构建具有结构化数据存储区和非结构化存储区的数据库;将样本结构化数据上传至所述结构化数据存储区,将样本非结构化数据上传至所述非结构化数据存储区;根据所述样本结构化数据,构建结构化基本信息索引、维度字典索引以及结构化全文索引;根据所述样本非结构化数据,构建非结构化基本信息索引、非结构化全文索引。
[0013]一个示例中,所述将样本结构化数据上传至所述结构化数据存储区,具体包括:获取数据表样式的样本结构化数据;根据所述数据表的业务场景,将所述样本结构化数据转换为固定样式的看板样式,以及用户可拖动调整的自助分析样式;根据所述数据表样式、所述看板样式以及所述自助分析样式,将所述样本结构化数据上传至所述结构化存储区。
[0014]一个示例中,所述根据所述样本非结构化数据,构建非结构化基本信息索引、非结构化全文索引,具体包括:提取所述样本非结构化数据的基本信息,根据所述基本信息,构建非结构化基本信息索引;在所述样本非结构化数据中,对预设文档类型的文件进行内容解析;根据解析的文件内容,构建非结构化全文索引。
[0015]另一方面,本申请实施例提供了一种数据检索设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:接收用户终端设备的检索请求,根据所述检索请求,确定当前的检索类型与待检索的检索词;若所述检索类型为结构化数据检索,则根据预设结构化基本信息索引对所述检索词进行匹配,得到第一匹配结果;所述预设结构化基本信息索引与标题名称、内容描述相关;根据所述第一匹配结果,判断是否具有未匹配的第一未匹配检索词;若是,则根据预设的维度字典索引,对所述第一未匹配检索词进行匹配;所述维度字典索引与结构化数据的维度有关;若匹配到对应的匹配维度,确定所述匹配维度所在结构化数据的目标基本信息;根据所述目标基本信息与所述第一匹配结果,得到第二匹配结果;根据所述第二匹配结果,判断是否具有未匹配的第二未匹配检索词;若是,则根据预设结构化全文索引,对所述第二未匹配检索词进行匹配,得到全文匹配值;所述预设结构化全文索引与结构化数据的内容有关;确定所述全文匹配值所在结构化数据的目标维度;根据所述目标维度与所述第二匹配结果,生成
所述检索词的检索结果。
[0016]本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0017]能够在一个输入框中输入搜索词时,根据基本信息索引、维度字典索引、全文索引3个索引进行检索,直接得到结构化数据与非结构化数据检索类型的检索结果,提高了检索效率,简便有效,为用户带来了良好的体验,尤其对于数据中台存储管理的结构化及非结构化大量数据,以及基于存储数据提供的分析看板等数据服务,能够采用统一的检索方式快速找到所需内容
附图说明
[0018]为了更清楚地说明本申请的技术方案,下面将结合附图来对本申请的部分实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据检索方法,其特征在于,所述方法包括:接收用户终端设备的检索请求,根据所述检索请求,确定当前的检索类型与待检索的检索词;若所述检索类型为结构化数据检索,则根据预设结构化基本信息索引对所述检索词进行匹配,得到第一匹配结果;所述预设结构化基本信息索引与标题名称、内容描述相关;根据所述第一匹配结果,判断是否具有未匹配的第一未匹配检索词;若是,则根据预设的维度字典索引,对所述第一未匹配检索词进行匹配;所述维度字典索引与结构化数据的维度有关;若匹配到对应的匹配维度,确定所述匹配维度所在结构化数据的目标基本信息;根据所述目标基本信息与所述第一匹配结果,得到第二匹配结果;根据所述第二匹配结果,判断是否具有未匹配的第二未匹配检索词;若是,则根据预设结构化全文索引,对所述第二未匹配检索词进行匹配,得到全文匹配值;所述预设结构化全文索引与结构化数据的内容有关;确定所述全文匹配值所在结构化数据的目标维度;根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述检索请求,确定当前的检索类型与待检索的检索词之后,所述方法还包括:若所述检索类型为非结构化数据检索,则根据预设非结构化基本信息索引对所述检索词进行匹配,得到第三匹配结果;根据所述第三匹配结果,判断是否具有未匹配的第三未匹配检索词;若是,则根据预设非结构化全文索引,对所述第三未匹配检索词进行匹配,得到全文匹配值;确定所述全文匹配值所在结构化数据的目标基本信息;根据所述全文匹配值所在结构化数据的目标基本信息与所述第三匹配结果,生成所述检索词的检索结果。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标基本信息与所述第一匹配结果,得到第二匹配结果,具体包括:若所述第一匹配结果为非空,则在所述第一匹配结果中,通过所述基本信息索引,对所述目标基本信息进行匹配,得到第二匹配结果;若所述第一匹配结果为空,则根据所述匹配维度所在结构化数据,生成第二匹配结果。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果,具体包括:若所述第二匹配结果为非空,则在所述第二匹配结果中,通过所述维度字典索引对所述目标维度进行匹配,生成所述检索词的检索结果;若所述第二匹配结果为空,则根据所述全文匹配值所在结构化数据,生成所述检索词的检索结果。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标维度与所述第二匹配结果,生成所述检索词的检索结果,生成所述检索词的检索结果之后,所述方法还包括:若所述检索结果为多个,则确定每个检索结果的检索次数;
按照检索次数由高到低的顺序,对所述每个检索结果进行排序;根据排序结果,向所述用户终端设备显示所述每个检索结果。6.根据权利要求5所述的方法,其特征在...

【专利技术属性】
技术研发人员:王相成国文峰李桢张迪沈淦
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1