索引结构、非结构化数据的检索方法、装置和设备制造方法及图纸

技术编号:27537023 阅读:14 留言:0更新日期:2021-03-03 11:25
本发明专利技术示例性实施例提供一种索引结构、非结构化数据的检索方法、装置和设备,针对于具体业务场景的非结构化数据构建索引结构,所述索引结构包括以下信息中的一种要素:系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;基于所述索引结构对所述具体业务场景的非结构化数据进行分类;根据输入的关键字信息,在分类后的所述具体业务场景的非结构化数据中进行检索。本发明专利技术能够提升非结构化数据的检索性能。的检索性能。的检索性能。

【技术实现步骤摘要】
索引结构、非结构化数据的检索方法、装置和设备


[0001]本专利技术示例性实施例涉及数据处理
,尤其涉及一种索引结构、非结构化数据的检索方法、装置和设备。

技术介绍

[0002]随着业务种类的逐渐繁多和业务的不断发展,对业务搜索筛选的粒度越来越细,统计维度也随之越来越多,在实际业务场景中,针对于各类不同业务上存在的各种排序需求、搜索时限需求等,现有的搜索方式受到较大的局限性。
[0003]针对现在种类繁多的业务,不同业务的索引类型又不尽相同,使用动态的索引增加的索引字段会杂然无章,且一线开发人员在一定程度上对非结构化数据的了解也不全面,指定的索引类型也不全面,更不容易进行管理,不适当的指定和管理反而会降低非结构化数据的性能,对于保存业务数据的系统而言,目前还没有能够解决上述问题的方法或装置出现。

技术实现思路

[0004]有鉴于此,本专利技术示例性实施例的目的在于提出一种索引结构、非结构化数据的检索方法、装置和设备,以解决目前的保险系统中多业务场景下的非结构化数据搜索性能较低的问题。
[0005]基于上述目的,第一方面,本专利技术示例性实施例提供了一种索引结构,应用于非结构化数据的高可用搜索,所述索引结构包括以下信息中的一种要素:
[0006]系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;
[0007]其中,所述系统生成的索引信息至少包括系统索引信息和文件识别信息,所述应用方自定义业务信息根据具体的业务场景进行自定义,所述操作员轨迹信息为对非结构化数据进行操作的轨迹信息。
[0008]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述索引结构中的任意一种要素与其它要素之间的排序是可变化的,其中任一种要素为另一种要素的横向或者纵向拓展。
[0009]第二方面,本专利技术示例性实施例还提供了一种非结构化数据的检索方法,包括:
[0010]针对于具体业务场景的非结构化数据构建索引结构,所述索引结构包括以下信息中的一种要素:系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;
[0011]基于所述索引结构对所述具体业务场景的非结构化数据进行分类;
[0012]根据输入的关键字信息,在分类后的所述具体业务场景的非结构化数据中进行检索。
[0013]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述基于所述索引结构对所述具体业务场景的非结构化数据进行分类,包括:
[0014]对所述索引结构进行横向分类和纵向分类,所述横向分类为包括所述要素的母
类,所述纵向分类为不包括所述要素的子类;
[0015]每一所述母类和所述子类均为横向和纵向可扩展的。
[0016]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述方法还包括:
[0017]确定待检索的非结构化数据的横向分类和纵向分类;
[0018]在确定所述横向分类和所述纵向分类后,结合输入的关键字信息,确定待检索的非结构化数据的存储位置。
[0019]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述系统生成的索引信息至少包括系统索引信息和文件识别信息,所述应用方自定义业务信息根据具体的业务场景进行自定义得到,所述操作员轨迹信息为对非结构化数据进行操作的轨迹信息,所述索引结构中的任意一种要素与其它要素之间的排序是可变化的,其中任一种要素为另一种要素的横向或者纵向拓展。
[0020]第三方面,本专利技术示例性实施例还提供了一种非结构化数据的检索装置,其特征在于,包括:
[0021]构建模块,用于针对于具体业务场景的非结构化数据构建索引结构,所述索引结构包括以下信息中的一种要素:系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;
[0022]分类模块,用于基于所述索引结构对所述具体业务场景的非结构化数据进行分类;
[0023]检索模块,用于根据输入的关键字信息,在分类后的所述具体业务场景的非结构化数据中进行检索。
[0024]上述的装置,所述分类模块,还用于:
[0025]对所述索引结构进行横向分类和纵向分类,所述横向分类为包括所述要素的母类,所述纵向分类为不包括所述要素的子类;其中,每一所述母类和所述子类均为横向和纵向可扩展的。
[0026]上述的装置,所述装置还包括:
[0027]第一确定模块,用于确定待检索的非结构化数据的横向分类和纵向分类;
[0028]第二确定模块,用于在确定所述横向分类和所述纵向分类后,结合输入的关键字信息,确定待检索的非结构化数据的存储位置;
[0029]所述系统生成的索引信息至少包括系统索引信息和文件识别信息,所述应用方自定义业务信息根据具体的业务场景进行自定义得到,所述操作员轨迹信息为对非结构化数据进行操作的轨迹信息,所述索引结构中的任意一种要素与其它要素之间的排序是可变化的,其中任一种要素为另一种要素的横向或者纵向拓展。
[0030]第四方面,本专利技术示例性实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的非结构化数据的检索方法。
[0031]从上面所述可以看出,本专利技术示例性实施例提供的索引结构、非结构化数据的检索方法、装置和设备,通过构建一种多具体业务场景下的索引结构,该索引结构包括横向与纵向的各种母类和子类,而且随着业务的不断增多,索引结构也可随之更加丰富,因此,在不需要进行全量检索的前提下,本专利技术多业务高可用搜用解决方案能够无限接近实时搜
索,大幅提升了非结构化数据的搜索性能。
附图说明
[0032]为了更清楚地说明本专利技术示例性实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术示例性实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本专利技术示例性实施例索引结构示意图;
[0034]图2为本专利技术示例性实施例非结构化数据的检索方法流程基本示意图;
[0035]图3为本专利技术示例性实施例非结构化数据的检索装置基本结构示意图;
[0036]图4为本专利技术示例性实施例的设备结构示意图。
具体实施方式
[0037]为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
[0038]需要说明的是,除非另外定义,本专利技术示例性实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本专利技术示例性实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种索引结构,应用于非结构化数据的高可用搜索,其特征在于,所述索引结构包括以下信息中的一种要素:系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;其中,所述系统生成的索引信息至少包括系统索引信息和文件识别信息,所述应用方自定义业务信息根据具体的业务场景进行自定义,所述操作员轨迹信息为对非结构化数据进行操作的轨迹信息。2.根据权利要求1所述的索引结构,其特征在于,所述索引结构中的任意一种要素与其它要素之间的排序是可变化的,其中任一种要素为另一种要素的横向或者纵向拓展。3.一种非结构化数据的检索方法,其特征在于,包括:针对于具体业务场景的非结构化数据构建索引结构,所述索引结构包括以下信息中的一种要素:系统生成的索引信息、应用方自定义业务信息以及操作员轨迹信息;基于所述索引结构对所述具体业务场景的非结构化数据进行分类;根据输入的关键字信息,在分类后的所述具体业务场景的非结构化数据中进行检索。4.根据权利要求3所述的方法,其特征在于,所述基于所述索引结构对所述具体业务场景的非结构化数据进行分类,包括:对所述索引结构进行横向分类和纵向分类,所述横向分类为包括所述要素的母类,所述纵向分类为不包括所述要素的子类;每一所述母类和所述子类均为横向和纵向可扩展的。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定待检索的非结构化数据的横向分类和纵向分类;在确定所述横向分类和所述纵向分类后,结合输入的关键字信息,确定待检索的非结构化数据的存储位置。6.根据权利要求3所述的方法,其特征在于,所述系统生成的索引信息至少包括系统索引信息和文件识别信息,所述应用方自定义业务信息根据具体的业务场景进行自定义得到,所述操作员轨迹信息为...

【专利技术属性】
技术研发人员:谭珂郑巍陈海平程钟斌姚志楠贾梦瑶杨介科尹伊人李超宋朝阳
申请(专利权)人:中国人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1