System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多维度大数据筛选分析方法技术_技高网

一种基于多维度大数据筛选分析方法技术

技术编号:42337602 阅读:9 留言:0更新日期:2024-08-14 16:13
本申请提供一种基于多维度大数据筛选分析方法,属于科学数据处理领域,用实现降低科学数据检索的复杂性的同时,提高其科学数据匹配准确性。该方法包括:步骤S1:响应于用户的检索操作,电子设备获取待分析的科学数据检索式;步骤S2:电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据检索式匹配的科学数据检索式,科学数据检索式库中科学数据检索式为有对应的科学数据检索结果的检索式;步骤S3:电子设备输出匹配的科学数据检索式对应的科学数据检索结果,或者响应于用户的拒绝操作,电子设备返回迭代执行步骤S2,输出科学数据检索结果或者迭代到预设次数。

【技术实现步骤摘要】

本申请涉及科学数据处理领域,尤其涉及一种基于多维度大数据筛选分析方法


技术介绍

1、随着信息技术的发展,科学数据库在各个领域的应用越来越广泛。然而,传统的科学数据库检索方式往往依赖于用户输入的检索式,这种方式的效率和准确性受到了很大的限制。为了解决这个问题,近年来,学者们提出了许多改进的检索技术,以提高科学数据库的检索效率和准确性。为了提高检索效率,研究者们提出了各种索引技术。例如,b树索引、b+树索引、哈希索引等。这些索引技术通过对科学数据进行预处理和排序,使得科学数据能够更快地被检索。此外,还有一些新兴的索引技术,如倒排索引、布隆过滤器等,它们在不同的应用场景下表现出了优秀的性能。

2、然而,其本质还是依赖于检索式本身,因此如何降低科学数据检索的复杂性,以及提高其科学数据匹配准确性是目前研究的热点问题。


技术实现思路

1、本申请实施例提供一种基于多维度大数据筛选分析方法,用实现降低科学数据检索的复杂性的同时,提高其科学数据匹配准确性。

2、为达到上述目的,本申请采用如下技术方案:

3、第一方面,提供一种基于多维度大数据筛选分析方法,应用于电子设备,该方法包括:步骤s1:响应于用户的检索操作,电子设备获取待分析的科学数据检索式;步骤s2:电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据检索式匹配的科学数据检索式,科学数据检索式库中科学数据检索式为有对应的科学数据检索结果的检索式;步骤s3:电子设备输出匹配的科学数据检索式对应的科学数据检索结果,或者响应于用户的拒绝操作,电子设备返回迭代执行步骤s2,输出科学数据检索结果或者迭代到预设次数。

4、一种可能的设计方案中,电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据检索式匹配的科学数据检索式,包括:电子设备将科学数据表达结构的待分析的科学数据检索式,转换为矩阵表达结构的待分析的科学数据矩阵;电子设备对待分析的科学数据矩阵进行多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据矩阵匹配的科学数据矩阵,矩阵表达结构的匹配的科学数据矩阵的科学数据表达结构即为匹配的科学数据检索式。

5、可选地,待分析的科学数据矩阵为由0和1构成的基矩阵,电子设备对待分析的科学数据矩阵进行多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据矩阵匹配的科学数据矩阵,包括:电子设备使用多维的酉矩阵对待分析的科学数据矩阵进行扩展运算,得到多维度的待分析科学数据矩阵;电子设备确定多维度的待分析科学数据矩阵中的每列与科学数据检索式库中的科学数据矩阵的每列的内积,并将科学数据检索式库中内积之和的科学数据矩阵确定为匹配的科学数据矩阵。

6、可选地,多维的酉矩阵为多维的dft矩阵,多维的dft矩阵的维度与步骤s2被轮训执行的次数正相关;

7、多维的酉矩阵为3维dft矩阵,3维dft矩阵表示为如下:;

8、或者,多维的酉矩阵为4维dft矩阵,4维dft矩阵表示为如下:。

9、可选地,使用多维的酉矩阵对待分析的科学数据矩阵进行扩展运算是指:通过多维的酉矩阵,将待分析的科学数据矩阵的每列扩展到与多维的酉矩阵的列数相同,即多维度的待分析科学数据矩阵的列数是多维的酉矩阵与待分析的科学数据矩阵的列数之积。

10、可选地,多维度的待分析科学数据矩阵为的矩阵,科学数据检索式库中的第k个科学数据矩阵为,k为正整数,多维度的待分析科学数据矩阵中的第i列与第k个科学数据矩阵中第j列的内积为,i为取1至n的整数,j为取1至pk的整数;

11、在此基础上,多维度的待分析科学数据矩阵与第k个科学数据矩阵的内积之和为:。

12、可选地,电子设备将科学数据表达结构的待分析的科学数据检索式,转换为矩阵表达结构的待分析的科学数据矩阵,包括:电子设备对待分析的科学数据检索式进行独热编码,得到待分析的科学数据检索式的由0和1构成的字符串表达式,字符串表达式的长度为l;电子设备按预设取值为m将字符串表达式截取为z段,并将z段中的每段构造为矩阵的一列,得到待分析的科学数据矩阵,z为round(l/m),round()表示向上取整;其中,若z段中的最后一段在截取时的长度不足m,则电子设备通过在最后一段的段末填充0/1的方式,将最后一段的长度填充到m。

13、进一步的,电子设备按预设取值为m将字符串表达式截取为z段,并将z段中的每段构造为矩阵的一列,得到待分析的科学数据矩阵,包括:电子设备按预设取值为m将字符串表达式截取为z段;电子设备确定z段中是否有取值相同的重复段落;若z段中没有取值相同的重复段落,则电子设备将z段中的每段构造为矩阵的一列,得到待分析的科学数据矩阵,待分析的科学数据矩阵为的矩阵;或者,若z段中有x段取值相同的重复段落,则电子设备将x段从z段中删除,得到z-x段,并将z-x段中的每段构造为矩阵的一列,得到待分析的科学数据矩阵,待分析的科学数据矩阵为的矩阵。

14、一种可能的设计方案中,科学数据检索结果包括如下至少一项:地球科学类科学数据、微生物学科学数据、基因组学科学数据、化学科学数据、动物学科学数据、农业科学数据、空间科学数据、基础医学科学数据、植物学科学数据、生态学科学数据、林业科学数据、物理学科学数据、或天文学科学数据。

15、第二方面,提供一种基于多维度大科学数据筛选分析装置,应用于电子设备,装置被配置为:步骤s1:响应于用户的检索操作,电子设备获取待分析的科学数据检索式;步骤s2:电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据检索式匹配的科学数据检索式,科学数据检索式库中科学数据检索式为有对应的科学数据检索结果的检索式;步骤s3:电子设备输出匹配的科学数据检索式对应的科学数据检索结果,或者响应于用户的拒绝操作,电子设备返回迭代执行步骤s2,输出科学数据检索结果或者迭代到预设次数。

16、一种可能的设计方案中,电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据检索式匹配的科学数据检索式,包括:电子设备将科学数据表达结构的待分析的科学数据检索式,转换为矩阵表达结构的待分析的科学数据矩阵;电子设备对待分析的科学数据矩阵进行多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据矩阵匹配的科学数据矩阵,矩阵表达结构的匹配的科学数据矩阵的科学数据表达结构即为匹配的科学数据检索式。

17、可选地,待分析的科学数据矩阵为由0和1构成的基矩阵,电子设备对待分析的科学数据矩阵进行多维度科学数据匹配,从科学数据检索式库中确定与待分析的科学数据矩阵匹配的科学数据矩阵,包括:电子设备使用多维的酉矩阵对待分析的科学数据矩阵进行扩展运算,得到多维度的待分析科学数据矩阵;电子设备确定多维度的待分析科学数据矩阵中的每列与科学数据检索式库中的科学数据矩阵的每列的内积,并将科学数据检索式库中内积之和的科学数据矩阵确定为匹配的科本文档来自技高网...

【技术保护点】

1.一种基于多维度大数据筛选分析方法,其特征在于,应用于电子设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与所述待分析的科学数据检索式匹配的科学数据检索式,包括:

3.根据权利要求2所述的方法,其特征在于,所述待分析的科学数据矩阵为由0和1构成的基矩阵,所述电子设备对所述待分析的科学数据矩阵进行多维度科学数据匹配,从所述科学数据检索式库中确定与所述待分析的科学数据矩阵匹配的科学数据矩阵,包括:

4.根据权利要求3所述的方法,其特征在于,所述多维的酉矩阵为所述多维的DFT矩阵,所述多维的DFT矩阵的维度与所述步骤S2被轮训执行的次数正相关;

5.根据权利要求3或4所述的方法,其特征在于,使用多维的酉矩阵对所述待分析的科学数据矩阵进行扩展运算是指:通过所述多维的酉矩阵,将所述待分析的科学数据矩阵的每列扩展到与所述多维的酉矩阵的列数相同,即所述多维度的待分析科学数据矩阵的列数是所述多维的酉矩阵与所述待分析的科学数据矩阵的列数之积。

6.根据权利要求3或4所述的方法,其特征在于,所述多维度的待分析科学数据矩阵为的矩阵,所述科学数据检索式库中的第k个科学数据矩阵为,k为正整数,所述多维度的待分析科学数据矩阵中的第i列与所述第k个科学数据矩阵中第j列的内积为,i为取1至N的整数,j为取1至Pk的整数;

7.根据权利要求2所述的方法,其特征在于,所述电子设备将科学数据表达结构的所述待分析的科学数据检索式,转换为矩阵表达结构的待分析的科学数据矩阵,包括:

8.根据权利要求7所述的方法,其特征在于,所述电子设备按预设取值为M将所述字符串表达式截取为Z段,并将所述Z段中的每段构造为矩阵的一列,得到所述待分析的科学数据矩阵,包括:

9.根据权利要求1所述的方法,其特征在于,所述科学数据检索结果包括如下至少一项:地球科学类科学数据、微生物学科学数据、基因组学科学数据、化学科学数据、动物学科学数据、农业科学数据、空间科学数据、基础医学科学数据、植物学科学数据、生态学科学数据、林业科学数据、物理学科学数据、或天文学科学数据。

10.一种基于多维度大科学数据筛选分析装置,其特征在于,应用于电子设备,所述装置被配置为:

...

【技术特征摘要】

1.一种基于多维度大数据筛选分析方法,其特征在于,应用于电子设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述电子设备通过多维度科学数据匹配,从科学数据检索式库中确定与所述待分析的科学数据检索式匹配的科学数据检索式,包括:

3.根据权利要求2所述的方法,其特征在于,所述待分析的科学数据矩阵为由0和1构成的基矩阵,所述电子设备对所述待分析的科学数据矩阵进行多维度科学数据匹配,从所述科学数据检索式库中确定与所述待分析的科学数据矩阵匹配的科学数据矩阵,包括:

4.根据权利要求3所述的方法,其特征在于,所述多维的酉矩阵为所述多维的dft矩阵,所述多维的dft矩阵的维度与所述步骤s2被轮训执行的次数正相关;

5.根据权利要求3或4所述的方法,其特征在于,使用多维的酉矩阵对所述待分析的科学数据矩阵进行扩展运算是指:通过所述多维的酉矩阵,将所述待分析的科学数据矩阵的每列扩展到与所述多维的酉矩阵的列数相同,即所述多维度的待分析科学数据矩阵的列数是所述多维的酉矩阵与所述待分析的科学数据矩阵的列数之积。

6.根据权利要求3或4所述...

【专利技术属性】
技术研发人员:罗俊博陈树敏李莎薛露方少亮何硕楠郑伟鸿林珠
申请(专利权)人:广东省科技基础条件平台中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1