System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种针对数据孤岛的数据查询方法、装置、设备及介质。
技术介绍
1、随着大数据时代的发展,数据电子化已经成为了办公趋势,但不同的公司、部门、甚至人员间存在着数据的不同表达方式,以至于当数据量较为庞大时,无法实现数据之间的互通,即数据之间存在数据孤岛的情况,导致数据无法被准确查询,出现漏查、错查等诸多情况。
2、但现有的针对数据孤岛的主要有基于hadoop生态组件构建数据仓库的方法,即将各个数据孤岛所存储的原始数据,进行抽取转换,构建ods层(operational data store,操作型数据存储),实现数据集成,对集成后的数据进行数据查询,但数据会在操作型数据存储时重复存储,导致在后续数据查询时的准确度较差,因此,如何提高数据孤岛数据查询的准确度成为亟待解决的问题。
技术实现思路
1、本专利技术提供一种针对数据孤岛的数据查询方法、装置、设备及介质,其主要目的在于解决数据孤岛中数据查询的精确度较差的问题。
2、为实现上述目的,本专利技术提供的一种针对数据孤岛的数据查询方法,包括:
3、获取数据孤岛中的数据集,对所述数据集进行数据集成,得到集成数据集;
4、计算所述集成数据集中每个集成数据的特征数量,根据所述特征数量构建所述集成数据的多通道特征图;
5、根据所述多通道特征图计算每个所述集成数据的目标数据特征,根据所述目标数据特征对所述集成数据集进行数据分类,得到分类数据集;
6、
7、在接收到数据查询请求时,根据所述关联数据索引解析所述数据查询请求的目标数据。
8、可选地,所述对所述数据集进行数据集成,得到集成数据集,包括:
9、对所述数据集进行数据格式分类,得到结构化数据集及非结构化数据集;
10、对所述结构化数据集进行数据标准化及数据去重处理,得到目标结构化数据集;
11、对所述非结构化数据集进行数据校验及数据除噪处理,得到目标非结构化数据集;
12、汇集所述目标结构化数据以及所述目标非结构化数据集,得到集成数据集。
13、可选地,所述计算所述集成数据集中每个集成数据的特征数量,包括:
14、识别每个所述集成数据的数据类型;
15、根据所述数据类型对每个所述集成数据进行特征转换,得到转换数据;
16、根据所述转换数据计算每个所述所述集成数据的特征数量。
17、可选地,所述根据所述特征数量构建所述集成数据的多通道特征图,包括:
18、提取所述集成数据的特征数据值,根据所述特征数量构建所述特征数据值的特征数组;
19、根据所述特征数据生成多个元数组,对所述元数组进行拼接,得到多个拼接数组;
20、对所述拼接数组进行叠加,得到所述集成数据的多通道特征图。
21、可选地,所述根据所述多通道特征图计算每个所述集成数据的目标数据特征,包括:
22、对所述多通道特征图进行挤压激励,得到卷积激励特征;
23、利用如下公式对所述多通道特征图进行挤压激励:
24、x′=sigmoid(fc2(relu(fc1(gap(x)))))
25、其中,x′表示卷积激励特征,sigmoid表示sigmoid激活函数,fc2表示预设的第二全连接层,relu表示relu激活函数,fc1表示预设的第一全连接层,gap表示全局池化操作,x表示所述多通道特征图;
26、对所述卷积激励特征进行特征分割,得到分割特征集,对所述分割特征集中的每个分割特征进行卷积,得到分割卷积特征;
27、对所述分割卷积特征进行特征拼接,得到每个所述集成数据的目标数据特征。
28、可选地,所述根据所述关联数据创建关联数据索引,包括:
29、根据所述关联数据识别所述数据孤岛中每个数据的关联孤岛数据及所述关联孤岛数据对应的关联类别;
30、根据所述关联孤岛数据及所述关联类别确定所述关联数据的索引关键字;
31、根据所述索引关键字构建所述数据孤岛中每个数据的关联数据索引。
32、可选地,所述根据所述关联数据索引解析所述数据查询请求的目标数据,包括:
33、获取所述数据查询请求对应的请求报文,对所述请求报文进行剥离解析,获取所述请求报文的应用层数据;
34、根据所述应用层数据识别所述请求报文的报文类型,根据所述报文类型调用预构建的解析规则解析所述请求报文的请求目标;
35、根据所述请求目标利用所述关联数据索引在预设的数据库中进行数据提取,得到所述数据查询请求对应的目标数据。
36、为了解决上述问题,本专利技术还提供一种针对数据孤岛的数据查询装置,所述装置包括:
37、数据集成模块,用于获取数据孤岛中的数据集,对所述数据集进行数据集成,得到集成数据集;
38、多通道特征图构建模块,用于计算所述集成数据集中每个集成数据的特征数量,根据所述特征数量构建所述集成数据的多通道特征图;
39、数据分类模块,用于根据所述多通道特征图计算每个所述集成数据的目标数据特征,根据所述目标数据特征对所述集成数据集进行数据分类,得到分类数据集;
40、关联数据索引创建模块,用于根据所述分类数据集确定每个所述集成数据的关联数据,根据所述关联数据创建关联数据索引;
41、数据查询模块,用于在接收到数据查询请求时,根据所述关联数据索引解析所述数据查询请求的目标数据。
42、为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
43、至少一个处理器;以及,
44、与所述至少一个处理器通信连接的存储器;其中,
45、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的针对数据孤岛的数据查询方法。
46、为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的针对数据孤岛的数据查询方法。
47、专利技术实施例通过对数据孤岛中的数据集进行数据集成,可以提高数据质量,并实现对数据孤岛数据集的整合和统一管理,便于后续的数据查询;构建每个集成数据的多通道特征图,根据多通道特征图计算目标数据特征,可以利用目标数据特征的特征多样性对集成数据集进行精确分类,得到分类数据集;根据分类数据集确定每个集成数据的关联数据,并创建关联数据索引;可以在接收到数据查询请求时,根据关联数据索引解析数据查询请求的目标数据,实现形成数据孤岛的数据库之间的数据互通,避免出现漏查、错查,提高数据孤岛数据本文档来自技高网...
【技术保护点】
1.一种针对数据孤岛的数据查询方法,其特征在于,所述方法包括:
2.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述对所述数据集进行数据集成,得到集成数据集,包括:
3.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述计算所述集成数据集中每个集成数据的特征数量,包括:
4.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述特征数量构建所述集成数据的多通道特征图,包括:
5.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述多通道特征图计算每个所述集成数据的目标数据特征,包括:
6.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述关联数据创建关联数据索引,包括:
7.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述关联数据索引解析所述数据查询请求的目标数据,包括:
8.一种针对数据孤岛的数据查询装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:<
...【技术特征摘要】
1.一种针对数据孤岛的数据查询方法,其特征在于,所述方法包括:
2.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述对所述数据集进行数据集成,得到集成数据集,包括:
3.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述计算所述集成数据集中每个集成数据的特征数量,包括:
4.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述特征数量构建所述集成数据的多通道特征图,包括:
5.如权利要求1所述的针对数据孤岛的数据查询方法,其特征在于,所述根据所述多通道特征图计算每个所述集成数据的目标...
【专利技术属性】
技术研发人员:何声雷,朱黄华,余炼杰,刘建锋,乐童,温德森,徐灿滔,
申请(专利权)人:招商局智融供应链服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。