System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及大数据,特别涉及一种城乡规划信息数据的分类存储方法。
技术介绍
1、移动互联网、物联网技术的推广应用产生了大量实时反映城市社会经济活动特征的数据,包括电网运行、道路车速和流量,甚至每个人的位置和行为。这些庞大而繁杂的城市感知大数据均可用于城乡规划建设及管理,从而形成城乡规划信息数据。城乡规划信息数据具有种类复杂、体量巨大、时间跨度大的特点。
2、城乡规划信息数据是一种非结构化数据,非结构化数据是指数据结构不规则或不完整的、没有预定义,且不方便使用数据库的二维逻辑表进行表示的数据。在数据处理技术纵深发展的大环境下,网络数据量显著提升,同时数据格式与结构也呈多元化发展,提升了非结构化数据的存储难度。解决非结构化数据存储的难题,能够显著提升其管理能力与应用性能。
3、现有方式中采用构建压缩感知模型实现数据存储,通过正交匹配追踪算法降低存储空间,但该模型存储的数据中包含大量冗余数据,对于数据存储产生消极影响。同时,云存储方法在实际应用过程中自适应性较差,数据压缩精度较低。分布式数据存储方法未考虑数据的非结构化特征,数据存储后的搜索性能较差。可见现有技术中并没有针对非结构化数据的高效存储方式。
技术实现思路
1、本专利技术提供了一种城乡规划信息数据的分类存储方法,构建基于决策树模型的分块存储方法,通过对城乡规划信息数据进行特征分类、异常识别、分块存储,提升了非结构化数据存储能力,降低了非结构化数据存储压力,实现高质量的非结构化数据存储。
2、
3、获取城乡规划信息数据,所述城乡规划信息数据为非结构化数据;其中,所述城乡规划信息数据包括传统规划数据、都市感知数据、社交网络数据;
4、采用改进的决策树模型对所述城乡规划信息数据进行处理,以实现非结构化数据的特征分类;
5、对分类后的所述城乡规划信息数据采用决策树分类算法进行数据异常识别,并输出异常数据;
6、将去除所述异常数据后的城乡规划信息数据进行分块存储。
7、进一步地,所述采用改进的决策树模型对所述城乡规划信息数据进行处理,以实现非结构化数据的特征分类的步骤,包括:
8、采用改进决策树算法构建分类模型,以对所述城乡规划信息数据特征进行模糊分类;
9、通过有限集合并的形式实施城乡规划信息数据集的模糊指向性分类,获取分类的指标集λ0;同时,通过城乡规划信息数据集的决策树调度方式完成优化分类,在模糊层次分布结构模型内获取城乡规划信息数据分类的统计特征信息流;
10、将n个子空间内的城乡规划信息数据特征实施自动分类处理,获取子序列;
11、对城乡规划信息数据实施有限数据集分类,基于不规则三角网模型在有限论域内对城乡规划信息数据特征实施分类;
12、提取城乡规划信息数据集的相干分布源特征,获取城乡规划信息数据特征的模糊扩展函数,并以此构建城乡规划信息数据主特征决策树分叉模型,完成城乡规划信息数据特征分类。
13、进一步地,所述采用改进决策树算法构建分类模型,以对所述城乡规划数据特征进行模糊分类的步骤,包括:
14、若非结构化数据内包含n个样本,以si,j(t)表示二维决策树分类模型的学习因子:
15、
16、其中,s表示城乡规划信息数据特征占比,yi,j(t)表示训练数据集估计条件概率;
17、确定模糊关联参数的相关性:
18、
19、其中,ai(t)、e(t)分别表示城乡规划信息数据优化检测统计结果和城乡规划信息数据能量消耗。
20、进一步地,所述对分类后的所述城乡规划信息数据采用决策树分类算法进行数据异常识别,并输出异常数据的步骤,包括:
21、以基尼指数极小化为基础构造二叉树,并初始化一个根节点,将所有城乡规划信息数据放入此节点;
22、选择一个特征进行分裂,使得分裂后的子节点能够最大程度的降低基尼指数,如果满足停止条件,则结束分裂;
23、对于每一个子结点,反复进行上一步骤,直至终止条件满足为止,当所有节点都满足停止条件时,算法结束;
24、输出所述城乡规划信息数据的异常数据检测报告。
25、进一步地,所述选择一个特征进行分裂,使得分裂后的子节点能够最大程度的降低基尼指数,如果满足停止条件,则结束分裂的步骤中,基尼指数表示为:
26、
27、其中,gini(w,k)表示基尼指数,w1和w2表示训练集数据两个部分,s表示训练数据集,gini(w1)表示训练集1的基尼指数,gini(w2)表示训练集2的基尼指数。
28、进一步地,所述将去除所述异常数据后的城乡规划信息数据进行分块存储的步骤,包括:
29、以data和src分别表示待输入的非结构化城乡规划信息数据和其文件名,利用用户端将城乡规划信息数据输入流内;
30、城乡规划信息数据分块,以获取各个类别内的城乡规划信息数据块集合b={b0,b1,…,bm-1}、k个城乡规划信息数据分块集f={f0,f1,…,fk-1},并在主节点选取的节点上存储粗非结构化数据块;
31、通过范德蒙矩阵对粗非结构化数据块实施编码,对粗非结构化数据块实施细分;
32、在所选节点上存储编码后的非结构化数据块,并基于不同非结构化数据块,得到新的元数据;
33、迭代上述过程至无新元数据生成为止,以完成全部城乡规划信息数据的分块存储。
34、进一步地,所述通过范德蒙矩阵对粗非结构化数据块实施编码,对粗非结构化数据块实施细分的步骤中,编码处理过程中的矩阵方程为:
35、
36、其中,v表示范德蒙矩阵。
37、本专利技术还提供了一种城乡规划信息数据的分类存储装置,包括:
38、获取模块,用于获取城乡规划信息数据,所述城乡规划信息数据为非结构化数据;其中,所述城乡规划信息数据包括传统规划数据、都市感知数据、社交网络数据;
39、分类模块,用于采用改进的决策树模型对所述城乡规划信息数据进行处理,以实现非结构化数据的特征分类;
40、识别模块,用于对分类后的所述城乡规划信息数据采用决策树分类算法进行数据异常识别,并输出异常数据;
41、存储模块,用于将去除所述异常数据后的城乡规划信息数据进行分块存储。
42、本专利技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
43、本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
44、本专利技术的有益效果为:
45、本专利技术对城乡规划信息数据采用改进的决策树模型进行处理,实现非结构化数据的特征分类;本文档来自技高网...
【技术保护点】
1.一种城乡规划信息数据的分类存储方法,其特征在于,包括:
2.根据权利要求1所述的城乡规划信息数据的分类存储方法,其特征在于,所述采用改进的决策树模型对所述城乡规划信息数据进行处理,以实现非结构化数据的特征分类的步骤,包括:
3.根据权利要求2所述的城乡规划信息数据的分类存储方法,其特征在于,所述采用改进决策树算法构建分类模型,以对所述城乡规划数据特征进行模糊分类的步骤,包括:
4.根据权利要求1所述的城乡规划信息数据的分类存储方法,其特征在于,所述对分类后的所述城乡规划信息数据采用决策树分类算法进行数据异常识别,并输出异常数据的步骤,包括:
5.根据权利要求4所述的城乡规划信息数据的分类存储方法,其特征在于,所述选择一个特征进行分裂,使得分裂后的子节点能够最大程度的降低基尼指数,如果满足停止条件,则结束分裂的步骤中,基尼指数表示为:
6.根据权利要求1所述的城乡规划信息数据的分类存储方法,其特征在于,所述将去除所述异常数据后的城乡规划信息数据进行分块存储的步骤,包括:
7.根据权利要求6所述的城乡规划信息
8.一种城乡规划信息数据的分类存储装置,其特征在于,包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种城乡规划信息数据的分类存储方法,其特征在于,包括:
2.根据权利要求1所述的城乡规划信息数据的分类存储方法,其特征在于,所述采用改进的决策树模型对所述城乡规划信息数据进行处理,以实现非结构化数据的特征分类的步骤,包括:
3.根据权利要求2所述的城乡规划信息数据的分类存储方法,其特征在于,所述采用改进决策树算法构建分类模型,以对所述城乡规划数据特征进行模糊分类的步骤,包括:
4.根据权利要求1所述的城乡规划信息数据的分类存储方法,其特征在于,所述对分类后的所述城乡规划信息数据采用决策树分类算法进行数据异常识别,并输出异常数据的步骤,包括:
5.根据权利要求4所述的城乡规划信息数据的分类存储方法,其特征在于,所述选择一个特征进行分裂,使得分裂后的子节点能够最大程度的降低基尼指数,如果满足停止条件,则结...
【专利技术属性】
技术研发人员:郑兴平,
申请(专利权)人:东平县规划建筑设计院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。