System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及多源数据的深度融合,尤其是一种基于变电站多源数据的深度融合方法。
技术介绍
1、变电站的多源数据是指在变电站运行和维护中涉及的各类数据,这些数据来源于不同的系统和设备,具有不同的格式和特性。现有变电站数据采集设备涉及的数据来源复杂,种类繁多,着力解决设备状态监视覆盖面不全,成熟监测手段少,运行稳定性不高,维护工作量大,业务系统应用成效不高,数据有效利用度低。大力提升变电站系统的自主可控水平,降低系统运行安全风险,数据的深度融合是一个可行方案,基于变电站的多源数据深度融合亟需一种快速处理多源数据算法,解决数据融合效率低,限制大,分析能力差的问题。
2、现有的多源数据的深度融合方法基本是单一维度的数据,分析同一类型数据的特点,得到基本一类数据一段周期内的特征表现,具有局限性小、说明数据要表现规律单一的问题;同时数据融合的方法也很单一,采集单一来源的数据,做出数据统计图来进行分类融合,往往花费大量时间和人力。
技术实现思路
1、为解决现有技术存在的处理多源数据速度慢和特征多的问题,本专利技术的目的在于提供一种加快基于变电站多源数据的深度融合速度,同时减少冗余数据对样本分析造成干扰,可以快速处理多维数据的基于变电站多源数据的深度融合方法。
2、为实现上述目的,本专利技术采用了以下技术方案:一种基于变电站多源数据的深度融合方法,包括:
3、(1)根据pca算法,将方差最大的方向作为主要特征,在各个正交方向上将数据离散标在坐标轴上,对数据进行降
4、(2)对归一化后的数据进行降维,降低数据复杂度,得到降维后的数据;
5、(3)对降维后的数据进行svm多分类,再进行特征融合,得到筛选后的特征凸显的数据。
6、所述步骤(1)具体是指:使用方差var(x)来定义样本之间的间距,计算方差:
7、
8、其中,m为样本个数,xi为样本,为均值;
9、将样本进行均值归0,即所有样本减去样本的均值;
10、求解最大方差:求一个最大轴的方向,方向向量w=(w1,w2)映射到w方向后,方差最大目标函数,求w,使得最大;
11、式中,w1表示方向向量w的水平轴,w2表示方向向量w的垂直水平轴,xi表示一组样本数据;x为样本数据,其公式为:
12、
13、利用梯度上升算法,求解w,使得每组数据的每个变量到最大平面分割线的距离最大:
14、
15、所述步骤(2)具体包括以下顺序的步骤:
16、(2a)计算归一化数据集的协方差矩阵;
17、(2b)计算协方差矩阵的特征值和特征向量;
18、(2c)保留融合数据中关键特征最重要的k个特征值;
19、(2d)找出k个特征值相应的特征向量;
20、(2e)将m*n的归一化数据集乘以k个n维的特征向量的特征向量n*k,得到最后降维的数据。
21、所述步骤(3)具体是指:将数据向量散列分布在二维平面,支持向量机svm分类器通过优化一个凸二次规划问题来解决最佳的超平面;
22、假设给定的特征空间训练集为:
23、t={(x1,y1),(x2,y2)...(xn,yn)}
24、xi∈rn,yn∈{+1,-1},i=1,2,...,n
25、其中,(xi,yi)为样本点
26、xi为第i个样本
27、yi为xi的标记:yi=1时,xi为正例;yi=-1时,xi为负例;
28、训练集最小化平面映射的复杂度即最小化权重的平方和,同时限制训练样本的误分类情况;
29、优化一个凸二次规划问题来解决最佳的超平面,使用拉格朗日乘子法求解;通过间隔最大化得到分离朝平面:
30、y(x)=wtφ(x)+b
31、分类决策函数为:
32、f(x)=sign(wtφ(x)+b)
33、式中,sign为核方法,wt为方向向量,φ(x)为拉格朗日乘子法,b是y轴偏移量;
34、对于非线性可分的情况,svm支持向量机通过核函数将输入特征映射到高维空间,使得原本线性不可分的数据在高维空间中变得线性可分,所述核函数为线性核、多项式核、高斯核中的任意一种。
35、由上述技术方案可知,本专利技术的有益效果为:第一,本专利技术加快了基于变电站多源数据的深度融合速度,同时又能减少冗余数据对样本分析造成的干扰,本专利技术创新性的使用了pca数据降维方法,将过程噪声与量测噪声都考虑在数据处理计算方案中,同时又使用了svm多分类方法快速区分数据,建立分析图和为样本学习提供策略;第二,通过线性变换将原始变量转换为新的变量,即主成分,这些主成分是彼此独立的,并且能最大限度地保留原始数据中的变异信息,减少数据集的维度、简化数据结构、突出变量之间的关系;第三,使用核函数可以向高维空间进行映射,使用核函数可以解决非线性的分类,分类思想很简单,就是将样本与决策面的间隔最大化,分类效果较好,可以快速处理多维数据。
本文档来自技高网...【技术保护点】
1.一种基于变电站多源数据的深度融合方法,其特征在于:该方法包括下列顺序的步骤:
2.根据权利要求1所述的基于变电站多源数据的深度融合方法,其特征在于:所述步骤(1)具体是指:使用方差Var(x)来定义样本之间的间距,计算方差:
3.根据权利要求1所述的基于变电站多源数据的深度融合方法,其特征在于:所述步骤(2)具体包括以下顺序的步骤:
4.根据权利要求1所述的基于变电站多源数据的深度融合方法,其特征在于:所述步骤(3)具体是指:将数据向量散列分布在二维平面,支持向量机SVM分类器通过优化一个凸二次规划问题来解决最佳的超平面;
【技术特征摘要】
1.一种基于变电站多源数据的深度融合方法,其特征在于:该方法包括下列顺序的步骤:
2.根据权利要求1所述的基于变电站多源数据的深度融合方法,其特征在于:所述步骤(1)具体是指:使用方差var(x)来定义样本之间的间距,计算方差:
3.根据权利要求1所述的基于变...
【专利技术属性】
技术研发人员:方超超,李翔,张庚生,蔡晓阳,李东杨,胡凌志,张子杰,李强,
申请(专利权)人:安徽南瑞继远电网技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。