【技术实现步骤摘要】
一种基于集成聚类的支柱性产业的判定方法
[0001]本专利技术属于大数据及机器学习算法的
,尤其涉及一种基于集成 聚类的支柱性产业的判定方法。
技术介绍
[0002]支柱性企业在地区的发展中起着极为重要的作用,它能为适应社会需求 结构变化、优化调整产业结构提供正确选择,也能成为地区提高产业竞争力 的有效途径,从而提高地区财政税收收入,对于当地其它产业起到引领、示 范性作用,对于产业能效的分析也应首先针对支柱性产业展开。
[0003]随着计算机和互联网技术的迅速发展,物联网、大数据、云计算等新型 信息技术在与产业系统深度融合将使整个产业体系进入智慧化的进程。且数 据采集技术在各产业的深入应用,各类传感器和智能设备数量的增加及功能 不断完善,使得产业的各类数据愈加透明容易获取。我国的产业也从基础的 生产自动化逐步走向数据信息化,大量的产业数据通过成熟的数据采集与存 储系统保存下来,为支柱性产业的新型定义提供足够的数据支撑。
[0004]节能环保产业将成为新一轮的支柱性产业。仅基于经济层面定义的支柱 性产业在能效利用方面显然不再具有完整的示范作用。此时,支柱性产业应 该有更广泛领域地认定,在考虑其在经济方面的推动及引领作用之外,还需 考虑其在能源利用方面的效率。由于能源利用是针对电力等能源的利用,所 以还需要从电力等领域对产业的支柱性展开分析。
技术实现思路
[0005]本专利技术所要解决的技术问题在于提供了一种多源电力数据背景下的基于 集成聚类的支柱性产业的判定方法。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于集成聚类的支柱性产业的判定方法,其特征在于:包括如下步骤:步骤一、构建多源电力指标:将经济贡献度、能源消耗、能源消费结构、节能环保四个方面指标构建为多源电力指标;其中,所述经济贡献度指标,包括:产业总产值S1、总产值同比增长S2、利润总额S3;所述能源消耗指标,包括:用电量S4、油品消耗量S5、燃气消耗量S6、万元产值能耗S7;所述能源消费结构,包括:电力占能源比重S8、煤炭占能源比重S9、油品占能源比重S10、燃气占能源比重S11;所述节能环保指标,包括:煤炭消耗量S12;步骤二、明确各指标类型:产业总产值S1、总产值同比增长S2、利润总额S3、燃气消耗量S6、燃气占能源比重S11属于极大型指标;油品消耗量S5、万元产值能耗S7、煤炭占能源比重S9、油品占能源比重S10、煤炭消耗量S12属于极小型指标;用电量S4、电力占能源比重S8属于区间型指标;步骤三、对于多源电力指标中的极小型以及区间型指标进行转换:对于极小型指标,转换为:对于区间型指标,转换为:式(1)(2)中:x代表原始指标数据;代表转换后的指标数据;[q1,q2]为区间型指标数据的最佳稳定区间;M、m代表分别为x允许的上下界;步骤四、对各指标数据进行数据预处理:采用极差标准化如式(3)所示:其中,x
ij
代表第i个指标的第j个数据,x
ij
’
代表经过数据预处理后的第i个指标的第j个数据;标准化后的新数据,变量的极大值为1,极小值为0,其余的数值均在0与1之间;步骤五、对各指标数据进行降维:使用主成分分析法PCA对数据进行降维,其降维的核心是正交分解,通过相互正交的空间基向量来表示原始数据;将数量较少的几个重要的的主成分向量作为向量基,然后用重构的方法来实现原始特征的维度降低;
步骤六、将不同的聚类算法作为个体学习器分别得到聚类结果,通过学习法的结合策略将各个体学习器的输出结果通过聚类算法结合;采用DBSCAN密度聚类作为次级学习器以结合各个体学习器的输出;步骤七:进行支柱性产业类簇判定:首先求出各多源电力指标下,各类簇各样本占整体样本的平均比重:式中:x
ijk
代表第k类簇的样本,i代表第i个产业样本,j代表第j维多源电力指标;n
k
为第k类产业簇的样本数量;n代表所有产业样本的个数;M
jk
表示在第j维多源电力指标上k类簇中各样本占整体样本的平均比重。由于一共有12个多源电力指标,得到k类簇样本占比矩阵则M=[M1,M2,...,M
12
]作为在各维特征属性上各类簇各样本占整体样本的平均比重矩阵,为k*12的矩阵。然后结合特征权重给给类簇评分:P=M
...
【专利技术属性】
技术研发人员:黄必成,张敏,童浪兴,刘勇,吴绍华,杨荣坪,钱大庆,左宇,陈经玮,方涛,王天龙,吴逸鸣,林康玮,黄雪斌,熊磊,吴涛,罗孝峰,
申请(专利权)人:国家电投集团江西电力工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。