本发明专利技术提供一种大规模电池储能电站海量电池数据异常检测方法及系统,所述方法包括如下步骤:(1)获取海量储能数据并根据数据类别进行分类;(2)将分类后的数据进行基于距离的滑动窗口异常检测;(3)将检测到的异常数据信息按照特定的格式输出到指定地方。所述系统包括依次相连的海量数据存储模块、海量数据异常检测模块和海量数据异常输出模块。本发明专利技术采用基于距离的滑动窗口异常检测算法,降低时间和空间的复杂度,提供检测的实时性。
【技术实现步骤摘要】
本专利技术属于智能电网、能源互联网以及储能
,具体涉及一种大规模电池 储能电站海量电池数据异常检测方法及系统。
技术介绍
近些年,我国风能和大阳能发电快速发展,电池储能电站的规模不断扩大,电池储 能电站采集上来的储能电池数据也日益剧增。随着电池储能电站朝着大容量化趋势发展, 特别是数十兆瓦级锂电池储能电站中电池单体预计将达数十万只,百兆瓦级电池储能电站 的数据量将达到百万级,需分析与处理电池及储能电站相关的数据量异常庞大。目前的常规电池数据存储方式、架构、管理与分析方法等,难以满足如此大规模海 量电池数据在线管理与高效分析的应用需求。无论在数据容量、写库速度以及查询检索上 都遇到了瓶颈,导致海量电池数据的存取周期长、数据检索及分析效率低。故将海量数据库 以及相关分析方法,应用于电池储能电站领域具有愈发凸显的重要意义。对于海量电池数 据进行进一步的深入挖掘与分析,从电池数据中获取有用的价值,找出大量数据背后隐藏 的规律和特性,也会迫切需要研究解决的关键技术难题。 目前,从大规模电池储能电站中采集的海量电池异常数据虽然较少,但如何检测 与处理非常关键,将会直接影响到大规模电池储能电站运行状态的分析与评估,安全预警 等。这些少数的异常数据中隐藏着重要的信息,有助于我们更好地运行与维护储能电站。尤 其在百兆瓦级电池储能电站的实时控制、安全预警以及运行维护中,上述问题将更加凸显。 目前针对上述问题的解决方案非常少,基于处于空白状态,相关问题亟待解决。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供一种大规模电池储能电站海量电池数 据异常检测方法及系统。本专利技术采用基于距离的滑动窗口异常检测算法,降低时间和空间 的复杂度,提供检测的实时性。 为了实现上述专利技术目的,本专利技术采取如下技术方案: -种大规模电池储能电站海量电池数据异常检测方法,所述方法包括如下步骤: (1)获取海量储能数据并根据数据类别进行分类; (2)将分类后的数据进行基于距离的滑动窗口异常检测; (3)将检测到的异常数据信息按照特定的格式输出到指定地方。 优选的,所述步骤(1)中,所述海量储能数据存储在非关系型Hbase数据库中,利 用hadoop的map方式从所述Hbase数据库中分布式获取海量储能数据。 优选的,所述步骤(2)中,包括如下步骤: 步骤2-1、根据储能数据类别定义前提条件包括距离R、阈值k,窗口长度L; 步骤2-2、将储能数据按照时间序列化,将长度为L的选择窗口W放入该时间序列 中; 步骤2-3、对窗口内的每个数据点〇计算与其他数据点的欧式距离,统计距离在R 范围之内的点的个数n,若η大于k,则认为数据点〇局部异常,反之认为〇局部正常; 步骤2-4、把窗口向前推移1个时间点,重复步骤2-3 ; 步骤2-5、当数据点〇,从进入窗口到离开窗口均为局部正常的话,则认为该数据 为正常数据,反之则为异常数据。 优选的,所述步骤2-3中,所述欧氏距离计算如下:若X和Y为η维数据:X= (χ1;χ2,......,Xi,......xn) Y = (yi, y2,......, Yi,......yn) X与Y之间的欧式距离为: 若X和Y为1维数据,则X和Y之间的欧式距离为:ED(X,Υ) = |Χ-Υ|。 优选的,所述步骤(3)中,所述特定的格式为:{tutn, },其中 ktn为监测点异常的起始和终止时间,为异常数据,所述指定地方指用 户选定输出方式的地方,包括关系型数据库和非关系型Hbase数据库。 优选的,一种大规模电池储能电站海量电池数据异常检测系统,所述系统包括依 次相连的海量数据存储模块、海量数据异常检测模块和海量数据异常输出模块,所述海 量数据存储模块采用非关系型Hbase数据库,存储海量数据;所述异常检测到模块采用 hadoop并行计算模型,获取海量储能数据并根据数据类别进行分类;所述海量数据异常输 出模块,用于将检测到的异常数据信息按照特定的格式输出到指定地方。 优选的,所述海量数据异常检测模块包括依次连接的收集模块、分类模块和异常 检测模块,所述收集模块利用hadoop的map方式从Hbase中分布式获取所述海量储能数 据;所述分类模块,用于将所述海量储能数据根据监测项的类别,分发给对应的所述异常检 测模块;所述异常检测模块,用于将从所述分类模块获得的数据进行基于距离的滑动窗口 异常检测。 优选的,所述海量数据异常输出模块包括选择器,用于配置输出环境,所述输出环 境包括关系型数据库和非关系型Hbase数据库2种。 与现有技术相比,本专利技术的有益效果在于: 本专利技术专利采用基于hadoop分布式计算的海量电池数据异常检测方法及模型, 具有高效、可扩展等特点,大大提高了计算能力和处理速度。由于本专利技术采用基于距离的滑 动窗口异常检测算法,降低时间和空间的复杂度,提供检测的实时性。同时,采用欧式距离, 可以对数据点为多维的,进行异常检测。 本专利技术适用于集中式或分散式接入的大规模电池储能电站海量电池数据的异常 检测、分析与评估,可以为大规模电池储能系统的状态评估、协调控制与安全预警等提供参 考依据。【附图说明】图1为本专利技术提供的一种大规模电池储能电站海量电池数据异常检测系统交互 图图2为本专利技术提供的一种大规模电池储能电站海量电池数据异常检测方法流程 图图3为本专利技术提供的基于距离的滑动窗口异常检测图图4为本专利技术提供的存储海量储能电池数据的Hbase表结构图【具体实施方式】 为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本专利技术进行进一步详细说明。该实施例仅用于解释本专利技术,并不构成对本专利技术保护范围的 限定。 此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未 构成冲突就可以相互组合。 如图1所示,本专利技术实施例提供了一种海量储能电池数据异常检测系统,其包括 海量数据存储模块,海量数据异常检测模块和海量数据异常输出模块。其系统构建步骤如 下: 步骤1构建海量数据存储模块,通过非关系型数据库Hbase建立数据表table存 储海量风光储电池数据,表结构如图4所示。其中Rowkey的组成为数据标示符、距离1970 年1月1日的天数和当天开始的秒数,中间以"I"分隔开来。表中t0表示版本号,Column: "data"为列族,value为列名,后面跟的数字为监测值。 步骤2基于hadoop分布式计算框架MapReduce,构建海量数据异常检测模块,利用 hadoop的map方式从Hbase分布式地获取海量数据,hadoop将Hbase表中的数据拆分成很 多小数据集,每个数据集被分配到一个Map任务中进行处理。Map任务输出的中间结果会提 交给分类器Pa当前第1页1 2 本文档来自技高网...
【技术保护点】
一种大规模电池储能电站海量电池数据异常检测方法,其特征在于,所述方法包括如下步骤:(1)获取海量储能数据并根据数据类别进行分类;(2)将分类后的数据进行基于距离的滑动窗口异常检测;(3)将检测到的异常数据信息按照特定的格式输出到指定地方。
【技术特征摘要】
【专利技术属性】
技术研发人员:李相俊,郑昊,王向前,惠东,贾学翠,陈继忠,董文琦,郑高,范元亮,
申请(专利权)人:中国电力科学研究院,国网新源张家口风光储示范电站有限公司,国网福建省电力有限公司,国网福建省电力有限公司电力科学研究院,国家电网公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。