【技术实现步骤摘要】
本专利技术涉及一种基于配置文件的流式统计定义及运行方法,属于电力系统自动化
技术介绍
随着云计算、大数据技术的发展,运用大数据技术从海量数据中获取潜在的有用信息已得到了各方面的广泛关注。日志数据作为原始大数据,其价值也越来越受到重视。在调度自动化系统中,目前日志数据只停留在事后故障诊断单一用途上,其主要分析方法仍停留在人工配合简单脚本进行日志过滤及检索的阶段。为了充分挖掘调度自动化系统中日志的价值,对调度自动化系统关键指标进行数据统计,为以量化方式考核系统健康状况提供数据基础,需要一种以日志数据为数据源的流式统计框架。借助开源流式计算框架,实现对日志数据的流式统计是普遍采用的方案,目前业内常用的流式计算框架有Storm和SparkStreaming。无论是Storm还是SparkStreaming,其本身是一个分布式系统,提供了一个编程模型及相应的接口。这种设计方式的灵活度高、适应面广,但是其代价是增加新的统计任务需要调用相应的接口完成代码编辑和编译,使用比较复杂,学习成本高。对于调度自动化系统而言,基于开源流式计算框架实现流式统计功能一方面在部署上对原系统的侵入性大,另一方面不利于用户的使用。
技术实现思路
针对现有技术存在的不足,本专利技术目的是提供一种免代码维护的、可灵活定义的、适用于调度自动化系统的基于配置文件的流式统计定义及运行方法。为了实现上述目的,本专利技术是通过如下的技术方案来实现:本专利技术的一种基于配置文件的流式统计定义及运行方法,包括以下几个步骤:(1)创建配置文件,所述配置文件的内容包括任务信息和计算模型;所述配置文件的名称 ...
【技术保护点】
一种基于配置文件的流式统计定义及运行方法,其特征在于,包括以下几个步骤:(1)创建配置文件,所述配置文件的内容包括任务信息和计算模型;所述配置文件的名称格式为:名称_任务编号.conf,所述任务编号按自然顺序递增;(2)编辑所述任务信息,所述任务信息包括属性:任务名称、任务类型和任务描述;所述任务名称用于标识任务,所述任务类型用于描述任务执行方式,所述任务描述用于说明任务实现功能;(3)编辑计算模型,所述计算模型描述统计过程所需组成元素包含:数据源定义、模式定义、统计操作定义和动作定义;其中,所述数据源定义用于描述任务需要的数据集;所述模式定义用于描述数据集投影及投影产生的方式;所述统计操作定义用于描述统计过程;所述动作定义用于描述对计算结果的处理;所述模式定义、统计操作定义和动作定义均可省略,省略动作定义表示采取默认动作定义即本地文件存储;所述数据源定义、模式定义、统计操作定义和动作定义在执行过程中具备顺序关系,即数据按如下顺序流转:数据源定义处理、模型定义处理、统计操作定义处理、动作定义处理。(4)验证所述配置文件合法性:新创建或被修改过的流式统计配置文件,需要通过定义检查工具来确 ...
【技术特征摘要】
1.一种基于配置文件的流式统计定义及运行方法,其特征在于,包括以下几个步骤:(1)创建配置文件,所述配置文件的内容包括任务信息和计算模型;所述配置文件的名称格式为:名称_任务编号.conf,所述任务编号按自然顺序递增;(2)编辑所述任务信息,所述任务信息包括属性:任务名称、任务类型和任务描述;所述任务名称用于标识任务,所述任务类型用于描述任务执行方式,所述任务描述用于说明任务实现功能;(3)编辑计算模型,所述计算模型描述统计过程所需组成元素包含:数据源定义、模式定义、统计操作定义和动作定义;其中,所述数据源定义用于描述任务需要的数据集;所述模式定义用于描述数据集投影及投影产生的方式;所述统计操作定义用于描述统计过程;所述动作定义用于描述对计算结果的处理;所述模式定义、统计操作定义和动作定义均可省略,省略动作定义表示采取默认动作定义即本地文件存储;所述数据源定义、模式定义、统计操作定义和动作定义在执行过程中具备顺序关系,即数据按如下顺序流转:数据源定义处理、模型定义处理、统计操作定义处理、动作定义处理。(4)验证所述配置文件合法性:新创建或被修改过的流式统计配置文件,需要通过定义检查工具来确定配置文件的合法性;(5)配置文件生效管理,所有流式统计配置文件由单独的任务配置文件统一管理,只有增加到任务配置文件中的合法的流式统计配置文件才能生效;所述流式统计配置文件与统计服务一一对应;统计服务监控进程监视任务配置文件的更新,把缓存的任务配置文件内容与新的任务配置文件进行比较生成任务差异,根据任务差异执行任务启动、任务终止、任务重启操作;(6)运行流式统计任务,统计服务启动时带启动参数:任务编号;统计服务首先根据任务编号获取流式统计配置文件,根据配置文件解析任务信息和计算模型,最终生成相应的处理逻辑;统计任务执行过程中,所有数据均是JSON格式,通过属性名访问。2.根据权利要求1所述的基于配置文件的流式统计定义及运行方法,其特征在于,步骤(1)中,所述配置文件分段定义,所述配置文件以KeyName=Value格式定义段内的各种属性。3.根据权利要求1所述的基于配置文件的流式统计定义及运行方法,其特征在于,步骤(2)中,支持两种任务执行方式:普通任务和周期定时任务;所述普通任务在进程启动后即开始计算;所述周期定时任务在设定时间段内或者设定时刻执行计算,可周期执行,可执行一次或者多次。4.根据权利要求1所述的基于配置文件的流式统计定义及运行方法,其特征在于,步骤(3)中,所述计算模型通过数据源定义、模式定义、统计操作定义、动作定义4个组成元素,描述了一种链式数据处理过程:统计服务以消息总线为数据源,消息总线以通道来划分...
【专利技术属性】
技术研发人员:季惠英,周坚,葛敏辉,葛朝强,季学纯,王兴志,李昊,史浩秋,王昌频,王玉军,张瑞,崔伟业,卞月峰,
申请(专利权)人:国电南瑞科技股份有限公司,国电南瑞南京控制系统有限公司,国家电网公司华东分部,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。