本发明专利技术公开了一种基于lucene的主厂站遥信信号自动对比方法,该方法包括将lucene数据库中待对比的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合;对两个所述分词集合分别进行词频统计,并建立每个分词集合的词频向量;根据每个分词集合的词频向量,采用余弦相似度计算主站告警信号数据和厂站告警信号数据的相似度;根据计算得到的相似度和预设对比精度要求,确定对比结果。本发明专利技术实现了主厂站遥信信息自动核对验收,对比速度快、数据准确可靠,大幅减轻了主厂站人员的数据对比工作量,同时降低人工核对中的信息遗漏、信息错误的风险,在运行管理及应用方面,进一步促进主厂站业务协同,大大提升了调度自动化运维水平及工作效率。
A method of automatic comparison of remote signal of main station based on Lucene
【技术实现步骤摘要】
一种基于lucene的主厂站遥信信号自动对比方法
本专利技术涉及数据信号处理
,尤其涉及一种基于lucene的主厂站遥信信号自动对比方法。
技术介绍
电网的正常运行离不开变电站的支撑,变电站的设备状态是运行调度的关键,对调度安全运行起支撑作用。变电站设备远动数据是通过远动终端设备,将变电站电力设备的运行状态实时上传至调度自动化主站系统,电网调度人员根据主站告警平台显示的遥信信息完成对变电站的运行监控。在远动数据“四遥”当中,遥信信号是电网调度最重要的信号之一,它反映变电站各种电气设备的实际运行状态,对于变电站的设备保护及信息传递有着至关重要的作用。在变电站新投、扩建、改建,又或者运行设备改造、预试、定检等日常工作中,需要主站调度自动化班人员和变电站现场运行维护人员、调试人员对变电站内运行设备遥信信息进行人工对比校验确认,确保调度自动化系统显示的设备状态与变电站现场设备实际状态一致,保证调控员可以正确进行电力调度。一个变电站有上千个信号需要验收,而这么多的变电站需验收的遥信量成千上万个。当有大量信号需要验收时,采用目前人工对比方法工作量大,任务重,需要耗费自动化人员与变电站继保人员大量的时间及精力。人工核验存在以下几个问题(1)双方人员验收配合问题遥信验收需要自动化人员与变电站人员双方相互配合才能开展验收工作。双方人员到达各自工作现场,都需要时间,同时也受到天气、交通等外在因素影响,造成验收工作延误或者取消等情况出现,又或者在验收中途受到其他紧急因素影响,导致验收中断,最终增加双方工作量,延长验收周期,从而影响验收工作和设备投产。(2)OPEN-3000验收工具限制主站自动化人员对遥信信号进行验收时,需要锁定OPEN-3000系统实时告警窗口,查找需要验收的设备遥信信号数据,与变电站运维人员进行核对验收。当短时间内有大量遥信信号上送时,自动化人员需要花费大量的时间确认需要验收的遥信信号,且容易受到其他非验收数据干扰,对验收工作造成一定的影响。(3)信息点表信息不规范当自动化人员根据变电现场提供的设备信息点表进行逐条验收时,由于设备厂家标准不统一,信息点表命名存在不规范或不完整,有时需要靠经验进行判断告警信号是否一致,这无形当中影响验收的效率,也容易出现判断错误。
技术实现思路
本专利技术提供一种基于lucene的主厂站遥信信号自动对比方法,以解决现有技术的不足。为实现上述目的,本专利技术提供以下的技术方案:一种基于lucene的主厂站遥信信号自动对比方法,所述方法包括:将lucene数据库中待对比的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合;对两个所述分词集合分别进行词频统计,并建立每个所述分词集合的词频向量;根据每个所述分词集合的所述词频向量,采用余弦相似度计算主站告警信号数据和厂站告警信号数据的相似度;根据计算得到的所述相似度和预设对比精度要求,确定对比结果。进一步地,所述基于lucene的主厂站遥信信号自动对比方法中,在所述将lucene数据库中的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合的步骤之前,所述方法还包括:收集各厂站的厂站告警信号数据,并存入lucene数据库中。进一步地,所述基于lucene的主厂站遥信信号自动对比方法中,所述词频向量是由0和1组成的多元向量。进一步地,所述基于lucene的主厂站遥信信号自动对比方法中,在所述根据每个所述分词集合的所述词频向量,采用余弦相似度计算主站告警信号数据和厂站告警信号数据的相似度的步骤之后,所述方法还包括:输出所述对比结果。进一步地,所述基于lucene的主厂站遥信信号自动对比方法中,分词处理采用分词器执行。进一步地,所述基于lucene的主厂站遥信信号自动对比方法中,所述根据计算得到的所述相似度和预设对比精度要求,确定对比结果的步骤包括:获取预设对比精度要求;判断计算得到的所述相似度是否满足预设对比精度要求;若是,则确定对比结果为匹配,若否,则确定对比结果为不匹配。本专利技术实施例提供的一种基于lucene的主厂站遥信信号自动对比方法,实现了主厂站遥信信息自动核对验收,操作便捷、对比速度快,以及数据准确可靠,大幅度减轻了主站自动化人员和厂站端变电人员的数据对比工作量,同时能降低人工核对中的信息遗漏、信息错误的风险,在运行管理及应用方面,进一步促进主厂站业务协同,大大提升了调度自动化运维水平及工作效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术实施例提供的一种基于lucene的主厂站遥信信号自动对比方法的流程示意图;图2是本专利技术实施例提供的Lucene系统结构图;图3是本专利技术实施例提供的余弦相似度计算图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一请参阅附图1,为本专利技术实施例一提供的一种基于lucene的主厂站遥信信号自动对比方法的流程示意图。该方法具体包括如下步骤:S101、将lucene数据库中待对比的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合。优选的,在步骤S101之前,所述方法还包括:收集各厂站的厂站告警信号数据,并存入lucene数据库中。优选的,在步骤S101之后,所述方法还包括:输出所述对比结果。需要说明的是,Lucene是一个开源的全文检索引擎工具包(类库),在众多开源搜索引擎开发工具中,Apache的Lucene可谓是全世界最优秀的全文搜索引擎架构和开发工具包之一,提供了完整的查询引擎和索引引擎,以及部分文本分析的引擎。Lucene以其优异的索引结构、高性能、可伸缩、跨平台、易使用性和开源等特性,被广泛地用来构建实用的全文搜索应用系统,或被集成于多类软件开发环境之中。Lucene系统结构图如图2所示,首先Lucene对数据源进行抽取,然后将数据解析后转换成Lucene可以识别的数据结构,然后进行(中文)分词处理,通过索引模块将数据建立索引库文件。S102、对两个所述分词集合分别进行词频统计,并建立每个所述分词集合的词频向量。其中,所述词频向量是由0和1组成的多元向量。分词处理采用分词器执行。需要说明的是,中文分词就是按照一定规则将连续的汉语文本序列切分为具有独立语义的词组的过程。本专利技术系统采用目前较为主本文档来自技高网...
【技术保护点】
1.一种基于lucene的主厂站遥信信号自动对比方法,其特征在于,所述方法包括:/n将lucene数据库中待对比的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合;/n对两个所述分词集合分别进行词频统计,并建立每个所述分词集合的词频向量;/n根据每个所述分词集合的所述词频向量,采用余弦相似度计算主站告警信号数据和厂站告警信号数据的相似度;/n根据计算得到的所述相似度和预设对比精度要求,确定对比结果。/n
【技术特征摘要】
1.一种基于lucene的主厂站遥信信号自动对比方法,其特征在于,所述方法包括:
将lucene数据库中待对比的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合;
对两个所述分词集合分别进行词频统计,并建立每个所述分词集合的词频向量;
根据每个所述分词集合的所述词频向量,采用余弦相似度计算主站告警信号数据和厂站告警信号数据的相似度;
根据计算得到的所述相似度和预设对比精度要求,确定对比结果。
2.根据权利要求1所述的基于lucene的主厂站遥信信号自动对比方法,其特征在于,在所述将lucene数据库中的主站告警信号数据和厂站告警信号数据分别进行分词处理,得到两个分词集合的步骤之前,所述方法还包括:
收集各厂站的厂站告警信号数据,并存入lucene数据库中。
3.根据权利要求1所述的基于lucene的...
【专利技术属性】
技术研发人员:徐晋朗,黎作明,林敏业,张白雪,张冬财,叶耀权,林咏蓝,易志浩,袁亨,黄婉婷,
申请(专利权)人:广东电网有限责任公司,广东电网有限责任公司清远供电局,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。