电力调度操作票实体信息抽取方法及装置制造方法及图纸

技术编号:34139093 阅读:20 留言:0更新日期:2022-07-14 17:22
本发明专利技术提供一种电力调度操作票实体信息抽取方法及装置。该电力调度操作票实体信息抽取方法包括:获取电力调度操作票文本,将电力调度操作票文本转换为文本向量;将文本向量依次输入预先创建的线性网络模型和预先创建的实体信息抽取模型中得到对应的字符标签;根据字符标签从电力调度操作票文本抽取实体信息。本发明专利技术可以快速转确地抽取电力调度操作票实体信息。体信息。体信息。

Method and device for extracting entity information of power dispatching operation ticket

【技术实现步骤摘要】
电力调度操作票实体信息抽取方法及装置


[0001]本专利技术涉及人工智能
,具体地,涉及一种电力调度操作票实体信息抽取方法及装置。

技术介绍

[0002]在电网公司的电力调度部门,调度员下达的调度操作指令票除了要以电话的形式通知给下级调度机构,还要发送给调度自动化系统。调度自动化系统无法读取操作票信息,需要借助其他手段识别操作票文本中的“电网设备、调度机构、检修票号”等实体信息,这些实体信息会进一步参与调度自动化系统的运行。因此,基于调度操作票文本识别其中的实体信息具有重要的生产实际意义。
[0003]实体抽取的主要算法有RNN、CNN和Transformer等,但是RNN算法存在训练速度慢的致命问题;CNN只能将模型添加到2至3层,无法获取更多全局信息,模型准确率有限;Transformer虽然相比于CNN可以加深网络深度,但是需要先预训练语言模型然后把预训练模型适配给下游任务,操作环节多且较为繁琐。
[0004]目前基于规则或者基于字典的实体识别方法中需要被识别的文本是结构化文本(文字的写法存在某种特定的规则)或带有某种编号的字典,处理不了较为复杂的文本实体信息。也有采用BiGRU网络处理文本实体信息抽取方面的方案,但是BiGRU属于RNN网络的一种,存在训练速度慢的问题。而且BiGRU网络训练过程中的超参数也缺乏及时调整更新,使得训练过程需要花更多的时间达到理想的水平。

技术实现思路

[0005]本专利技术实施例的主要目的在于提供一种电力调度操作票实体信息抽取方法及装置,以快速转确地抽取电力调度操作票实体信息。
[0006]为了实现上述目的,本专利技术实施例提供一种电力调度操作票实体信息抽取方法,包括:
[0007]获取电力调度操作票文本,将电力调度操作票文本转换为文本向量;
[0008]将文本向量依次输入预先创建的线性网络模型和预先创建的实体信息抽取模型中得到对应的字符标签;
[0009]根据字符标签从电力调度操作票文本抽取实体信息。
[0010]在其中一种实施例中,还包括:
[0011]执行如下迭代处理:
[0012]根据预先获取的历史文本向量和线性网络模型参数得到历史文本线性变换结果;
[0013]根据历史文本线性变换结果和实体信息抽取模型参数得到预测字符标签向量;
[0014]将历史文本向量对应的实际字符标签转换为实际字符标签向量,根据实际字符标签向量和预测字符标签向量确定损失函数;
[0015]当当前迭代次数达到迭代阈值时,根据线性网络模型参数创建线性网络模型,根
据实体信息抽取模型参数创建实体信息抽取模型,否则根据损失函数更新线性网络模型参数和实体信息抽取模型参数。
[0016]在其中一种实施例中,根据损失函数更新线性网络模型参数和实体信息抽取模型参数包括:
[0017]根据损失函数和批处理数据确定目标损失函数;
[0018]根据目标损失函数和学习率更新线性网络模型参数和实体信息抽取模型参数。
[0019]在其中一种实施例中,还包括:
[0020]根据实际字符标签向量和预测字符标签向量确定正确率数据;
[0021]根据正确率数据和损失函数更新迭代阈值、批处理数据和学习率。
[0022]本专利技术实施例还提供一种电力调度操作票实体信息抽取装置,包括:
[0023]文本向量转换模块,用于获取电力调度操作票文本,将电力调度操作票文本转换为文本向量;
[0024]字符标签模块,用于将文本向量依次输入预先创建的线性网络模型和预先创建的实体信息抽取模型中得到对应的字符标签;
[0025]实体信息抽取模块,用于根据字符标签从电力调度操作票文本抽取实体信息。
[0026]在其中一种实施例中,还包括:
[0027]历史文本线性变换结果模块,用于根据预先获取的历史文本向量和线性网络模型参数得到历史文本线性变换结果;
[0028]预测字符标签向量模块,用于根据历史文本线性变换结果和实体信息抽取模型参数得到预测字符标签向量;
[0029]损失函数模块,用于将历史文本向量对应的实际字符标签转换为实际字符标签向量,根据实际字符标签向量和预测字符标签向量确定损失函数;
[0030]迭代模块,用于当当前迭代次数达到迭代阈值时,根据线性网络模型参数创建线性网络模型,根据实体信息抽取模型参数创建实体信息抽取模型,否则根据损失函数更新线性网络模型参数和实体信息抽取模型参数。
[0031]在其中一种实施例中,迭代模块包括:
[0032]目标损失函数单元,用于根据损失函数和批处理数据确定目标损失函数;
[0033]更新单元,用于根据目标损失函数和学习率更新线性网络模型参数和实体信息抽取模型参数。
[0034]在其中一种实施例中,还包括:
[0035]正确率数据模块,用于根据实际字符标签向量和预测字符标签向量确定正确率数据;
[0036]更新模块,用于根据正确率数据和损失函数更新迭代阈值、批处理数据和学习率。
[0037]本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现所述的电力调度操作票实体信息抽取方法的步骤。
[0038]本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述的电力调度操作票实体信息抽取方法的步骤。
[0039]本专利技术实施例的电力调度操作票实体信息抽取方法及装置先将电力调度操作票
文本转换为文本向量,然后将文本向量依次输入线性网络模型和实体信息抽取模型中得到对应的字符标签,最后根据字符标签从电力调度操作票文本中快速转确地抽取实体信息。
附图说明
[0040]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1是本专利技术实施例中电力调度操作票实体信息抽取方法的流程图;
[0042]图2是本专利技术实施例中创建线性网络模型和实体信息抽取模型的流程图;
[0043]图3是本专利技术实施例中电力调度操作票实体信息抽取装置的结构框图;
[0044]图4是本专利技术实施例中计算机设备的结构框图。
具体实施方式
[0045]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0046]本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力调度操作票实体信息抽取方法,其特征在于,包括:获取电力调度操作票文本,将所述电力调度操作票文本转换为文本向量;将所述文本向量依次输入预先创建的线性网络模型和预先创建的实体信息抽取模型中得到对应的字符标签;根据所述字符标签从所述电力调度操作票文本抽取实体信息。2.根据权利要求1所述的电力调度操作票实体信息抽取方法,其特征在于,还包括:执行如下迭代处理:根据预先获取的历史文本向量和线性网络模型参数得到历史文本线性变换结果;根据所述历史文本线性变换结果和实体信息抽取模型参数得到预测字符标签向量;将历史文本向量对应的实际字符标签转换为实际字符标签向量,根据所述实际字符标签向量和所述预测字符标签向量确定损失函数;当当前迭代次数达到迭代阈值时,根据所述线性网络模型参数创建所述线性网络模型,根据所述实体信息抽取模型参数创建所述实体信息抽取模型,否则根据所述损失函数更新所述线性网络模型参数和所述实体信息抽取模型参数。3.根据权利要求2所述的电力调度操作票实体信息抽取方法,其特征在于,根据所述损失函数更新所述线性网络模型参数和所述实体信息抽取模型参数包括:根据所述损失函数和批处理数据确定目标损失函数;根据所述目标损失函数和学习率更新所述线性网络模型参数和所述实体信息抽取模型参数。4.根据权利要求3所述的电力调度操作票实体信息抽取方法,其特征在于,还包括:根据所述实际字符标签向量和所述预测字符标签向量确定正确率数据;根据所述正确率数据和所述损失函数更新所述迭代阈值、所述批处理数据和所述学习率。5.一种电力调度操作票实体信息抽取装置,其特征在于,包括:文本向量转换模块,用于获取电力调度操作票文本,将所述电力调度操作票文本转换为文本向量;字符标签模块,用于将所述文本向量依次输入预先创建的线性网络模型和预先创建的实体信息抽取模型中得到对应的字符标签;实体信息...

【专利技术属性】
技术研发人员:赵志宇赵天骐刘瑛琳王泽森梁浩张广韬梁伟宸王亚娟王长瑞李梁刘博樊淑丽李烜刘苗谢欢黄天啸
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1