一种配网电子化移交信息匹配方法及装置制造方法及图纸

技术编号:25948332 阅读:29 留言:0更新日期:2020-10-17 03:40
本申请公开了一种配网电子化移交信息匹配方法及装置,本申请提供的一种配网电子化移交的信息匹配方法,通过对接收到的移交台账文本进行文本特征提取,得到移交台账文本对应的第一稠密词向量集,然后将第一稠密词向量集与预存台账文本对应的第二稠密词向量集进行匹配,当第一稠密词向量集与第二稠密词向量集的匹配度大于预设的匹配阈值时,确定第一稠密词向量对应的移交台账文本与第二稠密词向量对应的预存台账文本为同一对象的台账文本,并对其进行关联或覆盖,避免了两个相同对象的台账文本重复录入,解决了现有的配网电子化移交工作容易出现数据重复录入的技术问题。

【技术实现步骤摘要】
一种配网电子化移交信息匹配方法及装置
本申请涉及信息处理
,尤其涉及一种配网电子化移交信息匹配方法及装置。
技术介绍
电子化移交指的是从一个系统传送数据至另一个系统,是不同系统间进行接口数据对接的一种手段。配网通信管控系统大部分的基础数据都需要通过南网SOA总线,从GIS系统和PMS系统等管理系统中接收配网通信台账信息,此过程为配网电子化移交。由于电子化移交可能存在滞后,因此现有的做法通常是在配网通信管控系统中预先录入数据,导致了正式移交时在接收相同对象电子化移交数据后,容易出现数据重复录入的技术问题。
技术实现思路
本申请提供了一种配网电子化移交信息匹配方法及装置,用于解决现有的配网电子化移交工作容易出现数据重复录入的技术问题。有鉴于此,本申请第一方面提供了一种配网电子化移交信息匹配方法,包括:接收台账源系统发送的移交台账文本;通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集;将所述第一稠密词向量集与预设的第二稠密词向量集进行匹配,其中,所述第二稠密词向量集为通过所述深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取得到的稠密词向量集合;当所述第一稠密词向量集与所述第二稠密词向量集的匹配度大于预设的第一匹配阈值时,则将所述第一稠密词向量对应的移交台账文本与所述第二稠密词向量对应的预存台账文本进行关联或覆盖。可选地,所述通过深度文本匹配模型,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集具体包括:通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第一字词特征向量;根据所述第一字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第一稠密词向量集。可选地,所述根据所述字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第一稠密词向量集之前还包括:根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第一字词特征向量进行过滤。可选地,还包括:通过深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第二字词特征向量;根据所述第二字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第二稠密词向量集。可选地,所述根据所述第二字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第二稠密词向量集之前还包括:根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第二字词特征向量进行过滤。本申请第二方面提供了一种配网电子化移交信息匹配装置,包括:移交台账接收单元,用于接收台账源系统发送的移交台账文本;第一文本特征提取单元,用于通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集;稠密向量匹配单元,用于将所述第一稠密词向量集与预设的第二稠密词向量集进行匹配,其中,所述第二稠密词向量集为通过所述深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取得到的稠密词向量集合;台账处理单元,用于当所述第一稠密词向量集与所述第二稠密词向量集的匹配度大于预设的第一匹配阈值时,则将所述第一稠密词向量对应的移交台账文本与所述第二稠密词向量对应的预存台账文本进行关联或覆盖。可选地,所述第一文本特征提取单元具体包括:第一文本特征提取子单元,用于通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第一字词特征向量;第一稠密词向量构建子单元,用于根据所述第一字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第一稠密词向量集。可选地,所述第一文本特征提取单元具体还包括:第一过滤子单元,用于根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第一字词特征向量进行过滤。可选地,还包括:第二文本特征提取单元;所述第二文本特征提取单元具体包括:第二文本特征提取子单元,用于通过深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第二字词特征向量;第二稠密词向量集构建子单元,用于根据所述第二字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第二稠密词向量集。可选地,所述第二文本特征提取单元具体还包括:第二过滤子单元,用于根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第二字词特征向量进行过滤。从以上技术方案可以看出,本申请实施例具有以下优点:本申请提供了一种配网电子化移交信息匹配方法,包括:接收台账源系统发送的移交台账文本;通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集;将所述第一稠密词向量集与预设的第二稠密词向量集进行匹配,其中,所述第二稠密词向量集为通过所述深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取得到的稠密词向量集合;当所述第一稠密词向量集与所述第二稠密词向量集的匹配度大于预设的第一匹配阈值时,则将所述第一稠密词向量对应的移交台账文本与所述第二稠密词向量对应的预存台账文本进行关联或覆盖。本申请提供的一种配网电子化移交的信息匹配方法,通过对接收到的移交台账文本进行文本特征提取,得到移交台账文本对应的第一稠密词向量集,然后将第一稠密词向量集与预存台账文本对应的第二稠密词向量集进行匹配,当第一稠密词向量集与第二稠密词向量集的匹配度大于预设的匹配阈值时,确定第一稠密词向量对应的移交台账文本与第二稠密词向量对应的预存台账文本为同一对象的台账文本,并对其进行关联或覆盖,避免了两个相同对象的台账文本重复录入,解决了现有的配网电子化移交工作容易出现数据重复录入的技术问题。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本申请提供的一种配网电子化移交的信息匹配方法的第一个实施例的流程示意图;图2为本申请提供的一种配网电子化移交的信息匹配方法的第二个实施例的流程示意图;图3为本申请提供的一种配网电子化移交的信息匹配装置的一个实施例的结构示意图。具体实施方式本申请实施例提供了一种配网电子化移交信息匹配方法及装置,用于解决现有的配网电子化移交工作容易出现数据重复录入的技术问题。为使得本申请的专利技术目的、特征、优点能够更加的本文档来自技高网...

【技术保护点】
1.一种配网电子化移交信息匹配方法,其特征在于,包括:/n接收台账源系统发送的移交台账文本;/n通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集;/n将所述第一稠密词向量集与预设的第二稠密词向量集进行匹配,其中,所述第二稠密词向量集为通过所述深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取得到的稠密词向量集合;/n当所述第一稠密词向量集与所述第二稠密词向量集的匹配度大于预设的第一匹配阈值时,则将所述第一稠密词向量对应的移交台账文本与所述第二稠密词向量对应的预存台账文本进行关联或覆盖。/n

【技术特征摘要】
1.一种配网电子化移交信息匹配方法,其特征在于,包括:
接收台账源系统发送的移交台账文本;
通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集;
将所述第一稠密词向量集与预设的第二稠密词向量集进行匹配,其中,所述第二稠密词向量集为通过所述深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取得到的稠密词向量集合;
当所述第一稠密词向量集与所述第二稠密词向量集的匹配度大于预设的第一匹配阈值时,则将所述第一稠密词向量对应的移交台账文本与所述第二稠密词向量对应的预存台账文本进行关联或覆盖。


2.根据权利要求1所述的一种配网电子化移交信息匹配方法,其特征在于,所述通过深度文本匹配模型,对所述移交台账文本中的各个字词进行特征提取,得到第一稠密词向量集具体包括:
通过深度文本匹配方式,对所述移交台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第一字词特征向量;
根据所述第一字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第一稠密词向量集。


3.根据权利要求2所述的一种配网电子化移交信息匹配方法,其特征在于,所述根据所述字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第一稠密词向量集之前还包括:
根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第一字词特征向量进行过滤。


4.根据权利要求1所述的一种配网电子化移交信息匹配方法,其特征在于,还包括:
通过深度文本匹配方式,对保存在配网通信管控系统中的预存台账文本中的各个字词进行特征提取,得到与所述各个字词对应的第二字词特征向量;
根据所述第二字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第二稠密词向量集。


5.根据权利要求4所述的一种配网电子化移交信息匹配方法,其特征在于,所述根据所述第二字词特征向量以及各个所述字词特征向量的出现频率,建立稠密向量矩阵,得到所述第二稠密词向量集之前还包括:
根据预置的字词过滤信息,对所述字词过滤信息中包含的目标字词对应的所述第二字词特征向量进行过滤。


6.一种配网电子化移交信息匹配...

【专利技术属性】
技术研发人员:亢中苗许世纳张珮明吴赞红林斌
申请(专利权)人:广东电网有限责任公司电力调度控制中心
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1