一种关联度计算方法及装置制造方法及图纸

技术编号:15640812 阅读:293 留言:0更新日期:2017-06-16 08:16
本发明专利技术提供了一种关联度计算方法及装置,该方法包括:从后台数据库中调取至少两个用电客户的电力数据,并从各个用电客户中确定一个目标客户和至少一个对比客户,电力数据包括客户信息以及客户用电信息;针对每一个对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;针对每一个对比客户,根据单因子匹配相似度和多因子复合相似度及其各自对应的权重值,计算与目标客户之间的关联度。基于本发明专利技术公开的方法实现了同时对大量的电力数据进行关联性度量,同时,由于从客户信息和用电信息两个方面进行了综合计算,也保证了计算的精确度。

【技术实现步骤摘要】
一种关联度计算方法及装置
本专利技术涉及电力
,更具体地说,涉及一种关联度计算方法及装置。
技术介绍
近年来,随着电力业务的不断发展,国家电网公司积累了大量的电力客户。传统的电力客户管理模式主要是对客户进行单点服务,较少关注客户之间的相关性,这就会导致公司对于客户信息把握不全面并且工作效率低下。目前,对电力客户之间关联性主要是专家利用自身经验人为度量,但是,随着业务规模扩大,电力数据也在不断增加,这种人为识别的方式所需的工作量和工作难度会大大增加。
技术实现思路
有鉴于此,本专利技术提供关联度计算方法及装置,以解决现有人为识别电力客户之间关联性所需的工作量和工作难度会大大增加的问题。技术方案如下:一种关联度计算方法,包括:从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。优选的,所述根据对比客户信息和目标客户信息计算单因子匹配相似度,包括:分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;分别解析所述对比客户指标集合和所述目标客户指标集合中包含的各个指标,得到对应的指标类型,所述指标类型为纯文本型、具有层次性结构的文本型或数值型;根据所述指标类型对所述对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据所述指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;计算所述对比客户纯文本型指标集合和所述目标客户纯文本型指标集合的文本相似度,并判断所述文本相似度是否为0;当所述文本相似度为0时,确定单因子匹配相似度为0;当所述文本相似度不为0时,计算所述对比客户具有层次性结构的文本型指标集合和所述目标客户具有层次性结构的文本型指标集合的层级相似度,并判断所述层级相似度是为0;当所述层级相似度为0时,将所述文本相似度确定为单因子匹配相似度;当所述层级相似度不为0时,计算所述对比客户数值型指标集合和所述目标客户数值型指标集合的数值相似度;根据所述文本相似度、所述层级相似度和所述数值相似度及其各自对应的权重值,计算单因子匹配相似度。优选的,所述根据对比客户用电信息和目标客户用电信息计算多因子复合相似度,包括:根据对比客户用电信息和目标客户用电信息判断所述对比客户和所述目标客户是否属于同一用电类别客户;当所述对比客户和所述目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;当所述对比客户和所述目标客户属于同一用电类别客户时,从所述对比客户用电信息中获取所述对比客户的对比用电量信息以及对比信用信息,同时,从所述目标客户用电信息中获取所述目标客户的目标用电量信息以及目标信用信息;根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,同时,根据所述对比信用信息和所述目标信用信息确定信用维度相似度;根据所述用电维度相似度和所述信用维度相似度及其各自对应的权重值,计算多因子复合相似度。优选的,所述根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,包括:分别从所述对比用电量信息和所述目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;针对所述对比用电曲线和所述目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据所述曲线端点的位置值确定各个所述曲线采样点的位置值;根据所述对比用电曲线上的各个所述曲线采样点的用电量指标值和所述目标用电曲线上的各个所述曲线采样点的用电量指标值,计算曲线数值相似度;依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度;根据所述曲线数值相似度和所述曲线形状相似度及其各自对应的权重值,计算用电维度相似度。优选的,所述依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度,包括:根据所述对比用电曲线上的各个所述曲线采样点的位置值计算所述对比用电曲线的质心位置值,同时,根据所述目标用电曲线上的各个所述曲线采样点的位置值计算所述目标用电曲线的质心位置值,所述质心用于表征曲线中心点;针对所述对比用电曲线和所述目标用电曲线,根据对应的各个所述质心向量计算各个所述曲线采样点的质心距离增量;针对所述对比用电曲线和所述目标用电曲线,依据对应的各个所述质心距离增量构建曲线质心增量矩阵;根据所述对比用电曲线的曲线质心增量矩阵和所述目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。一种关联度计算装置,包括:客户确定模块、相似度计算模块和关联度计算模块;所述客户确定模块,用于从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;所述相似度计算模块,用于针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;所述关联度计算模块,用于针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。优选的,所述相似度计算模块包括:单因子匹配相似度计算模块;所述单因子匹配相似度计算模块包括指标集合获取单元、解析单元、指标集合划分单元、文本相似度计算判断单元、第一确定单元、层级相似度计算判断单元、第二确定单元、数值相似度计算单元和单因子匹配相似度计算单元;所述指标集合获取单元,用于分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;所述解析单元,用于分别解析所述对比客户指标集合和所述目标客户指标集合中包含的各个指标,得到对应的指标类型,所述指标类型为纯文本型、具有层次性结构的文本型或数值型;所述指标集合划分单元,用于根据所述指标类型对所述对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据所述指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;所述文本相似度计算判断单元,用于计算所述对比客户纯文本型指标集合和所述目标客户纯文本型指标集合的文本相似度,并判断所述文本相似度是否为0;所述第一确定单元,用于当所述文本相似度为0时,确定单因子匹配相似度为0;所述层级相似度计算判断单元,用于当所述文本相似度不为0时,计算所述对比客户具有层次性结构的文本型指标集合和所述目标客户具有层次性结构的文本型指标集合的层级相似度,并判断所述层级相似度是为0;所述第二确定单元,用于当所述层级相似度为0本文档来自技高网...
一种关联度计算方法及装置

【技术保护点】
一种关联度计算方法,其特征在于,包括:从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。

【技术特征摘要】
1.一种关联度计算方法,其特征在于,包括:从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。2.根据权利要求1所述的方法,其特征在于,所述根据对比客户信息和目标客户信息计算单因子匹配相似度,包括:分别从对比客户信息和目标客户信息中获取对比客户指标集合和目标客户指标集合;分别解析所述对比客户指标集合和所述目标客户指标集合中包含的各个指标,得到对应的指标类型,所述指标类型为纯文本型、具有层次性结构的文本型或数值型;根据所述指标类型对所述对比客户指标集合进行划分,得到对比客户纯文本型指标集合、对比客户具有层次性结构的文本型指标集合和对比客户数值型指标集合,同时,根据所述指标类型对所述目标客户指标集合进行划分,得到目标客户纯文本型指标集合、目标客户具有层次性结构的文本型指标集合和目标客户数值型指标集合;计算所述对比客户纯文本型指标集合和所述目标客户纯文本型指标集合的文本相似度,并判断所述文本相似度是否为0;当所述文本相似度为0时,确定单因子匹配相似度为0;当所述文本相似度不为0时,计算所述对比客户具有层次性结构的文本型指标集合和所述目标客户具有层次性结构的文本型指标集合的层级相似度,并判断所述层级相似度是为0;当所述层级相似度为0时,将所述文本相似度确定为单因子匹配相似度;当所述层级相似度不为0时,计算所述对比客户数值型指标集合和所述目标客户数值型指标集合的数值相似度;根据所述文本相似度、所述层级相似度和所述数值相似度及其各自对应的权重值,计算单因子匹配相似度。3.根据权利要求1所述的方法,其特征在于,所述根据对比客户用电信息和目标客户用电信息计算多因子复合相似度,包括:根据对比客户用电信息和目标客户用电信息判断所述对比客户和所述目标客户是否属于同一用电类别客户;当所述对比客户和所述目标客户不属于同一用电类别客户时,确定多因子复合相似度为0;当所述对比客户和所述目标客户属于同一用电类别客户时,从所述对比客户用电信息中获取所述对比客户的对比用电量信息以及对比信用信息,同时,从所述目标客户用电信息中获取所述目标客户的目标用电量信息以及目标信用信息;根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,同时,根据所述对比信用信息和所述目标信用信息确定信用维度相似度;根据所述用电维度相似度和所述信用维度相似度及其各自对应的权重值,计算多因子复合相似度。4.根据权利要求3所述的方法,其特征在于,所述根据所述对比用电量信息和所述目标用电量信息计算用电维度相似度,包括:分别从所述对比用电量信息和所述目标用电量信息中获取对比用电量指标值集合和目标用电量指标值集合,并生成相应的对比用电曲线和目标用电曲线;针对所述对比用电曲线和所述目标用电曲线,选取曲线端点和至少一个曲线采样点,并根据所述曲线端点的位置值确定各个所述曲线采样点的位置值;根据所述对比用电曲线上的各个所述曲线采样点的用电量指标值和所述目标用电曲线上的各个所述曲线采样点的用电量指标值,计算曲线数值相似度;依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度;根据所述曲线数值相似度和所述曲线形状相似度及其各自对应的权重值,计算用电维度相似度。5.根据权利要求4所述的方法,其特征在于,所述依据所述对比用电曲线上的各个所述曲线采样点的位置值和所述目标用电曲线上的各个所述曲线采样点的位置值,计算曲线形状相似度,包括:根据所述对比用电曲线上的各个所述曲线采样点的位置值计算所述对比用电曲线的质心位置值,同时,根据所述目标用电曲线上的各个所述曲线采样点的位置值计算所述目标用电曲线的质心位置值,所述质心用于表征曲线中心点;针对所述对比用电曲线和所述目标用电曲线,根据对应的各个所述质心向量计算各个所述曲线采样点的质心距离增量;针对所述对比用电曲线和所述目标用电曲线,依据对应的各个所述质心距离增量构建曲线质心增量矩阵;根据所述对比用电曲线的曲线质心增量矩阵和所述目标用电曲线的曲线质心增量矩阵,计算曲线形状相似度。6.一种关联度计算装置,其特征在于,包括:客户确定模块、相似度计算模块和关联度计算模块;所述客户确定模块,用于从后台数据库中调取至少两个用电客户的电力数据,并从各个所述用电客户中确定一个目标客户和至少一个对比客户,所述电力数据包括客户信息以及客户用电信息;所述相似度计算模块,用于针对每一个所述对比客户,根据对比客户信息和目标客户信息计算单因子匹配相似度,同时,根据对比客户用电信息和目标客户用电信息计算多因子复合相似度;所述关联度计算模块,用于针对每一个所述对比客户,根据所述单因子匹配相似度和所述多因子复合相似度及其各自对应的权重值,计算与所述目标客户之间的关联度。...

【专利技术属性】
技术研发人员:陈雁赵加奎金备王峰欧阳红朱平飞袁葆刘玉玺王树龙卢耀宗
申请(专利权)人:北京中电普华信息技术有限公司国网安徽省电力公司国网信息通信产业集团有限公司国家电网公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1