数据融合处理方法、装置、设备和存储介质制造方法及图纸

技术编号:26791307 阅读:13 留言:0更新日期:2020-12-22 17:06
本申请提供一种数据融合处理方法、装置、设备和存储介质,其中,方法包括:利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路数据源的投票结果,其中,投票目标集合中包括至少一个投票目标,投票目标为待验证的基础数据;根据每一路数据源的投票结果,确定每一路数据源的投票权重;根据各路数据源的投票权重,对数据源进行融合处理,得到融合数据。根据确定出的投票权重,对数据源进行融合处理,能够有效消除因数据源局部差异,造成的数据融合结果偏向显著的问题;当数据源发生更新时,数据源针对投票目标投出的投票结果发生变化,数据源的投票权重做出适应性的动态调整,数据融合时效性良好,有利于获得相对客观公平的融合数据。

【技术实现步骤摘要】
数据融合处理方法、装置、设备和存储介质
本申请涉及数据处理领域,尤其涉及一种数据融合处理方法、装置、设备和存储介质。
技术介绍
在利用数据分析技术完成决策和评估任务时,需要对获得的同类型多路数据源进行融合处理,得到用于表征所有数据源的融合数据。现有技术中,数据融合方法主要包括投票法和加权法。投票法是指利用先验知识,对各路数据源进行投票,取得票数最多的数据源作为最终的融合数据。加权法是指预先对各数据源指定一个固定的权重值,然后基于该权重值对各路数据源进行加权合并,得到融合数据。然而,在利用投票法进行数据融合处理时,没有考虑到数据源发生变化时权重变换的问题,容易出现数据融合结果偏向显著、稳定性差的问题;在利用加权法进行数据融合处理时,预先对各数据源指定一个固定的权重值,容易出现权重设置不合理、权重设置时效性差的问题。上述两种处理方法得到的数据融合结果都存在相对误差大、稳定性弱、客观性难以保证的缺陷。
技术实现思路
本申请提供一种数据融合处理方法、装置、设备和存储介质,用以解决现有数据融合结果误差大、稳定性弱的问题。第一方面,本申请提供一种数据融合处理方法,包括:利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路所述数据源的投票结果,其中,所述投票目标集合中包括至少一个投票目标,所述投票目标为待验证的基础数据;根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重;根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据。进一步地,每一路所述数据源的投票结果包括有效投票的集合和正确投票的集合,其中,所述有效投票的集合包括所述数据源对所述投票目标集合投出的赞成票和/或反对票。进一步地,每一路所述数据源具有第一偏序方向,所述投票目标具有第二偏序方向;利用多路待融合的数据源,对投票目标进行投票处理,得到每一路所述数据源的投票结果,包括:当所述第一偏序方向与所述第二偏序方向一致时,确定所述数据源对所述投票目标投赞成票;当所述第一偏序方向与所述第二偏序方向相反时,确定所述数据源对所述投票目标投反对票;其中,所述第一偏序方向为所述数据源的偏序关系,所述第二偏序方向为所述基础数据的偏序关系。进一步地,所述正确投票为:每一个所述投票目标对应的所有有效投票中,票数占比超过半数的赞成票,或者,票数占比超过半数的反对票。进一步地,根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重,包括:确定每一路所述数据源的所述正确投票数占所述有效投票数的比重,为所述数据源的投票权重;或者,根据每一路所述数据源的所述正确投票数占所述有效投票数的比重,确定所述比重所在的取值区间,根据预设的投票权重与所述取值区间的对应关系,确定所述数据源的投票权重。进一步地,根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据,包括:对每一路所述数据源的结果得分进行归一化处理,得到每一路所述数据源的归一化结果得分,其中,所述结果得分用于描述所述数据源的第一偏序方向的概率分布;根据每一路所述数据源的所述归一化结果得分和所述投票权重,得到融合结果得分;根据所述融合结果得分,对所述数据源进行融合处理,得到融合数据,其中,所述融合数据的偏序方向由所述融合结果得分决定。进一步地,根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重,包括:将每一路所述数据源针对每一个所述投票目标的投票结果进行累加处理,得到每一路所述数据源的总投票结果;根据每一路所述数据源的所述总投票结果,确定每一路所述数据源的投票权重。第二方面,本申请提供一种数据融合处理装置,包括:第一处理单元,用于利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路所述数据源的投票结果,其中,所述投票目标集合中包括至少一个投票目标,所述投票目标为待验证的基础数据;第二处理单元,用于根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重;第三处理单元,用于根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据。进一步地,每一路所述数据源的投票结果包括有效投票的集合和正确投票的集合,其中,所述有效投票的集合包括所述数据源对所述投票目标集合投出的赞成票和/或反对票。进一步地,每一路所述数据源具有第一偏序方向,所述投票目标具有第二偏序方向,其特征在于,所述第一处理单元,包括:第一处理子单元,用于当所述第一偏序方向与所述第二偏序方向一致时,确定所述数据源对所述投票目标投赞成票;第二处理子单元,当所述第一偏序方向与所述第二偏序方向相反时,确定所述数据源对所述投票目标投反对票,其中,所述第一偏序方向为所述数据源的偏序关系,所述第二偏序方向为所述基础数据的偏序关系。进一步地,所述第一处理单元,还包括:第三处理子单元,用于在每一个所述投票目标对应的所有有效投票中,确定票数占比超过半数的赞成票,或者,票数占比超过半数的反对票为所述正确投票。进一步地,所述第二处理单元,包括:第一处理子单元,用于确定每一路所述数据源的所述正确投票数占所述有效投票数的比重,为所述数据源的投票权重;或者,用于根据每一路所述数据源的所述正确投票数占所述有效投票数的比重,确定所述比重所在的取值区间,根据预设的投票权重与所述取值区间的对应关系,确定所述数据源的投票权重。进一步地,所述第三处理单元,包括:第一处理子单元,用于对每一路所述数据源的结果得分进行归一化处理,得到每一路所述数据源的归一化结果得分,其中,所述结果得分用于描述所述数据源的第一偏序方向的概率分布;第二处理子单元,用于根据每一路所述数据源的所述归一化结果得分和所述投票权重,得到融合结果得分;第三处理子单元,用于根据所述融合结果得分,对所述数据源进行融合处理,得到融合数据,其中,所述融合数据的偏序方向由所述融合结果得分决定。进一步地,利用多路待融合的数据源,对至少一个投票目标进行投票处理,所述第二处理单元,还包括:第二处理子单元,用于对每一路所述数据源针对每一个所述投票目标的投票结果进行累加处理,得到每一路所述数据源的总投票结果;第三处理子单元,用于根据每一路所述数据源的所述总投票结果,确定每一路所述数据源的投票权重。第三方面,本申请提供一种数据融合处理设备,包括:处理器、存储器以及计算机程序;其中,计算机程序存储在存储器中,并被配置为由处理器执行以实现如上任一项的方法。第四方面,本申请提供一种计算机可读存储介质,其特征在于,其上存储有计算机程序,计算机程序被处理器执行以实现如上任一项的方法。本申请提供的数据融合处理方法、装置、设备和存储介质,根据每一路数据源的投票权重,对数据源进行加权合并处理,得到融合数据。因计算策略不同、采集精度不同、设备工况差异等原因造成的数据源差异,通过对数据源进行融本文档来自技高网...

【技术保护点】
1.一种数据融合处理方法,其特征在于,包括:/n利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路所述数据源的投票结果,其中,所述投票目标集合中包括至少一个投票目标,所述投票目标为待验证的基础数据;/n根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重;/n根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据。/n

【技术特征摘要】
1.一种数据融合处理方法,其特征在于,包括:
利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路所述数据源的投票结果,其中,所述投票目标集合中包括至少一个投票目标,所述投票目标为待验证的基础数据;
根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重;
根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据。


2.根据权利要求1所述的方法,其特征在于,每一路所述数据源的投票结果包括有效投票的集合和正确投票的集合,其中,所述有效投票的集合包括所述数据源对所述投票目标集合投出的赞成票和/或反对票。


3.根据权利要求2所述的方法,其特征在于,每一路所述数据源具有第一偏序方向,所述投票目标具有第二偏序方向;利用多路待融合的数据源,对投票目标进行投票处理,得到每一路所述数据源的投票结果,包括:
当所述第一偏序方向与所述第二偏序方向一致时,确定所述数据源对所述投票目标投赞成票;
当所述第一偏序方向与所述第二偏序方向相反时,确定所述数据源对所述投票目标投反对票;
其中,所述第一偏序方向为所述数据源的偏序关系,所述第二偏序方向为所述基础数据的偏序关系。


4.根据权利要求2所述的方法,其特征在于,所述正确投票为:每一个所述投票目标对应的所有有效投票中,票数占比超过半数的赞成票,或者,票数占比超过半数的反对票。


5.根据权利要求2所述的方法,其特征在于,根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重,包括:
确定每一路所述数据源的所述正确投票数占所述有效投票数的比重,为所述数据源的投票权重;
或者,根据每一路所述数据源的所述正确投票数占所述有效投票数的比重,确定所述比重所在的取值区间,根据预设的投票权重与所述取值区间的对应关系,确定所述数据源的投票权重。


6.根据权利要求1所述的方法,其特征在于,根据各路数据源的投票权重,对所述数据源进行融合处理,得到融合数据,包括:
对每一路所述数据源的结果得分进行归一化处理,得到每一路所述数据源的归一化结果得分,其中,所述结果得分用于描述所述数据源的第一偏序方向的概率分布;
根据每一路所述数据源的所述归一化结果得分和所述投票权重,得到融合结果得分;
根据所述融合结果得分,对所述数据源进行融合处理,得到融合数据,其中,所述融合数据的偏序方向由所述融合结果得分决定。


7.根据权利要求1-6任一项所述的方法,其特征在于,根据每一路所述数据源的投票结果,确定每一路所述数据源的投票权重,包括:
将每一路所述数据源针对每一个所述投票目标的投票结果进行累加处理,得到每一路所述数据源的总投票结果;
根据每一路所述数据源的所述总投票结果,确定每一路所述数据源的投票权重。


8.一种数据融合处理装置,其特征在于,包括:
第一处理单元,用于利用多路待融合的数据源,对投票目标集合进行投票处理,得到每一路所述数据源的投票结果,其中,所述投票目标集合中包括至少一个投票目标,所述投票目标为待验证的基础数据...

【专利技术属性】
技术研发人员:陈冠霖李世雷王轶凡张钋
申请(专利权)人:百度中国有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1