一种传感数据的聚类分析方法和系统技术方案

技术编号:8883205 阅读:178 留言:0更新日期:2013-07-04 02:03
本发明专利技术公开了一种传感数据的实时聚类分析方法和系统,可以在传感数据中添加可信度信息,并构造了一个可描述可信度信息的微簇聚类特征,根据该微簇聚类特征可对传感数据进行聚类划分,获得实时分析结果。本发明专利技术的方法在聚类特征更新时不需访问历史传感数据,从而保证了该方法的实时性,更适用于数据量较大且对实时性有一定要求的信息处理系统。

【技术实现步骤摘要】

本专利技术涉及聚类分析
,特别是涉及一种传感数据的聚类分析方法和系统
技术介绍
随着物联网的发展,传感器的使用也越来越普遍。在获得传感器的数据后,需要对传感数据进行分析处理,以获得有用的信息。现有的对传感数据分析处理的方法之一是聚类分析法,聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。传统的聚类分析方法中最重要的是划分方法(partitioning methods)。划分方法给定一个有N个元组或者纪录的数据集,将数据集构造K个分组,每一个分组就代表一个聚类,K<N且K和N均为自然数。对传感数据进行划分后,就可以生成多个微簇,然后从微簇中获得微簇特征信息,根据分析目的对微簇特征信息进行分析就可以得到所需要的分析结果。然而,由于传感数据本身的噪声以及来自于基础采集及数模转换设备的数据误差,传感数据的存在一定的不确定性,这也导致了聚类分析方法的分析结果准确性降低。
技术实现思路
为解决上述技术问题,本专利技术实施例提供一种传感数据的聚类分析方法和系统,以解决现有技术下分析结果准确性低的问题,技术方案如下:—种传感数据的实时聚类分析方法,包括:在传感数据中添加可信度描述信息;根据所述可信度描述信息对所述传感数据进行实时聚类划分处理,划分到微簇中;获得所述微簇的聚类特征;将所述传感数据划分结果和所述微簇的聚类特征作为第一分析结果进行输出。优选的,当所述传感数据为传感器直接采集获取的数据时,所述可信度描述信息为所述传感器的精度描述信息或所述传感器观测粒度的数值描述信息;当所述传感数据为添加了人为扰动的隐私数据时,所述可信度描述信息为扰动程度的数值描述信息;当所述传感数据为智能系统或知识系统中经主观研判生成的数据,或语义网中基于自然语言理解产生的数据时,所述可信度描述信息为相应隶属度信息。优选的,当不存在历史传感数据组成的微簇时,根据所述可信度描述信息对所述传感数据进行实时聚类划分处理,划分到微簇中,具体包括:获得用户预设的微簇聚类特征;根据所述用户预设的微簇聚类特征对添加有所述可信度描述信息的传感数据进行实时聚类划分处理,划分到新建的微簇中。优选的,当存在历史传感数据组成的微簇时,根据所述可信度描述信息对所述传感数据进行实时聚类划分处理,划分到微簇中,具体包括:获得历史传感数据组成的微簇的微簇聚类特征;根据所述历史传感数据组成的微簇的微簇聚类特征,对添加有可信度描述信息的传感数据进行划分,划分到所述历史传感数据组成的微簇中。优选的,还包括:对所述微簇的聚类特征进行离线分析,获得第二分析结果。优选的,对所述微簇的聚类特征进行离线分析,获得第二分析结果,包括:根据预先设定的信息处理任务和目标,使用所述微簇的聚类特征对历史传感数据进行索引,得到相关传感数据;对所述相关传感数据进行离线分析,获得第二分析结果。优选的,当存在历史传感数据组成的微簇时,获得所述微簇的聚类特征,具体包括:根据所述历史传感数据的生成时间与当前时间的时间间隔为所述历史传感数据添加衰减权重;从微簇中删除衰减权重小于第一阈值的所述历史传感数据;根据微簇中剩余的历史传感数据和新划分的传感数据对微簇的聚类特征进行更新,获得所述微簇的聚类特征。优选的,所述微簇的聚类特征,包括:传感数据的可信度信息加权的多阶矩向量、可信度信息的多阶矩向量、微簇更新的时间戳信息和微簇包含数据点个数。本专利技术还提供了一种传感数据的实时聚类分析系统,包括:可信度描述信息添加模块、实时划分模块、聚类特征获得模块和第一分析模块,所述可信度描述信息添加模块,用于在传感数据中添加可信度描述信息;所述实时划分模块,用于根据所述可信度描述信息对所述传感数据进行实时聚类划分处理,划分到微簇中;聚类特征获得模块,用于获得所述微簇的聚类特征;第一分析模块,将所述传感数据划分结果和所述微簇的聚类特征作为第一分析结果进行输出。优选的,还包括:第二分析模块,用于对所述微簇的聚类特征进行离线分析,获得第二分析结果。 优选的,所述第二分析模块,包括:数据索引模块,用于根据预先设定的信息处理任务和目标,使用所述微簇的聚类特征对历史传感数据进行索引,得到相关传感数据;离线分析模块,用于对所述相关传感数据进行离线分析,获得第二分析结果。优选的,当存在历史传感数据组成的微簇时,所述聚类特征获得模块,具体包括:衰减权重添加模块,用于根据所述历史传感数据的生成时间与当前时间的时间间隔为所述历史传感数据添加衰减权重;数据删除模块,用于从微簇中删除衰减权重小于第一阈值的所述历史传感数据;聚类特征更新模块,用于根据微簇中剩余的历史传感数据和新划分的传感数据对微簇的聚类特征进行更新,获得所述微簇的聚类特征。通过应用以上技术方案,本专利技术提供的一种传感数据的聚类分析方法和系统,可以在传感数据中添加可信度信息,并根据可信度信息对传感数据进行聚类划分,并对生成的微簇进行分析,获得分析结果。因为本专利技术在传感数据中增加了传感数据的可信度信息,并将其作为微簇的一个特征,因此本专利技术可以获得与传感数据可信度有关的分析结果,可以有效提高分析结果的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种传感数据的聚类分析方法的流程示意图;图2为本专利技术实施例提供的一种微簇的示意图;图3为本专利技术实施例提供的另一种传感数据的聚类分析方法的流程示意图;图4为本专利技术实施例提供的一种传感数据的聚类分析系统的结构示意图;图5为本专利技术实施例提供的另一种传感数据的聚类分析系统中聚类特征获得模块的结构示意图;图6为本专利技术实施例提供的另一种传感数据的聚类分析系统的结构示意图;图7为本专利技术实施例提供的另一种传感数据的聚类分析系统中第二分析模块的结构示意图。具体实施例方式为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。如图1所示,本专利技术实施例提供的一种传感数据的聚类分析方法,包括:S101、在传感数据中添加可信度描述信息;其中,可信度描述信息是指作为一种用于描述对象感知程度的定量度量,例如传感器精度、观测粒度、数据挖掘级别、预测复杂度、语义隶属度等。需针对不同情况及处理任务合理确定可信度信息指标,例如在语义网使用场景中,主观概率描述的推理判断预测的不确定性,以及不同人对自然语言理解产生的不确定性等,可采用模糊数学中的隶属度指标进行描述,从而将传感数据转化为模糊数据流,在其每一元组中增加时间戳和隶属度信息。对于实际数据流应用中来自智能系统主观研判的结果,可自然的获得隶属度信息,对于客观观测结果或其他基于概率的统计结果组成的数据流,可利用模糊数学中相关理论,如随机落影理论,进行转本文档来自技高网
...

【技术保护点】
一种传感数据的实时聚类分析方法,其特征在于,包括:在传感数据中添加可信度描述信息;根据所述可信度描述信息对所述传感数据进行实时聚类划分处理,划分到微簇中;获得所述微簇的聚类特征;将所述传感数据划分结果和所述微簇的聚类特征作为第一分析结果进行输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:王彦哲潘强沈杰刘海涛
申请(专利权)人:无锡物联网产业研究院感知物联网集团无锡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1