A guide section skeleton parallel coordinates view clustering data binding method, through the design of innovative binding method, improved binding line layout, solve the distribution of the data and the possible existing parallel coordinates method in clustering binding cause visual cognitive bias problem.
【技术实现步骤摘要】
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法
本专利技术涉及高维数据可视化绘制领域,具体说的是一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法。
技术介绍
1)大数据可视化:数据可视化是计算机图形学领域的重要组成部分,通过可视化方法设计,将数据以二维或三维图形的形式绘制并呈现,通过视觉认知通道帮助用户完成对信息的理解和分析。2)平行坐标系视图:(ParallelCoordinatesPlot,PCP)是高维大数据可视化绘制的主要方式之一。可以将多属性的高维数据映射在多个坐标轴平行排列的二维平面上,帮助用户进行数据分析。PCP视图的基本问题之一是如何解决大量数据线之间的视觉杂乱干扰。3)聚类(cluster):基于某一标准,让计算机自动将数据集合聚拢为若干个相互独立的簇(类别)。聚类方法应用于PCP视图可以辅助用户完成数据的预处理分析。4)绑定(Bundling):通过绑定方法,将同类的数据线聚拢,聚类之间的线束分离开,可有效减少PCP视图的视觉杂乱,提升簇间的辨识度。聚类数据的绑定技术现状:PCP视图聚类数据可视化的方法,主要有绑定和力场作用等方法.Luo提出的将数据线由多段折线改为三次贝塞尔曲线绘制,解决了折线在视觉上不连贯的问题.Luo提出的PCP视图曲线绑定方法,通过对簇内曲线添加引力场将线束在中部进行绑定,并将各聚类线束在坐标轴高度范围内均分排布以增大簇间距离,明显提升了聚类数据的视觉辨识度.Johansson和Ljung等提出用高精度纹理来绘制聚类曲线,并通过变换函数将聚类线束转换为色彩编码的彩带,以帮助用户识别聚类数据.此外,HongZ ...
【技术保护点】
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,其特征在于:包括以下步骤,步骤一、采集多个数据样本,采用K均值方法或自组织映射方法对数据样本进行聚类分析,并根据聚类结果对数据进行类别标记,得到的聚类的类别数记为N,每个聚类中包含的样本数据的数量记为n;步骤二、根据各个聚类的包含的样本数据,计算得到每个聚类的中心,作为该聚类线束聚拢的基准,即每个聚类中心的初始位置,也称作骨骼;步骤三、根据坐标轴的高度Height和聚类的数量N,计算出簇间的平衡距离K,计算模型为:
【技术特征摘要】
1.一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,其特征在于:包括以下步骤,步骤一、采集多个数据样本,采用K均值方法或自组织映射方法对数据样本进行聚类分析,并根据聚类结果对数据进行类别标记,得到的聚类的类别数记为N,每个聚类中包含的样本数据的数量记为n;步骤二、根据各个聚类的包含的样本数据,计算得到每个聚类的中心,作为该聚类线束聚拢的基准,即每个聚类中心的初始位置,也称作骨骼;步骤三、根据坐标轴的高度Height和聚类的数量N,计算出簇间的平衡距离K,计算模型为:其中,t为用于控制簇间距离的尺度的调节因子;步骤四、基于改进的力导向算法,进行各个聚类中心的布局计算,设有两个聚类P和Q,两聚类中心的距离记为dist(P,Q),1)如果两簇之间的现有距离dist(P,Q)>平衡距离K,则不再施加力场效应;2)如果两簇之间的现有距离dist(P,Q)<平衡距离K,则为聚类中心添加斥力场算法,P,Q两聚类中心之间的斥力记为Fr(P,Q),斥力效应与两中心之间距离成反比,距离越近,排斥力越大;斥力计算模型:3)为聚类中心添加引力场算法,模拟各聚类中心受自身初始位置的引力约束效应,将约束引力设置在偏移后的聚类中心与其自身的初始位置之间,聚类中心受到自身初始位置的约束引力记为Fa,引力效应与中心偏离自身初始位置的距离△成正比,偏离距离△越大,引力Fa越大,设聚类P的中心在斥力作用下的偏移量为△P,达到均衡位置时的均衡距离为Kp,聚类中心受到自身初始位置的约束引力为Fa(P);则聚类P的中心受到的约束引力为:同理,聚类...
【专利技术属性】
技术研发人员:巫滨,曹卫群,李苏南,杨波,
申请(专利权)人:北京林业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。