一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法技术

技术编号:15437956 阅读:216 留言:0更新日期:2017-05-26 03:57
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,通过绑定方法创新设计,改善了绑定后的线型布局,解决了现有平行坐标系聚类绑定方法中可能对数据的分布特征造成视觉认知偏差的问题。

A method of clustering data binding in parallel coordinate system view of force oriented segmented bones

A guide section skeleton parallel coordinates view clustering data binding method, through the design of innovative binding method, improved binding line layout, solve the distribution of the data and the possible existing parallel coordinates method in clustering binding cause visual cognitive bias problem.

【技术实现步骤摘要】
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法
本专利技术涉及高维数据可视化绘制领域,具体说的是一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法。
技术介绍
1)大数据可视化:数据可视化是计算机图形学领域的重要组成部分,通过可视化方法设计,将数据以二维或三维图形的形式绘制并呈现,通过视觉认知通道帮助用户完成对信息的理解和分析。2)平行坐标系视图:(ParallelCoordinatesPlot,PCP)是高维大数据可视化绘制的主要方式之一。可以将多属性的高维数据映射在多个坐标轴平行排列的二维平面上,帮助用户进行数据分析。PCP视图的基本问题之一是如何解决大量数据线之间的视觉杂乱干扰。3)聚类(cluster):基于某一标准,让计算机自动将数据集合聚拢为若干个相互独立的簇(类别)。聚类方法应用于PCP视图可以辅助用户完成数据的预处理分析。4)绑定(Bundling):通过绑定方法,将同类的数据线聚拢,聚类之间的线束分离开,可有效减少PCP视图的视觉杂乱,提升簇间的辨识度。聚类数据的绑定技术现状:PCP视图聚类数据可视化的方法,主要有绑定和力场作用等方法.Luo提出的将数据线由多段折线改为三次贝塞尔曲线绘制,解决了折线在视觉上不连贯的问题.Luo提出的PCP视图曲线绑定方法,通过对簇内曲线添加引力场将线束在中部进行绑定,并将各聚类线束在坐标轴高度范围内均分排布以增大簇间距离,明显提升了聚类数据的视觉辨识度.Johansson和Ljung等提出用高精度纹理来绘制聚类曲线,并通过变换函数将聚类线束转换为色彩编码的彩带,以帮助用户识别聚类数据.此外,HongZhou和XiaoruYuan等提出了基于视觉(几何属性)的聚类方法,通过曲线曲率的最小化和相邻边缘平行度的最大化来优化曲线,以实现聚类线束聚拢.PeihongGuo和HeXiao等则设计了一种针对PCP视图中局部数据进行交互式视觉聚类的方法.用户通过在视图中设置引力和斥力操作器,使临近区域的曲线产生实时的聚拢或分散,进而生成层次化的视觉聚类.刘芳和田凯等基于PeihongGuo和HeXiao的理论基础提出了给聚类的线束添加斥力场,以拉开聚类线束之间的空间距离,提升辨识度.GregorioPalmas和MyroslavBachynskyi等提出了一种新的边绑定布局的聚类可视化方法,它基于坐标轴上数据分布的密度进行交互式层次聚类,并以多边形填色的布局方式来表达聚类数据,方便用户进行聚类数据的概览.以上研究从不同的角度改进了PCP视图中聚类数据的可视化效果,但仍存在一些问题:1)现有绑定方法是对聚类线束中部进行绑定,在线束两端临近坐标轴的区域,曲线之间的杂乱交叉现象仍然存在.2)现有的聚类绑定方法,在进行簇间分离布局时,缺少对聚类所包含数据量差别的考量.对于数据量较大的聚类而言,簇间分离时大量拉伸的曲线反而会增加整个视图的视觉干扰。基金项目:洛阳市科技发展计划项目(1401064A);河南省科学技术厅软科学研究项目(142400410036)。
技术实现思路
为解决在三维造型设计、数据挖掘、商业决策、市场调查、用户研究等数据可视化领域,平行坐标系的聚类数据分析广泛采用绑定方法解决数据线杂乱干扰的问题。现有的绑定方法主要缺陷在于绑定后的线束存在明显的弯曲变形和整体偏移,造成数据分布属性信息(如聚类数据的离散度、聚类数据中心的取值、聚类数据的区位分布等)的视觉表达出现偏差。本专利技术专利提出了一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,通过绑定方法创新设计,改善了绑定后的线型布局,解决了现有平行坐标系聚类绑定方法中可能对数据的分布特征造成视觉认知偏差的问题。为实现上述技术目的,本专利技术采用的技术方案是:一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,包括以下步骤:步骤一、采集多个数据样本,采用K均值方法或自组织映射方法对数据样本进行聚类分析,并根据聚类结果对数据进行类别标记,得到的聚类的类别数记为N,每个聚类中包含的样本数据的数量记为n;步骤二、根据各个聚类的包含的样本数据,计算得到每个聚类的中心,作为该聚类线束聚拢的基准,即每个聚类中心的初始位置,也称作骨骼;步骤三、根据坐标轴的高度Height和聚类的数量N,计算出簇间的平衡距离K,计算模型为:其中,t为用于控制簇间距离的尺度的调节因子;步骤四、基于改进的力导向算法,进行各个聚类中心的布局计算,设有两个聚类P和Q,两聚类中心的距离记为dist(P,Q),1)如果两簇之间的现有距离dist(P,Q)>平衡距离K,则不再施加力场效应;2)如果两簇之间的现有距离dist(P,Q)<平衡距离K,则为聚类中心添加斥力场算法,P,Q两聚类中心之间的斥力记为Fr(P,Q),斥力效应与两中心之间距离成反比,距离越近,排斥力越大;斥力计算模型:3)为聚类中心添加引力场算法,模拟各聚类中心受自身初始位置的引力约束效应,将约束引力设置在偏移后的聚类中心与其自身的初始位置之间,聚类中心受到自身初始位置的约束引力记为Fa,引力效应与中心偏离自身初始位置的距离△成正比,偏离距离△越大,引力Fa越大,设聚类P的中心在斥力作用下的偏移量为△P,达到均衡位置时的均衡距离为Kp,聚类中心受到自身初始位置的约束引力为Fa(P);则聚类P的中心受到的约束引力为:同理,聚类Q的中心受到的约束引力为:4)根据各个聚类内部的样本数量n,计算各簇的引力调节算子d,对偏移距离进行调整,将偏移量转移到较小的簇;聚类P的偏移量其中聚类P的引力调节算子聚类Q的偏移量其中聚类P的引力调节算子5)循环迭代计算各个聚类中心所所受的斥力和引力;对于聚类P的中心,受到引力Fa(P)和斥力Fr(P,Q)的作用:如果Fa(P)>Fr(P,Q),则聚类中心P沿引力Fa(P)方向移动;如果Fa(P)<Fr(P,Q),则聚类中心P沿斥力Fr(P,Q)方向移动;如果Fa(P)=Fr(P,Q),说明聚类中心P已处于力平衡状态,进入步骤五,否则循环执行步骤四,同理,循环迭代其它聚类中心,直至所有聚类中心达到受力平衡,则各聚类中心完成布局计算,得到新平衡位置;步骤五、基于聚类中心进行分段式骨骼计算,结合每个聚类中心的初始位置和新平衡位置,通过插值方法,得到多条三段式聚类骨骼;步骤六、在每个簇内线束添加引力场算法,基于每个簇内的三段式骨骼的左右两段的引力特征点,将每条数据线上两端的引力作用点向骨骼靠近,设数据线自身初始位置的能量初值为Ecurvature,受骨骼约束引力作用的能量为Eattraction-constrain。则在骨骼引力作用下新位置的能量值为:其中αc是簇内引力的调节因子,αc值越大,则数据线越靠拢骨骼;步骤七、基于相邻坐标轴上的数据点,和数据线两端的引力作用点,绘制B样条曲线,得到两端快速收敛,中部呈带状的线型;步骤八、根据坐标轴上的数据密度,通过传递函数计算并设置数据线的透明度,完成PCP聚类绑定。本专利技术有益效果是:1、本专利技术的方法提出了基于优化的力导向分段式骨骼布局的绑定方法,将力导向模型引入簇间分离布局计算;建立簇内数据量与斥力的负向关联,将绑定时簇间分离的移动量转移到较小的聚类;采用分段式骨骼作为簇内线束收敛的基准,得到两端快速收本文档来自技高网
...
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法

【技术保护点】
一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,其特征在于:包括以下步骤,步骤一、采集多个数据样本,采用K均值方法或自组织映射方法对数据样本进行聚类分析,并根据聚类结果对数据进行类别标记,得到的聚类的类别数记为N,每个聚类中包含的样本数据的数量记为n;步骤二、根据各个聚类的包含的样本数据,计算得到每个聚类的中心,作为该聚类线束聚拢的基准,即每个聚类中心的初始位置,也称作骨骼;步骤三、根据坐标轴的高度Height和聚类的数量N,计算出簇间的平衡距离K,计算模型为:

【技术特征摘要】
1.一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法,其特征在于:包括以下步骤,步骤一、采集多个数据样本,采用K均值方法或自组织映射方法对数据样本进行聚类分析,并根据聚类结果对数据进行类别标记,得到的聚类的类别数记为N,每个聚类中包含的样本数据的数量记为n;步骤二、根据各个聚类的包含的样本数据,计算得到每个聚类的中心,作为该聚类线束聚拢的基准,即每个聚类中心的初始位置,也称作骨骼;步骤三、根据坐标轴的高度Height和聚类的数量N,计算出簇间的平衡距离K,计算模型为:其中,t为用于控制簇间距离的尺度的调节因子;步骤四、基于改进的力导向算法,进行各个聚类中心的布局计算,设有两个聚类P和Q,两聚类中心的距离记为dist(P,Q),1)如果两簇之间的现有距离dist(P,Q)>平衡距离K,则不再施加力场效应;2)如果两簇之间的现有距离dist(P,Q)<平衡距离K,则为聚类中心添加斥力场算法,P,Q两聚类中心之间的斥力记为Fr(P,Q),斥力效应与两中心之间距离成反比,距离越近,排斥力越大;斥力计算模型:3)为聚类中心添加引力场算法,模拟各聚类中心受自身初始位置的引力约束效应,将约束引力设置在偏移后的聚类中心与其自身的初始位置之间,聚类中心受到自身初始位置的约束引力记为Fa,引力效应与中心偏离自身初始位置的距离△成正比,偏离距离△越大,引力Fa越大,设聚类P的中心在斥力作用下的偏移量为△P,达到均衡位置时的均衡距离为Kp,聚类中心受到自身初始位置的约束引力为Fa(P);则聚类P的中心受到的约束引力为:同理,聚类...

【专利技术属性】
技术研发人员:巫滨曹卫群李苏南杨波
申请(专利权)人:北京林业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1