本发明专利技术公开了一种多维时序信息可视化方法,目的是解决同一视图不能同时揭示数据集的多维分布及时间演变特征的问题。技术方案是先建立多维时序坐标系,接着计算多维时序数据集中任意二维的相关系数,根据相关系数值调整多维时序坐标系的维轴、标定多维时序坐标系的维轴正方向,计算多维时序数据集的记录在多维时序坐标系中的笛卡尔坐标表示形式,然后建立目标函数,求解目标函数的最优值,定位多维时序数据集的全部记录项,对多维时序记录形成的点云进行渲染,得到多维时序数据集的可视化结果。采用本发明专利技术能在同一视图中同时可视化多维时序数据集的多维分布特性及时序演化特征,有效减轻维轴配置的繁杂度及随机性,降低了降维运算的时间复杂度。
【技术实现步骤摘要】
本专利技术涉及信息可视化
的一种可视化方法,特别是指一种兼顾数据集多维分布及时序演化特点的多维时序信息可视化方法。
技术介绍
信息技术的飞速发展,科学、工程、商业等领域的信息爆炸性增长,对如何进行大 量抽象数据的分析及理解提出了新的技术挑战。面对数量如此巨大的信息资源,由于人类 认知能力固有局限性的存在,如果仅依赖数据表格或文字的形式进行表示,人们难以对其 进行理解及比较,信息认知活动面临空前的复杂性。信息可视化是利用计算机图形表现抽 象数据,借助视觉增强用户对非物理抽象信息认知的新兴技术,是辅助用户分析理解海量 抽象信息的有效工具,它将人脑和计算机这两个最强大的信息处理系统联系在一起,使得 用户能够有效的观察、操纵、研究、浏览、探索、过滤、发现、理解大规模数据,并与之方便交 互,从而发现隐藏在信息内部的特征和规律。信息可视化技术根据所处理的数据类型可分 为一维、二维、三维、多维、时序、层次、网络可视化技术,各国研究人员已分别对每一类可视 化技术进行了较深入的研究,但是对于多类型数据集(如多维网络、多维时序、层次网络 等)的可视化方法研究尚处于起步阶段,是当前研究的热点问题。 多维时序数据大量存在于社会科学、环境监测、金融经济、医疗卫生及地理信息领 域,急需多维时序信息可视化方法对此类数据进行有效分析并从中发掘隐性知识,但是,当 前的多维时序信息可视化方法主要是将多维可视化视图与时序可视化视图拼凑在同一视 图中,多维可视化视图侧重于构建能够保持原多维数据拓扑结构的低维展现,以辅助用户 在可视空间中分析各数据项多维属性间的相互关系,主要方法包括枝形图法、平行坐标法、 多维标度法(MDS)等;时序可视化视图则着重体现数据项之间的演变规律,主要方法包括 动画法,静态场景排列法,时间序列图法等,两视图之间通过联动支持用户对多维时序信息 的可视化分析。该方法虽然能够在对应视图中将多维及时序特性分别进行较为有效的展 现,但不利于同时可视化数据集的多维及时序特点,不利于发掘数据集中有关多维及时序 特征的隐含信息。因此,研究人员提出了融合多维可视化方法及时序可视化方法的想法, 如,Mikael Jern使用集成了时间序列趋势图的平行坐标法可视化分析多维时空统计数据 库;Roger D. Peng提出mvtsplot函数概括计算多维值产生的影响,并将其以色块形式反映 到时间序列矩阵中可视分析美国的环境监测数据。使用这些方法都需要特定应用领域的专 业背景,可视化视图无法体现出数据记录的多维分布特性,而且算法时间复杂度较高,操作 繁琐复杂。
技术实现思路
本专利技术要解决的技术问题是提出,既能同时直观揭 示数据集的多维分布及时间演变特征,又能在有效保持数据集内在结构特征及拓扑关系的 基础上降低降维过程的时间复杂度。4 本专利技术的技术方案是 第l步,在三维空间中定义一圆柱体,以圆柱体底面多个沿直径方向的向量轴表示多维时序数据集的多个维,以圆柱底面中心为起点、沿圆柱高的向量轴表示多维时序数据集的时序属性,初步建立基于圆柱体的多维时序坐标系,其中,圆柱体底面的向量轴称为多维时序坐标系的维轴,沿圆柱高的向量轴称为多维时序坐标系的时序轴; 第2步,自上而下扫描数据集,计算多维时序数据集中任意二维的相关系数r(di,<formula>formula see original document page 5</formula>维属性值,MaXi、 Mia分别为多维时序数据集第i维的d,.),其中,:1,fi1为多维时序数据集记录1的第最大、最小值,m为自然数,代表多维时序数据集的总记录数,k为自然数,代表多维时序数据集的总维数,e为相关度阀值,根据多维时序数据集规模确定,通常e的取值范围为0< e < 0. 2 ; 第3步,根据多维时序数据集全部维两两间的相关系数值调整多维时序坐标系的维轴,相关系数值越大,二个维轴之间夹角越小,具体步骤包括 3. 1、构造相关度矩阵^,定义两个一维空数组DR、 A,分别称为维数组、夹角数组; 3. 2、取R中绝对值最大元素lr(di, dj) | ,即二个最相关的维dj,并将r(di, d》从相关度矩阵R中删除; 3. 3、将维&插入到维数组DR的开始位置,维dj插入到维数组DR的结束位置; 3.4、选取dp,l《p《k,使lr(di,dp) |最大,选取dq,l《q《k,q^p,使得|r(dj,dq) I最大,且dp、 dq不在维数组DR中; 3. 5、如果I r (di, dp) I > I r (dj, dq) | ,将dp插入到维数组DR的开始位置;否则,将dq插入到维数组DR的结束位置; 3. 6、如果多维时序数据集中的全部维都已插入维数组DR中,则执行3. 7,否则执行3.43.7、依次计資维数组DR中相邻维轴间的夹角 其中,oDRk) l,然后将eu,+1 = arccos | r (DRU, DRU记录到夹角数组A中;》1,(k_l) , co l k = arccos I r (DR丄, 3. 8、根据维数组DR中记录的维顺序及夹角数组A中记录的夹角调整维轴,使维轴的顺序与DR中记录的维顺序一致,任意二维之间的夹角与夹角数组A中记录的夹角值相等。 第4步,依据多维时序数据集各维间的语义相关性标定多维时序坐标系的维轴方向,若两维语义正相关,标定对应两维度轴同方向,若两维语义负相关,标定对应两维度轴反方向,完成基于圆柱体的多维时序坐标系的构建; 第5步,以多维时序坐标系中的点表示多维时序数据集中的记录,根据多维时序 坐标系在三维笛卡尔坐标系中的位置,计算多维时序数据集的记录在多维时序坐标系中的 笛卡尔坐标表示形式,具体步骤包括 5. 1、计算多维时序坐标系各维轴的单位向量,其中 mirij = min{/y',lS"m} ,max) = max(,',lS" } , 1 < j < k ; 5. 2、求过维轴dj起点并与dj垂直的直线方程Ej (x, y) = AjX+Bj+Cj = 0(1《j《k); 5. 3、采用^^= ^^2:;2 ""J + m、形式表示多维时序数据集的记录i对应多 维时序坐标系j维轴的坐标值; 5. 4、自上而下扫描数据集,使用步骤5. 3中的公式计算全部记录在多维时序坐标 系中的笛卡尔坐标表示形式; 第6步,以减小多维时序数据集记录的多维时序坐标系坐标值与该记录的多维时 序属性值之间差别为准贝1」,建立目标函数,即,幽^'力=2!>。《-《)2 + 2>。W」'—f')2 '其中,f/为多维时序数据集记录i的第j维属性值,ti为记录i的时序属性值,corcLti表示记录 i的时序属性值在多维时序坐标系中的坐标值; 第7步,将多维时序数据集记录的时序坐标值与该记录的时序属性值对应,即,corcLti = ti,从而减除目标函数中的时序属性分项;—w」'-^; 第8步,将目标函数中多维属性分项EI>。《-力)2的笛卡尔坐标表 示替换为平面极坐标表示,目标函数转换为min/(^) = S2>^<-/》2 ,其中 c。《=kcos(p, -+ max'^咖"'本文档来自技高网...
【技术保护点】
一种多维时序信息可视化方法,其特征在于包括以下步骤:第1步,在三维空间中定义一圆柱体,以圆柱体底面多个沿直径方向的向量轴表示多维时序数据集的多个维,以圆柱底面中心为起点、沿圆柱高的向量轴表示多维时序数据集的时序属性,初步建立基于圆柱体的多维时序坐标系,其中,圆柱体底面的向量轴称为多维时序坐标系的维轴,沿圆柱高的向量轴称为多维时序坐标系的时序轴;第2步,自上而下扫描数据集,计算多维时序数据集中任意二维的相关系数r(d↓[i],d↓[j]),r(d↓[i],d↓[j])=*w↓[坐标系中的位置,计算多维时序数据集的记录在多维时序坐标系中的笛卡尔坐标表示形式,具体步骤包括:5.1、计算多维时序坐标系各维轴的单位向量*↓[j]=d↓[j]/(max↓[j]-min↓[j]),其中min↓[j]=min{f↓[j]↑[i],1≤i≤m},max↓[j]=max{f↓[j]↑[i],1≤i≤m},1≤j≤k;5.2、求过维轴d↓[j]起点并与d↓[j]垂直的直线方程E↓[j](x,y)=A↓[j]x+B↓[j]y+C↓[j]=0(1≤j≤k);5.3、采用cord↓[j]↑[i]=|A↓[j]x↓[i]+B↓[j]y↓[i]+C↓[j]|/***.|*↓[j]|+min↓[j]形式表示多维时序数据集的记录i对应多维时序坐标系j维轴的坐标值;5.4、自上而下扫描数据集,使用步骤5.3中的公式计算全部记录在多维时序坐标系中的笛卡尔坐标表示形式;第6步,以减小多维时序数据集记录的多维时序坐标系坐标值与该记录的多维时序属性值之间差别为准则,建立目标函数,即,minf(x,y)=**(cord↓[j]↑[i]-f↓[j]↑[i])↑[2]+*(cord_t↑[i]-t↑[i])↑[2],其中,x=(x↓[1],x↓[2],…,x↓[m])↑[T],y=(y↓[1],y↓[2],…,y↓[m])↑[T],f↓[j]↑[i]为多维时序数据集记录i的第j维属性值,t↑[i]为记录i的时序属性值,cord_t↑[i]表示记录i的时序属性值在多维时序坐标系中的坐标值;第7步,将多维时序数据集记录的时序坐标值与该记录的时序属性值对应,即,cord_t↑[i]=t↑[i],从而减除目标函数中的时序属性分项*(cord_t↑[i]-t↑[i])↑[2];第8步,将目标函数中多维属性分项**(cord↓[j]↑[i]-f↓[j]↑[i])↑[2]的笛卡...
【技术特征摘要】
【专利技术属性】
技术研发人员:肖卫东,孙扬,汤大权,唐九阳,葛斌,张翀,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:43[中国|湖南]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。