一种基于有序模式的图分类方法技术

技术编号:14129180 阅读:136 留言:0更新日期:2016-12-09 17:28
本发明专利技术公开了一种对图进行分类的方法。图作为一种通用的数据集结构,在许多科学应用中,可以用来表示数据对象之间的各种复杂关系。在本发明专利技术的方法中,首先提出一种新的图特征,也就是有序模式(ordinal pattern)。有序模式可以保留图内的权重信息以及局部拓扑结构,是一种理想的图特征。然后,通过一系列算法,从图中提取具有判别性的有序模式,并将判别性有序模式作为特征。最后基于支持向量机(support vector machine,SVM),构建出对图分类的分类器。本发明专利技术公开的方法可以高效且准确地实现图的分类。

【技术实现步骤摘要】

本专利技术公开了一种基于有序模式的图分类分类方法,涉及到神经影像处理、社交网络、频繁项挖掘、分类器构建等方面,旨在实现对图数据进行准确、高效的分类。
技术介绍
图作为一种通用的数据集结构,在许多科学应用中,可以用来表示数据对象之间的各种复杂关系。比如基于神经影像构建出图,再通过复杂网络等技术对图进行分析研究,或者使用图结构表示化合物的结构。目前,图分类问题主要研究二分类问题,即正类和负类,主要目标在于构筑一个分类模型,将两者分开。近年来,已经有许多种图特征被用于图分类。例如,节点的度(degree)、聚类系数(clustering coefficient)、判别性子图(discriminative subnetwork)等,基于这些图特征,许多图分类的方法被提出。然而,这些图特征具有两个很大的缺点。首先,这些图特征都是基于无权图,而大部分图数据是有权数据。所以在提取这些特征时,需要将图进行阈值化,从而将有权图转化为无权图。然而,阈值化会损失极大的损失图中的权值信息,这会影响最终的分类结果。第二,大部分图特征(节点的度,聚类系数等)都只考虑单个节点的信息,而忽视了多个节点之间的信息。而许多研究表明,在大部分中,多个节点之间的连接对大脑的功能有重要的作用。很显然,这两个缺点都会极大的影响最终的分类性能。本专利技术基于以上两个问题,提出一种新的图特征,也就是有序模式。有序模式可以同时解决以上两个问题,是一种理想的图特征。然后,构造了一种基于有序模式的图分类方法。该方法可以高效且准确的对图进行分类。
技术实现思路
本专利技术针对现有方法的缺陷,提出了一种基于有序模式的图分类方法。本专利技术为解决上述问题,采用如下技术方案:步骤一、从图数据集中挖掘频繁有序模式;步骤二、从众多的频繁有序模式中选择出拥有较高判别性的有序模式,作为判别性有序模式;步骤三、基于判别性有序模式构建特征矩阵,然后使用支持向量机构建分类器。构建的分类器可用于对图进行分类。步骤四、对未知类型的图,使用步骤三训练出的分类器对其进行分类。所述步骤一中,神经影像可以是功能性磁共振成像(functional magnetic resonance imaging,fMRI)、结构性磁共振成像(structural magnetic resonance imaging,sMRI)等。不同类型的脑影像数据的构造过程有所不同。例如,在fMRI中,先将大脑分割为90个脑区,然后,计算各个脑区之间的时间序列的相关度。把脑区作为节点,成对脑区的连接作为边,相关度作为成对脑区之间的边的权值。此外通过测试化合物的化学结构,我们可以得到化合物对应的图。通过上述步骤可以获得神经影像以及化合物对应的图,分为正类和负类,分别表示为D+和D-。所述步骤一中,我们将图集分为正类和负类,分别表示为D+和D-,然后从图集合中挖掘出频繁有序模式。首先,我们给出有序模式与频繁有序模式的定义。定义1:有序模式对于一个有权图G={V,E,W本文档来自技高网...
一种基于有序模式的图分类方法

【技术保护点】
一种基于有序模式对图数据进行分类的方法,其特征在于,包括如下步骤:步骤一、从图数据集中挖掘频繁有序模式;步骤二、从众多的频繁有序模式中选择出拥有较高判别性的有序模式,作为判别性有序模式;步骤三、基于判别性有序模式构建特征矩阵,然后使用支持向量机训练分类器。训练出的分类器可用于对图进行分类;步骤四、对未知类型的图,使用步骤四训练出的分类器对其进行分类。

【技术特征摘要】
1.一种基于有序模式对图数据进行分类的方法,其特征在于,包括如下步骤:步骤一、从图数据集中挖掘频繁有序模式;步骤二、从众多的频繁有序模式中选择出拥有较高判别性的有序模式,作为判别性有序模式;步骤三、基于判别性有序模式构建特征矩阵,然后使用支持向量机训练分类器。训练出的分类器可用于对图进行分类;步骤四、对未知类型的图,使用步骤四训练出的分类器对其进行分类。2.如权利要求1所述的一种基于有序模式对图数据进行分类的方法,其特征在于:所述步骤一中,在频繁有序模式的挖掘过程中,构建出一棵深度优先搜索树对所有的有序模式进行搜索,判断其是否满足频繁度条件。在搜索过程中,使用有序模式的Apriori性质,也就是一个有序模式的频繁度不低于基于它衍生出的任意有序模式的频繁度。这样,如果已经判断一个有序模式不是频繁有序模式,则可以判断它的衍生的任意有序模式都不是频繁有序模式,也就可以直接将这些有序模式进行剪枝,不需要再对它们进行搜索。这可以大大加快频繁有序模式的搜索过程。3.如权利要求1...

【专利技术属性】
技术研发人员:张道强屠黎阳杜俊强
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1