当前位置: 首页 > 专利查询>浙江大学专利>正文

基于密度峰值聚类算法的神经元峰电位在线分类方法技术

技术编号:19512044 阅读:150 留言:0更新日期:2018-11-21 08:13
本发明专利技术公开了一种基于密度峰值聚类算法的神经元峰电位在线分类方法,包括以下步骤:通过降维和特征提取,提取信号的波形特征向量;使用密度峰值聚类算法对特征向量进行聚类,随后使用线性判别式分析等分类方法寻找与当前聚类结果对应的最佳分类的投影空间以及峰电位投影得到的特征向量;通过迭代方法找到最佳投影空间并得到聚类结果,将测试峰电位映射到投影空间后进行分类。本发明专利技术方法具有抗噪性好、复杂度低、无监督、在线分类的特点,并且可以做到完全自动,不需要人为参与,可以适用于无线植入式脑‑机接口。

【技术实现步骤摘要】
基于密度峰值聚类算法的神经元峰电位在线分类方法
本专利技术属于神经元峰电位信号在线处理领域,具体涉及一种基于密度峰值聚类算法的神经元峰电位在线分类方法。
技术介绍
神经元峰电位信号(Spike)具有时空分辨率高、信息量大的特点,是对复杂任务的实时精确控制的重要手段,峰电位分类是峰电位信号处理的重要步骤之一,但目前的方法主要依赖于人工或半人工处理。随着多通道神经集群记录技术的发展,同步记录的神经元通道数急剧增加,从原有的几十个通道向上千个通道发展,目前的人工和半人工方法已经无法应对。另一方面,记录通道数的增加对于数据的传输和存储也提出了巨大的挑战,高通量神经数据的约简可提高数据处理的实时性,推动在线脑-机接口等技术的发展。此外,该神经信号的无线传输可以减少电缆穿过头皮引发的感染,也不会限制实验中动物的移动。因此,亟需实现一种完全自动、无监督、复杂度低的神经元峰电位在线分类算法。
技术实现思路
本专利技术提供了一种基于密度峰值聚类算法的神经元峰电位在线分类方法,通过密度峰值聚类算法进行聚类、计算特征空间,并在循环迭代的过程中提高特征空间对类的区分能力,实现对神经元峰电位的完全自动、无监督聚类,准确率高,复杂度低。一种基于密度峰值聚类算法的神经元峰电位在线分类方法,通过以下步骤实现:(1)对训练数据进行降维处理,获得转换矩阵以及多个特征向量;每个峰电位波形使用多个特征向量表示;如利用主成分分析获得投射矩阵以及三个最大的主成分,每个峰电位波形可以使用三个主成分构成的特征向量表示;(2)应用密度峰值聚类法(DensityPeaksClustering)在特征向量空间对数据进行聚类,得到聚类结果L;所述的密度峰值聚类法主要使用了向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,具体方法如下:(a)第i个点局部密度的计算方式为其中dij是特征向量yi与yj的距离,dc是截断距离,n为峰电位的总数量,i与j是峰电位序号;(b)第i个点到局部密度比自身大的点的最小距离δi以及对应的点序号n_upi的计算方式为(c)计算λi=δiρi,选择λ最大的K个特征向量为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用为特征向量分类,最后将类标号改为1~K之间的数。步骤(2)使用两个指标,向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,局部密度的计算方式为其中dij是特征向量yi与yj的距离,n为峰电位的总数量,到局部密度比自身大的点的最小距离以及对应的点n_upi的计算方式为:参数λi=δiρi,选择λ最大的K个特征向量最为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用为特征向量分类,最后将类标号改为1~K之间的数;(3)按照现有的聚类结果L使用有监督降维方法(如线性判别分析,LinerDiscriminantAnalysis,LDA等)来得到具有区分力的子空间投射矩阵W和特征向量Y,并将L赋给L_pre;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到聚类结果L;重复本步骤直至满足迭代终止条件;迭代终止条件为:达到最大迭代次数或最近两次聚类的重合度大于等于99.5%。其中重合度定义为:两次聚类都在同一类的峰电位占所有峰电位的比例。其中同一类定义为:新聚类结果中聚类中心所在的类与其在上一次聚类结果中所在的类对应为同一类。有监督降维方法是本方法中的一个步骤,实现对聚类结果L做降维。该步骤除了LDA之外,也可以用其他类似的方法代替。该过程称为DR_DP聚类算法(DimensionReduction&DensityPeakClustering);密度峰值聚类法中,类的数目固定为特定类数K;选取局部密度与更高密度点的最小距离乘积最大的K个点位作为聚类中心;使用高斯核计算局部密度ρ。(4)采用戴维森堡丁指数作为分类评估指标,将两个相似的类进行合并;采用任意两类别的戴维森堡丁指数(类内距离平均距离之和除以两聚类中心距离)作为聚类评估参数,并将聚类评估参数的平均值与系数的乘积作为标准聚类评估参数。所所述的聚类评估指标戴维森堡丁指数,具体方法如下:第i类与第j类的戴维森堡丁指数的计算方式为用于比较判断的阈值为其中K为分类的类别总数,n为峰电位的总数量,α为系数。(5)计算测试数据对应特征向量到每一个类中心的特征空间距离,对其进行分类;对测试数据进行分类,将测试数据投射到特征空间,得到特征向量后,根据与类中心的欧氏距离判断其所属类。在对峰电位波形进行聚类分析时,需要进行特征提取和聚类:常用的特征提取方法中,提取幅值、波宽等特征,此类方法计算简单、运算量小,但由于其对峰电位的识别力低,并且需要人为参与,灵活性较差;而基于主成分分析、小波变化的方法准确率虽高,但需要的数据量较大,占据较大存储。常用聚类算法中,k-均值、超顺磁聚类、高斯混合模型等运算量大,抗噪性较差。本专利技术使用维度约简方法提取信号的波形特征向量;使用密度峰值聚类算法对特征向量进行聚类,随后使用线性判别式分析等分类方法寻找与当前聚类结果对应的最佳分类的投影空间以及峰电位投影得到的特征向量;通过迭代方法找到最佳投影空间并得到聚类结果,将测试峰电位映射到投影空间后进行分类。本专利技术具有抗噪性好、复杂度低、无监督的特点,并且可以做到完全自动,不需要人为参与,可以适用于无线植入式脑-机接口。附图说明图1为方法流程图,X_data:训练数据;X_test:测试数据;W0:投影矩阵W初始值;L:聚类结果。图2为DR_DP聚类算法流程图,其中,Y:特征向量;W:投射矩阵;L:聚类得到的类标;L_pre:上一次迭代得到的聚类结果;ck:第k类聚类中心的序号;ite:迭代系数;maxIte:最大循环次数;minIte:最小循环次数;NR:异常值数量在所有数据点中所占的比例;SR:两次聚类结果相同的数据点在所有数据点中所占的比例。图3为数据在主成分空间的投影图。图4为数据在DR_DP聚类后得到的特征空间的投影图。图5为聚类中心的峰电位波形对比图。具体实施方式下面结合附图和实施例,对本专利技术基于密度峰值聚类算法的神经元峰电位在线分类方法做详细描述。实施例1一种基于密度峰值聚类算法的神经元峰电位在线分类方法,包括以下步骤:图1是该方法流程图。(1)对训练数据进行主成分分析,获得投射矩阵以及三个最大的主成分;每个峰电位波形使用三个主成分构成的特征向量表示。(2)使用密度峰值聚类法在主成分特征空间对数据进行聚类,得到聚类结果L。计算向量的局部密度ρ和到局部密度比自身大的点的最小距离δ。局部密度的计算方式为其中dij是特征向量yi与yj的距离,n为峰电位的总数量。到局部密度比自身大的点的最小距离以及对应的点n_upi的计算方式为计算λi=δiρi,选择λ最大的K个特征向量最为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用为特征向量分类,最后将类标号改为1~K之间的数。例如,为了类能够尽可能分开,K=4。因为一般单通道峰电位数量不会超过4类,当类别较少时可以通过后续类的合并来使得类数目准确。(3)按照现有的聚类结果L使用有监督降维方法(如线性判别分析,LinerDiscriminantAnalysis,LDA)来得到具有区分力的子空间投射矩阵W和特征向量Y;使用密度峰值聚类法在新的特本文档来自技高网...

【技术保护点】
1.一种基于密度峰值聚类算法的神经元峰电位在线分类方法,其特征在于,通过以下步骤实现:(1)对训练数据进行降维处理,获得转换矩阵以及多个特征向量,每个峰电位波形使用多个特征向量表示;(2)使用密度峰值聚类法在特征向量空间对数据进行聚类,得到聚类结果L;(3)按照现有的聚类结果L使用有监督降维方法来得到具有区分力的子空间转换矩阵W和特征向量Y,并将L赋给L_pre;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到聚类结果L,重复本步骤直至满足迭代终止条件;(4)采用戴维森堡丁指数作为分类评估指标,将两个相似的类进行合并;(5)计算测试数据对应特征向量到每一个类中心的特征空间距离,对其进行分类。

【技术特征摘要】
1.一种基于密度峰值聚类算法的神经元峰电位在线分类方法,其特征在于,通过以下步骤实现:(1)对训练数据进行降维处理,获得转换矩阵以及多个特征向量,每个峰电位波形使用多个特征向量表示;(2)使用密度峰值聚类法在特征向量空间对数据进行聚类,得到聚类结果L;(3)按照现有的聚类结果L使用有监督降维方法来得到具有区分力的子空间转换矩阵W和特征向量Y,并将L赋给L_pre;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到聚类结果L,重复本步骤直至满足迭代终止条件;(4)采用戴维森堡丁指数作为分类评估指标,将两个相似的类进行合并;(5)计算测试数据对应特征向量到每一个类中心的特征空间距离,对其进行分类。2.根据权利要求1所述的一种基于密度峰值聚类算法的神经元峰电位在线分类方法,其特征在于,步骤(2)所述的密度峰值聚类法主要使用了向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,具体方法如下:(a)第i个点局部密度的计算方式为其中dij是特征向量yi与yj的距离,dc是截断距离,n为峰电位的总数量,i与j是峰电位序号。(b)第i个点到局部密度比自身大的点的最小距离δi以及对应的点序号n_upi的计算方式为(c)计算λi=δiρi,选择λ最大的K个特征向量为聚类中心,n_upi...

【专利技术属性】
技术研发人员:杨泽兰任轶佐张韶岷
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1