当前位置: 首页 > 专利查询>山西大学专利>正文

基于近邻传播偏标签学习的脑影像数据分类模型建立方法技术

技术编号:35568893 阅读:28 留言:0更新日期:2022-11-12 15:52
本发明专利技术属于脑影像分析技术领域,公开了一种基于近邻传播偏标签学习的脑影像数据分类模型建立方法,包括以下步骤:S1、获取训练数据集和对应的原始标签,求解样本间相关系数和样本的度中心性,据此生成典型样本集和类别中心集;S2、确定训练样本的候选标签,构建候选标签集;S3、通过训练数据集,利用K+N近邻样本图进行标签传播,建立分类模型。本发明专利技术可以提高分类模型的准确性和精确度。类模型的准确性和精确度。类模型的准确性和精确度。

【技术实现步骤摘要】
基于近邻传播偏标签学习的脑影像数据分类模型建立方法


[0001]本专利技术属于脑影像分析领域和偏标签学习领域,特别涉及一种新的基于近邻传播偏标签学习的脑影像数据分类模型建立方法。

技术介绍

[0002]传统的精神疾病分类面临着多种疾病临床症状高度重叠、基于症状的诊断方法不完善等问题,因此亟待改善。
[0003]目前,精神疾病的分类主要基于患者对其症状的主观描述和临床医生或知情人对患者行为的观察。但是,很多精神疾病具有相似的临床症状,精神疾病患者常同时具有多种疾病的临床特征,并且,随着时间的推移,特定个体的主要临床症状还可能发生显著变化,这对精神疾病分类造成了极大的干扰。因此,仅通过医师评估或患者自我评估获得的临床分类结果往往因缺乏生物学证据而具有准确度不高的缺点。
[0004]利用脑影像数据可以提高精神疾病的分类准确性。然而,现有技术中的分类算法的理论前提是数据和其对应标签是可靠的。方法常从训练数据中学习信息并建立模型,再通过训练好的模型完成对新样本的类别分类。然而很多数据集都存在标签信息不完全准确的问题。人工标注工作需要标注者极高的专业素养,但现实情况下,这种标注要求往往难以达到,因此部分数据存在标签歧义问题。例如,在精神疾病领域,精神分裂症和双相情感障碍的症状重叠,医生很难对这两种疾病给出可靠的诊断,精神疾病患者的脑影像数据对应的疾病标签具有准确性不高的问题,所以传统分类方法并不适用于在精神疾病领域的脑影像分类工作。基于偏标签学习的分类是从不完全准确的标签信息中提取出有效信息的方法,更适用于脑影像数据分类。
[0005]因此,需要对现有技术中的分类模型建立方法进行改进,以得到准确性高的脑影像分类模型,提高分类模型的分类准确率。

技术实现思路

[0006]本专利技术克服现有技术存在的不足,所要解决的技术问题为:提供一种基于近邻传播偏标签学习的脑影像数据分类模型建立方法。
[0007]为了解决上述技术问题,本专利技术采用的技术方案为:一种基于近邻传播偏标签学习的脑影像分类模型建立方法,包括以下步骤:
[0008]S1、获取训练数据集和对应的原始标签;在训练数据集的同一类别样本内计算各个样本间相似度矩阵以及度中心性,根据度中心性确定各个类别的典型样本;然后,将同一类别组内所有典型样本的均值作为该类别的初始类别中心;根据各个类别下的典型样本构成典型样本集,根据各个类别的初始类别中心构成类别中心集;
[0009]S2、确定训练数据集中样本的候选标签,构建候选标签集;
[0010]S3、通过训练数据集,利用K+N近邻样本图建立分类模型,其具体包括:
[0011]S301、将典型样本和其K个近邻节点样本作为本层样本,确定其近邻节点样本的候
选标签;
[0012]S302、根据训练样本的典型样本集、类别中心和样本特征,构建本层样本的K+N近邻样本图;所述K+N近邻样本图包括K个近邻样本节点和N个近邻典型样本节点;
[0013]S303、通过典型样本对其近邻节点样本进行标签推理,确定其近邻节点样本的分类输出标签,然后,计算同一类别组内各个样本的度中心性,根据度中心性增加各个类别的典型样本数量,更新典型样本集、类别中心集以及候选标签集;
[0014]S304、判断是否全部样本标签确定,若否,则返回步骤S301;若是,则输出所有样本的最终分类输出标签,完成分类模型的建立。
[0015]所述脑影像数据包括:脑功能核磁共振成像、脑结构核磁共振数据、弥散张量成像数据、脑电数据、脑磁数据;
[0016]所述脑影像数据的特征包括:脑功能连接特征、脑灰质密度和体积特征、脑结构连接特征、脑电信号特征、脑影像多模态融合后的特征。
[0017]所述步骤S1中,所述相似度矩阵的矩阵元为相关系数,所述相关系数为皮尔逊相关系数、高斯核求解相关系数或回归求解相关系数。
[0018]所述步骤S303中,确定近邻样本的分类输出标签的方法为:
[0019]循环计算临时置信度矩阵和标签置信度矩阵F
(t)
,计算公式为:
[0020][0021][0022][0023]其中,t表示传播次数;F
(0)
表示初始的标签置信度矩阵,取样本的候选标签集中候选标签个数的均值作为当前样本的初始标签置信度;α是权重,W
K
表示K近邻权重矩阵,W
N
表示N近邻权重矩阵;F
(t

1)
表示第t

1次传播时得到的标签置信度矩阵为临时置信度矩阵中的元素,中的元素,表示标签置信度矩阵F
(t)
中的元素;表示候选标签集中第i个样本的分类输出标签为类别l的临时置信度,y
l
表示类别l的标签,S
i
表示候选标签集,n表示本层训练样本数量,q表示类别个数;
[0024]当达到收敛条件时,停止循环,将标签置信度矩阵中最大置信度值对应的标签作为近邻样本的标签。
[0025]所述步骤S1中,度中心性为样本相似度总和;
[0026]确定各个类别的典型样本的方法为:将各个样本的度中心性值进行排序,选择同一类别组内度中心性排序靠前的A%的样本作为典型样本。
[0027]所述步骤S303中,根据度中心性增加各个类别的典型样本数量的具体方法为:
[0028]对同一类别组内各个样本的度中心性值进行排序,选择同一类别组内度中心性排序中前B%的非典型样本作为新的典型样本,加入典型样本集,其中B大于A。
[0029]所述步骤S2中,确定训练集样本的候选标签的具体方法为:
[0030]将典型样本的原始标签认定为分类输出标签;
[0031]计算其余样本与各个类别中心的相似度,除原始标签外,选择相似度最高的一个类别中心对应的标签作为候选标签,将其与原始标签一起加入当前样本的候选标签集;最终确定所有训练样本的候选标签,生成候选标签集。
[0032]所述步骤S302中,所述本层样本的K+N近邻样本图结构的构建方法为:
[0033]基于训练样本的典型样本集、类别中心和样本特征,构建训练样本的全连接原始图;
[0034]对全连接原始图进行两次稀疏化,获得K近邻样本图和N近邻典型样本图;
[0035]将K近邻样本图和N近邻典型样本图叠加,得到本层样本的K+N近邻样本图。
[0036]本专利技术提供了一种基于近邻传播偏标签学习的脑影像数据分类模型建立方法,不同于已有的分类算法,避免现今精神疾病诊断分类算法对于临床医生的诊断结果的过分依赖,结合图结构对样本标签传播,建立模型,与现有技术相比具有以下效果:
[0037]1、本专利技术基于K+N近邻样本图度量样本之间的关系,利用偏标签学习算法有效利用了标签更可信样本的信息,提高了样本分类的准确性。
[0038]2、有关偏标签分类辅助精神疾病诊断的研究很少,偏标签算法默认初始标签为候选标签集中的任本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于近邻传播偏标签学习的脑影像分类模型建立方法,其特征在于,包括以下步骤:S1、获取训练数据集和对应的原始标签;在训练数据集的同一类别样本内计算各个样本间相似度矩阵以及度中心性,根据度中心性确定各个类别的典型样本;然后,将同一类别组内所有典型样本的均值作为该类别的初始类别中心;根据各个类别下的典型样本构成典型样本集,根据各个类别的初始类别中心构成类别中心集;S2、确定训练数据集中样本的候选标签,构建候选标签集;S3、通过训练数据集,利用K+N近邻样本图建立分类模型,其具体包括:S301、将典型样本和其K个近邻节点样本作为本层样本,确定其近邻节点样本的候选标签;S302、根据训练样本的典型样本集、类别中心和样本特征,构建本层样本的K+N近邻样本图;所述K+N近邻样本图包括K个近邻样本节点和N个近邻典型样本节点;S303、通过典型样本对其近邻节点样本进行标签推理,确定其近邻节点样本的分类输出标签,然后,计算同一类别组内各个样本的度中心性,根据度中心性增加各个类别的典型样本数量,更新典型样本集、类别中心集以及候选标签集;S304、判断是否全部样本标签确定,若否,则返回步骤S301;若是,则输出所有样本的最终分类输出标签,完成分类模型的建立。2.根据权利要求1所述的一种基于近邻传播偏标签学习的脑影像分类模型建立方法,其特征在于,所述脑影像数据包括:脑功能核磁共振成像数据、脑结构核磁共振数据、弥散张量成像数据、脑电数据、脑磁数据;所述脑影像数据的特征包括:脑功能连接特征、脑灰质密度和体积特征、脑结构连接特征、脑电信号特征、脑影像多模态融合后的特征。3.根据权利要求1所述的一种基于近邻传播偏标签学习的脑影像分类模型建立方法,其特征在于,所述步骤S1中,所述相似度矩阵的矩阵元为相关系数,所述相关系数为皮尔逊相关系数、高斯核求解相关系数或回归求解相关系数。4.根据权利要求1所述的一种基于近邻传播偏标签学习的脑影像分类模型建立方法,其特征在于,所述步骤S303中,确定近邻样本的分类输出标签的方法为:循环计算临时置信度矩阵和标签置信度矩阵F
(t)
,计算公式为:,计算公式为:,计算公式为:其中,t表示传播次数;F
(0)
表示初始的标签置信度矩阵,取样本的候选标签集中候选标签个数的均值作为当前样本的初...

【专利技术属性】
技术研发人员:杜宇慧李博
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1