基于自监督图卷积模型的自闭症疾病预测技术制造技术

技术编号:38934276 阅读:25 留言:0更新日期:2023-09-25 09:37
本发明专利技术提供一种基于自监督图卷积模型的自闭症疾病预测技术,属于人工智能生物医学领域;本技术旨在解决自闭症疾病预测的准确性和效率问题;本发明专利技术的技术方案主要包括:采用基于图卷积网络的自监督学习方法,利用大规模未标记的数据集训练图卷积神经网络;利用图对比学习方法,通过图的结构和属性的随机增强来生成两个图的视图,迫使模型学习对不重要的节点和边缘的扰动,以强制模型识别底层的语义信息,进一步提高预测准确性。本技术的主要用途是辅助医生进行自闭症的诊断和治疗,提高预测准确性和效率,为患者提供更好的医疗服务。为患者提供更好的医疗服务。

【技术实现步骤摘要】
基于自监督图卷积模型的自闭症疾病预测技术


[0001]本申请属于使用深度学习进行疾病预测领域,特别涉及了使用自监督学习中的图对比学习以及使用欧几里得距离算法进行构图,使用谱图卷积进行预测。谱图卷积利用了卷积在傅里叶域中的性质,通过找到相应的“傅里叶”基,可以将卷积扩展到一般的图。对于低维图,能够学习到独立于输入大小的卷积层参数,从而得到有效的深层结构。

技术介绍

[0002]图卷积神经网络在医学图像中取得了很大的成功,在图像分类领域,深度神经网络在医学图像分析中起着重要的作用,对于单模态的图像数据的研究,图像分类根据输入图像并生成输出分类,用于预测是否患病。将图像数据与非图像数据结合起来进行疾病的诊断是医学临床当中的一项重要的任务,多模态生物医学技术推动了计算机在医学上进行辅助诊断的研究,与单模态的数据相比,多模态的异构数据可以提供更多关于患者病情的信息,使得诊断更加可靠。

技术实现思路

[0003]为了解决上述存在的技术问题,本专利技术的目的是提供一种基于自监督图对比学习的图卷积网络实现自闭症疾病预测,对比学习能够迫使模型学习在不重要节点和边上的扰动,以强制模型识别底层语义信息,以至于能够更好地帮助学习图表示、节点表示,实现根据输入的视图获得更准确的预测,有效的进行辅助诊断。包括以下步骤:
[0004]数据预处理:每个受试者包括图像数据、标签、非图像数据。图像数据为受试者的功能磁共振图(fMRI),通过受试者标签(DX_GROUP)可以将自闭谱系障碍患者与正常人分别标记为1和2,非图像数据为患者的个人统计信息年龄、性别等等。通过加载预先计算的fMRI功能磁共振成像网络来获得图像数据的矩阵表示,从表型文件中获取受试者的标签以及其他非图像数据,最后,对于871位受试者来说,采用10倍交叉验证的方法将每一份作为验证集,其他作为训练集来进行训练和验证,来降低泛化能力。
[0005]提取非图像数据的矩阵表示:从数据集中选出的871位受试者,根据受试者的编号信息(subject_IDs)选择出所对应的非图像数据,考虑到数据之间可能具有差异性,所以使用了归一化的方式使得不同向量空间的嵌入表示映射到同一个空间。所采用的Z

score标准化方法从行的角度来处理特征数据,称为标准差标准化,这种方法给予原始数据的均值(mean)和标准差(standard deviation),能够将样本的特征值转换到同一量纲下。数据的标准化的方式可表示为:
[0006][0007]这里μ是原始数据的所有样本数据的均值,σ是标准差,x
*
,y
*
是样本中的数据。经过处理后,得到同一空间的数据,使用欧几里得(Euclidean)度量算法去计算成对关联:
[0008][0009]这里x
*i
,y
*i
分别表示两个受试者的特征向量,选择了m维的特征。
[0010]提取多模态数据中图像数据的矩阵表示:每位受试者的图像数据是由fMRI功能磁共振成像组成,先加载预先计算的功能磁共振成像连接网络,使得每位受试者的图像数据用111*111的多维数组表示出来,取其中一个上三角矩阵,能够得到一个(871,6105)维的数组,来表示每位受试者的图像数据。通过一个分类器对特征向量进行降维,随机定义一个C的初始值,使用选择器RFE从获得的fMRI中提取出代表受试者功能连接性的C维特征向量,计算两两受试者之间的特征距离,最后得到受试者的相似性表示。
[0011]增强图对比学习:由图像数据得到的相似性矩阵与非图像数据得到的相似性矩阵结合起来,得到的矩阵看作是一个全连接图,将图数据进行两次数据增强,分别是拓扑级别的增强和节点属性级别的增强。
[0012]对于拓扑级别的增强,根据节点的中心性来设定删边的概率,边缘的重要性通常由它们所指向的节点来表征,不重要的边被删除的概率更高。设置一个超参数,用来控制移除边的数量的概率,因为移除边较多,会破坏图的结构。
[0013]对于节点属性级别的增强,通过在节点特征中随机掩蔽一部分维度,将噪声随机添加到节点属性中,最后生成的节点特征,表示为:
[0014][0015][
·

·
]是连接运算符,指的是每个元素乘法。通过联合执行拓扑和节点属性增强来生成两个视图。
[0016]使用谱图卷积进行疾病预测:将通过设置不同的丢失概率得到的节点特征与两个图视图输入到图卷积网络当中。谱图卷积模块:谱GCN分别与生成的两个图视图进行优化,得到两种预测结果,GCN模型由切比雪夫(Chebyshev)图卷积层L
G
、融合块、MLP预测器三部分构成。为了缓解GCN中存在的过度平滑问题,采用节点跳跃连接来融合每个深度中的隐藏特征。
[0017]计算损失:将标签分别与得到的两种预测结果计算损失,并相加,损失函数反向传播,使用Adam优化器,用来根据参数的梯度进行沿梯度下降方向进行调整模型参数。使用常用的评估指标对预测结果进行量化。
[0018]在该申请中,基于前述方案,所述的确定单元配置为一种基于图对比学习的卷积神经网络,包括以下模块:
[0019]数据提取以及拓扑构建模块:提取ABIDE数据集中的所选择871位受试者的功能磁共振图像数据和表型数据中所需维度的数据,所需表型数据经过归一化处理,欧几里得距离度量,再与图像信息相结合,得到全连接的图拓扑;
[0020]图对比网络模块:在图和节点特征之间应用对比约束,使互信息最大化,使用数据增强方案保留图的内在结构和属性,这将迫使模型学习对不重要的节点和边缘的扰动不敏感的表示。
[0021]谱图卷积模块:谱GCN分别与生成的两个图视图进行优化,得到两种预测结果,GCN
模型Chebyshev图卷积层L
G
、融合块、MLP预测器三部分构成。为了缓解GCN中存在的过度平滑问题,采用节点跳跃连接来融合每个深度中的隐藏特征。
[0022]其中,切比雪夫图卷积模块能够以适度的计算成本在不规则加权图上实现局部滤波,其中每个卷积层之后都有ReLU激活函数以增加非线性。
[0023]本专利技术提供了这样一个疾病预测技术,使用公开的ABIDE数据集,获取受试者的原始特征、标签、非图像特征,使用10倍交叉验证;利用Euclidean算法构造出受试者之间的关系矩阵,再与图像特征相似性矩阵进行融合,得到更精确的矩阵表示;使用增强图对比学习,对图数据进行两次增强,进一步提高图的鲁棒性;最后,使用谱图卷积进行疾病预测,使用MLP得到最后的分类结果。
附图说明
[0024]图1是本专利技术的一种图对比学习进行数据增强方法示意图;
[0025]图2是本专利技术疾病预测的流程图;
[0026]图3是本专利技术整体架构图。
具体实施方式
[0027]下面结合附图和具体实施对本专利技术做进一步的详细说明。对于以下实施中的步骤编号,其仅为了便于阐述说明而设置,下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自监督图卷积模型的自闭症疾病预测技术其特征在于,包括如下所述内容:S1:数据预处理:获取自闭症脑成像数据库(ABIDE)中的受试者信息,其中每位受试者信息包含图像数据和非图像数据。S2:提取非图像数据的矩阵表示:利用相应受试者的表型数据,选择所需的各个维度的特征,利用欧几里得(Euclidean)度量算法构造出受试者之间的关系矩阵。S3:提取多模态数据中图像数据的矩阵表示:每位受试者的图像数据是由fMRI功能磁共振成像组成,从获得的fMRI中提取出代表受试者功能连接性的一定维度的特征向量,计算每位受试者的相似性,最后得到表示受试者之间图像数据相似性的矩阵表示。S4:增强图对比学习:将S2中非图像数据的相似性矩阵与S3中图像数据的相似性矩阵做矩阵乘法,得到的矩阵是一个全连接图,作为节点对之间的评分矩阵;我们将大于一定分数阈值的节点对保留,从而得到一个图的邻接矩阵(图拓扑结构),通过度中心性算法对图拓扑结构进行增强,通过节点特征随机添加噪声对节点属性进行增强,得到节点表示向量和图表示向量,我们设置不同的增强概率,生成两个新的视图(view);进一步增强图的鲁棒性。S5:使用谱图卷积进行疾病预测:将通过设置不同的丢失概率得到的节点特征与两个视图输入到图卷积网络(GCN)当中,通过神经网络全连接层输出最后的分类概率,通过与真实分类标签计算损失实现图卷积神经网络的训练,以及推理出模型的预测结果。2.根据权利要求1所述的基于自监督图卷积模型的自闭症疾病预测技术S4步骤,其特征在于:首先从每位受试者中选择出一些维度的表型数据,使用Euclide...

【专利技术属性】
技术研发人员:李文欣韩龙飞
申请(专利权)人:北京工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1