基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统技术方案

技术编号:23936000 阅读:115 留言:0更新日期:2020-04-25 03:11
本发明专利技术公开了一种基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统,包括依次连接的数据采集单元、离线处理单元、进程预测单元,通过对由多位受试者在baseline时测得的多个模态数据进行预处理;利用多任务直推式矩阵补全模型,将多个时间点的疾病状态预测建模为一个多任务回归问题;选择出task‑share特征和task‑specific特征,利用这两种特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测。

Prediction method and system of brain disease process based on weak supervision multi task matrix completion

【技术实现步骤摘要】
基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统
本专利技术涉及人工智能和机器学习领域,具体涉及一种基于弱监督多任务矩阵补全模型的脑疾病进程预测方法。
技术介绍
阿尔茨海默病(Alzheimer’sdisease,AD)是一种不可逆的神经退行性疾病,其特征是神经元及其连接受损,导致患者渐进性记忆丧失和认知能力下降,最终死亡。最近的研究表明,全世界大约有2660万名AD患者,到2050年,每85人中将有1人将受到AD的影响。准确地预测AD的疾病进程,便能根据预测结果,及时对患者进行有效的针对性治疗,较大地延缓和改善病情,对于AD的临床诊断和预后具有重要意义。许多临床/认知测量被设计用来评估患者的认知状态,并作为可能的AD临床诊断的重要标准,例如简易精神状态量表(Mini-mentalStateExamination,MMSE)和阿尔茨海默病评估量表-认知子量表(Alzheimer’sDiseaseAssessmentScale-Cognitivesection,ADAS-Cog)。MMSE已被证明与潜在的AD病理学和功能的逐步恶化相关。ADAS-Cog则是评估AD药物试验认知功能的主要标准。在传统的疾病进程预测研究中,大部分人采用回归模型进行预测,如Stonnington等人,使用了相关向量回归(relevancevectorregression,RVR)方法来测量结构变化和神经心理学测试之间的相互作用关系。另一部分人采用生存模型,如Pearson等人,将疾病进程预测建模成典型的生存分析问题。这些方法在样本维度较小时取得了较好的效果,但是当维度较高,如使用医学影像作为输入特征时,他们的效果并不理想。为此,研究者通常采用降维技术来处理高维问题,如Duchesne等人,使用主成分分析(PrincipalComponentAnalysis,PCA)技术将高维数据映射到低维空间中。周涛等人将高维基因型数据和表现型图像数据共同映射到由诊断标签引导的联合潜在特征空间来处理高维问题。同时,现有研究大多集中在对单个时间点,如baseline(患者第一次到医院接受检查的时间)或者baseline一年以后的状态预测上,但是,对多个时间点的数据进行联合分析可以利用其之间的关联性提高预测效果,尤其是当样本数较少且样本维度较大时。为了充分利用多个时间点疾病状态的关联性,许多人将多任务学习思想应用到疾病进程预测上。多任务学习的目的是通过同时学习多个相关任务,挖掘任务之间的内在关联性,提高泛化性能。由于神经影像学数据的珍贵和稀少,Jabason等人将弱监督学习思想与疾病进程预测相结合,充分挖掘样本潜在的结构信息。同时,现有的大部分论文在进行特征选择时仅考虑了选择与所有任务相关的公共特征子集,并没有考虑到每个任务所独有的特征,也没有考虑到样本存在噪声。
技术实现思路
专利技术目的:为了克服现有疾病进程预测研究中存在的样本过拟合问题和特征含噪问题,提出一种基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统,该方法能有效利用多个时间点疾病状态的内在关联性,充分挖掘出样本之间的低秩性及结构分布信息,选择出task-share特征和task-specific特征,解决过拟合问题,并对样本进行去噪,从而获得较高的预测准确率。技术方案:为实现上述目的,本专利技术采用的技术方案为:一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,包括以下步骤:步骤1:对受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征。步骤2:利用多任务直推式矩阵补全模型,将对第一次去医院接受检查之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵。步骤2具体包括如下步骤:步骤2-1,基于特征矩阵X的低秩性假设和X与Y之间的线性关联假设,补全后得到的矩阵Z=[ZX,ZY]也是低秩的,其中,矩阵ZX是对应于矩阵X的真实潜在的特征矩阵,ZY是对应于矩阵Y的真实潜在的评分矩阵。通过对Z矩阵使用核范数约束,并对补全前的特征矩阵X和补全后的特征矩阵ZX之间使用F范数约束作为保真项,其公式如下:其中,Z是一个维度为n×(d+t)的矩阵,表示实数,d代表特征数,n代表样本数,t代表任务数,W表示权重矩阵,λ1,λ2和λ3是正则化参数,‖Z‖*表示矩阵Z的核范数,P是一个mask矩阵,Pij表示矩阵P中第i行第j列的元素,当第i个样本在第j个时间点的认知评分缺失时,Pij=0,反之则为1,⊙表示哈达玛积。步骤2-2,疾病进程预测的目的是预测出受试者在第一次去医院接受检查后一段时间的疾病状态,对第一次去医院接受检查后每隔一定时间间隔的特定时间点的疾病状态进行预测。采用简易精神状态量表MMSE和阿尔茨海默病评估量表-认知子量表ADAS-Cog的认知评分来表示受试者的疾病状态。步骤3:利用混合稀疏组Lasso特征选择方法选择出所有任务共享的task-share特征和每个任务所独有的task-specific特征,利用task-share特征、task-specific特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测。步骤3具体包括如下步骤:步骤3-1,对系数矩阵使用范数约束,使得W行稀疏,通过训练得到W,其中,W的每一行对应一个特征,每一列对应一个任务,W的非零行所对应的特征即为task-share特征。步骤3-2,对系数矩阵使用范数约束,使得W任意稀疏,使得W的非零行中出现随机的零值,所以W的非零行对应的特征即为非零行中非零值对应任务的task-specific特征。步骤3-3,引入时序平滑正则化项对相邻时间点评分预测的较大偏差进行惩罚。步骤3-4,结合步骤3-1、步骤3-2、步骤3-3中的范数约束,关于task-share特征和task-specific特征的特征选择项,又称混合稀疏组Lasso项:步骤3-5,结合步骤3-1和步骤3-4中的直推式矩阵补全模型和混合稀疏组Lasso项,得到如下模型:步骤3-6,将步骤3-4中的模型改进为如下的非凸多任务回归形式:步骤3-7,结合快速迭代收缩阈值算法和DC规划方法设计步骤3-6所提出模型的求解方法。通过交替迭代以下两个子问题来求解出W和Z:其中,公式(5)中的子问题1用FISTA方法来求解,令:其中,F(Z,W)表示公式(5)中除了核范数的可导项的集合。那么子问题1就用如下方式求解:其中,表示核范数的近邻算子,表示步长,而Lipschitz连续常数求解如下:其中,σ1(·)表示括号中矩阵的最大奇异值,T表示矩阵的转置,Id×d表示维度为d×d的单位矩阵。此外,梯度计算如下:<本文档来自技高网
...

【技术保护点】
1.一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于,包括以下步骤:/n步骤1:对受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征;/n步骤2:利用多任务直推式矩阵补全模型,将对第一次去医院接受检查之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵;/n步骤2具体包括如下步骤:/n步骤2-1,基于特征矩阵X的低秩性假设和X与Y之间的线性关联假设,补全后得到的矩阵Z=[Z

【技术特征摘要】
1.一种基于弱监督多任务矩阵补全的脑疾病进程预测方法,其特征在于,包括以下步骤:
步骤1:对受试者在第一次去医院接受检查时测得的磁共振成像MRI、正电子发射断层显像PET和脑脊液CSF测量值进行预处理,得到磁共振成像特征、正电子发射断层显像特征、脑脊液特征;
步骤2:利用多任务直推式矩阵补全模型,将对第一次去医院接受检查之后每个时间点的疾病状态预测都视作一个单任务回归任务,从而多个时间点的疾病状态预测建模为一个多任务回归问题,并对特征矩阵进行去噪,在标记部分缺失的情况下预测出认知评分矩阵;
步骤2具体包括如下步骤:
步骤2-1,基于特征矩阵X的低秩性假设和X与Y之间的线性关联假设,补全后得到的矩阵Z=[ZX,ZY]也是低秩的,其中,矩阵ZX是对应于矩阵X的真实潜在的特征矩阵,ZY是对应于矩阵Y的真实潜在的评分矩阵;通过对Z矩阵使用核范数约束,并对补全前的特征矩阵X和补全后的特征矩阵ZX之间使用F范数约束作为保真项,其公式如下:



其中,Z是一个维度为n×(d+t)的矩阵,表示实数,d代表特征数,n代表样本数,t代表任务数,W表示权重矩阵,λ1,λ2和λ3是正则化参数,‖Z‖*表示矩阵Z的核范数,P是一个mask矩阵,Pij表示矩阵P中第i行第j列的元素,当第i个样本在第j个时间点的认知评分缺失时,Pij=0,反之则为1,⊙表示哈达玛积;
步骤2-2,疾病进程预测的目的是预测出受试者在第一次去医院接受检查后一段时间的疾病状态,对第一次去医院接受检查后每隔一定时间间隔的特定时间点的疾病状态进行预测;采用简易精神状态量表MMSE和阿尔茨海默病评估量表-认知子量表ADAS-Cog的认知评分来表示受试者的疾病状态;
步骤3:利用混合稀疏组Lasso特征选择方法选择出所有任务共享的task-share特征和每个任务所独有的task-specific特征,利用task-share特征、task-specific特征进一步提高评分矩阵的预测准确率,从而完成对疾病进程的预测;
步骤3具体包括如下步骤:
步骤3-1,对系数矩阵使用l2,1范数约束,使得W行稀疏,通过训练得到W,其中,W的每一行对应一个特征,每一列对应一个任务,W的非零行所对应的特征即为task-share特征;
步骤3-2,对系数矩阵使用l1范数约束,使得W任意稀疏,使得W的非零行中出现随机的零值,所以W的非零行对应的特征即为非零行中非零值对应任务的task-specific特征;
步骤3-3,引入时序平滑正则化项对相邻时间点评分预测的较大偏差进行惩罚;
步骤3-4,结合步骤3-1、步骤3-2、步骤3-3中的范数约束,关于task-share特征和task-specific特征的特征选择项,又称混合稀疏组Lasso项:



步骤3-5,结合步骤3-1和步骤3-4中的直推式矩阵补全模型和混合稀疏组Lasso项,得到如下模型:



其中,稀疏矩阵定义如下:其他元素为零;
步骤3-6,将步骤3-4中的模型改进为如下的非凸多任务回归形式:



步骤3-7,结合快速迭代收缩阈值算法和DC规划方法设计步骤3-6所提出模型的求解方法;
通过交替迭代以下两个子问题来求解出W和Z:



其中,公式(5)中的子问题1用FISTA方法来求解,令:



其中,F(Z,W)表示公式(5)中除了核范数的可导项的集合;
那么子问题1就用如下方式求解:



其中,表示核范数的近邻算子,表示步长,而Lipschitz连续常数求解如下:...

【专利技术属性】
技术研发人员:王凌胜陈蕾查思明李平
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1