一种构建精神分裂症、躁郁症和抑郁症分类模型的方法技术

技术编号:38102676 阅读:15 留言:0更新日期:2023-07-06 09:22
本发明专利技术属于生物信息学领域,公开了一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,包括步骤1:基于公共数据库,对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数据进行收集;步骤2:对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数进行数据预处理和数据整合;步骤3:在精神分裂症、躁郁症、抑郁症和健康对照这四类样本中,采用偏最小二乘判别分析筛选差异表达基因;步骤4:应用筛选出来的差异表达基因,构建精神分裂症、躁郁症、抑郁症的多类分类模型。本发明专利技术可以实现对精神分裂症、躁郁症和抑郁症这三个疾病与健康对照样本的准确分类,将有助于精神类疾病的临床诊断。的临床诊断。的临床诊断。

【技术实现步骤摘要】
一种构建精神分裂症、躁郁症和抑郁症分类模型的方法


[0001]本专利技术属于生物信息学领域,具体的说是涉及一种构建精神分裂症、躁郁症和抑郁症分类模型的方法。

技术介绍

[0002]精神分裂症、躁郁症和抑郁症是病因复杂的多基因疾病,也是人群发病率和死亡率的重要来源。这些疾病与病人的高死亡率和高自杀率息息相关。精神分裂症是一种慢性复杂的精神疾病,影响着大约1%的世界人口,通常在15至25岁的人群中缓慢而渐进地出现。精神分裂症病人的特点是社交障碍和职业能力下降,目前在病因学研究和治疗方面仍然存在严峻的挑战。躁郁症是一种严重的精神障碍,以情绪状态、行为和精力水平的波动为特征。躁郁症的特征是情绪极端变化,自杀率高,以及睡眠问题等心理特征功能障碍。抑郁症的特征是持续两周以上的抑郁情绪,并导致情绪困扰、功能障碍、健康问题和自杀等严峻问题。
[0003]虽然这三种精神类疾病在医学生上被定义为不同的疾病,但是精神分裂症、躁郁症和抑郁症的病人又存在着许多共同的症状,包括精神病、自杀意念、睡眠障碍和认知缺陷等。因此,仅靠医生的主观判断,这三种精神疾病之间的诊断界限很难确定。据报道,这些疾病的潜在分子病理学研究,对于解决精神疾病的巨大难题并改善病患的健康是十分必要的。然而,由于缺乏辅助诊断和治疗的客观标志物,精神疾病是目前医学上仅存的依靠症状进行疾病诊断的领域。因此,开发精神疾病领域的有效诊断方法已成为医学研究的重要目标。
[0004]对这三种精神疾病的分子层面的研究将有助于深入了解其共同症状背后的生物学意义。精神分裂症、躁郁症和抑郁症的客观诊断标准将有助于明显提升精神科医生在诊断过程中的效率。尽管目前已经有了大量研究,但是,对于这三种精神疾病的诊断,仍然缺乏一个准确度高、一致性好的分类模型。

技术实现思路

[0005]为了探索精神分裂症、躁郁症和抑郁症这三种精神类疾病的客观诊断标准,本专利技术构建精神分裂症、躁郁症和抑郁症分类模型的方法,改分类模型将为提高这三种精神疾病的诊断效率提供有价值的帮助。
[0006]为了达到上述目的,本专利技术是通过以下技术方案实现的:
[0007]本专利技术是一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,该方法包括如下步骤:
[0008]S1、基于公共数据库,对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数据进行收集;
[0009]S2、对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数据进行数据预处理和数据整合;
[0010]S3、在精神分裂症、躁郁症、抑郁症和健康对照这四类样本中,采用偏最小二乘判别分析筛选差异表达基因;
[0011]S4、应用筛选出来的差异表达基因,构建精神分裂症、躁郁症、抑郁症的多类分类模型。
[0012]进一步地,步骤S1具体为:
[0013]S11、检索转录组学的公共数据库,收集包含精神分裂症、躁郁症、抑郁症和健康对照这四类样本的转录组学原始数据;
[0014]S12、按照数据收集标准对S11所获得的原始数据进行筛选,符合条件的纳入分析范围。
[0015]进一步地,步骤S2具体为:
[0016]S21、将筛选的多个独立转录组学数据集进行整合,以用于下游分析;
[0017]S22、由于整合后的数据集中存在批次效应,因此需要将批次效应去除。
[0018]进一步地,步骤S3具体为:
[0019]S31、通过偏最小二乘判别分析在四类样本中筛选精神类疾病的差异表达基因;
[0020]S32、充分验证筛选的差异表达基因的疾病相关性和可靠性。
[0021]进一步地,步骤S4具体为:
[0022]S41、基于筛选的精神分裂症、躁郁症、抑郁症和健康对照这四类样本之间的差异表达基因,应用支持向量机构建多类分类模型;
[0023]S42、充分验证所构建的多类分类模型的性能,通过五折交叉验证证明构建的分类准确率能够达到0.93。
[0024]本专利技术的有益效果是:本专利技术对收集到的多组转录组学数据进行预处理和整合,并通过偏最小二乘判别分析筛选精神分裂症、躁郁症和抑郁症的差异表达基因,基于这些基因,构建精神分裂症、躁郁症和抑郁症的多类分类模型,并对其性能进行充分验证,发现其分类准确率能够达到0.93。
[0025]本专利技术的这个对于精神类疾病的多类分类模型,可以实现对精神分裂症、躁郁症和抑郁症这三个疾病与健康对照样本的准确分类,将有助于精神类疾病的临床诊断。
附图说明
[0026]图1是本专利技术构建精神分裂症、躁郁症和抑郁症分类模型的方法的流程图。
[0027]图2是精神分裂症、躁郁症和抑郁症的多类分类模型的ROC曲线即受试者工作特征曲线。
具体实施方式
[0028]以下将以图式揭露本专利技术的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本专利技术。也就是说,在本专利技术的部分实施方式中,这些实务上的细节是非必要的。
[0029]如图1所示,本专利技术构建精神分裂症、躁郁症和抑郁症分类模型的方法,包括以下步骤:
[0030]S1、基于公共数据库,收集多组精神分裂症、躁郁症、抑郁症和健康对照样本的转
录组学原始数据;
[0031]进一步地,步骤S1具体为:
[0032]S11、本专利技术通过检索公共数据库GEO和SMRI数据库,根据关键词“schizophrenia”、“bipolar disorder”和“major depressive disorder”,收集多组精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数据;
[0033]S12、根据以下标准对收集到的原始数据进行筛选:
[0034](A)、采用基因芯片技术进行基因表达谱分析;
[0035](B)、研究对象为人类的基因表达谱数据;
[0036](C)、检测大脑中的前额叶皮层的Brodmann区域(BA9、BA10和BA46)的基因表达;
[0037](D)、数据集必须包括四个样本组,即精神分裂症、躁郁症、抑郁症和健康对照组;
[0038]因此,本专利技术共包括三个独立的基因表达谱研究,每个研究包括一组精神分裂症患者,一组躁郁症患者,一组抑郁症患者和一组健康对照样本。
[0039]S2、对多组独立的转录学数据进行数据预处理和数据整合;
[0040]进一步地,步骤S2具体为:
[0041]S21、本专利技术对多个独立的数据集进行数据预处理。首先,应用affy包读取原始数据(CEL文件)、进行对数转换和数据归一化。然后,将所有基因的探针名称映射到相应的基因名称。当多个探针对应为一个基因时,保留其平均值作为该基因的表达值。最后,将三个独立的数据集合并为一个包含精神分裂症、躁郁症、抑郁症和健康对照样本的整合数据集;
[0042]S22、对于这个整合后的数据集,需要去除不同研究之间的批次效应。本专利技术采用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,其特征在于:分类模型的构建方法包括如下步骤:步骤1:基于公共数据库,对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数据进行收集;步骤2:对精神分裂症、躁郁症、抑郁症和健康对照样本的转录组学原始数进行数据预处理和数据整合;步骤3:在精神分裂症、躁郁症、抑郁症和健康对照这四类样本中,采用偏最小二乘判别分析筛选差异表达基因;步骤4:应用筛选出来的差异表达基因,构建精神分裂症、躁郁症、抑郁症的多类分类模型。2.根据权利要求1所述的一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,其特征在于:所述步骤1具体包括如下步骤:步骤1

1、检索转录组学的公共数据库,收集包含精神分裂症、躁郁症、抑郁症和健康对照这四类样本的转录组学原始数据;步骤1

2、按照数据收集标准对步骤1

1所获得的原始数据进行筛选,符合条件的纳入分析范围。3.根据权利要求2所述的一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,其特征在于:所述步骤1

2中,根据以下标准对收集到的原始数据进行筛选:(A)、采用基因芯片技术进行基因表达谱分析;(B)、研究对象为人类的基因表达谱数据;(C)、检测大脑中的前额叶皮层的Brodmann区域(BA9、BA10和BA46)的基因表达;(D)、数据集必须包括四个样本组,即精神分裂症、躁郁症、抑郁症和健康对照组。4.根据权利要求1所述的一种构建精神分裂症、躁郁症和抑郁症分类模型的方法,其特征在于:所述步骤2具体包括如下步骤:步骤2

1、本发明对多个独立的数据集进行数据预处理:首先,应用affy包读取原始数据(CEL文件)、进行对数转换和...

【专利技术属性】
技术研发人员:杨庆霞邢侨文
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1