System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于血浆光谱的多种疾病筛查分类系统技术方案_技高网

一种基于血浆光谱的多种疾病筛查分类系统技术方案

技术编号:41345855 阅读:8 留言:0更新日期:2024-05-20 10:01
本发明专利技术提供一种基于血浆光谱的多种疾病筛查分类系统,涉及智能医疗检测技术领域。该系统包括依次连接的:数据增强模块、特征选择模块、筛查模型模块、基于决策有向无环图的多分类模型集成模块和模型评价模块。该系统通过获取血浆光谱数据构建血浆光谱样本集,利用KS算法划分出训练集并对训练集进行样本数据扩充;获取样本特征,利用特征选择算法进行特征选择并进行重要性排序,得到排序后的训练集;采用随机森林分类器构建若干个二元子分类器,基于交叉验证利用排序后的训练集训练每个二元子分类器并集成,得到基于决策有向无环图的血浆光谱多分类器模型,实现对多种易混疾病的血浆光谱进行高灵敏度、高特异性且快速地批量筛查分类。

【技术实现步骤摘要】

本专利技术涉及智能医疗检测,尤其涉及一种基于血浆光谱的多种疾病筛查分类系统


技术介绍

1、随着我国人口老龄化的不断加剧以及医学技术的不断进步,很多大病重病都得以治疗。随之而来的,人们更加关注复杂慢性疾病,这类疾病造成会沉重的家庭和社会负担,尽早发现是延缓和逆转病程的关键。

2、痴呆症中有许多亚类,例如阿尔茨海默症,是痴呆症中比例最高的一种不可逆神经退行性疾病,也是老年人中常见的疾病;路易体痴呆是一种以波动性认知障碍、生动的视幻觉、快速眼动期睡眠障碍为特点的进行性神经系统变性病。路易体痴呆与阿尔茨海默痴呆都是隐袭起病,进行性加重,逐渐出现比较广泛的认知功能的损害。因此路易体痴呆是最常见被误诊为阿尔茨海默痴呆的亚型。帕金森痴呆是痴呆症中第二大流行的神经退行性疾病,主要特征表现为运动障碍,包括:进行性运动迟缓、肌强直、静止性震颤和姿势步态异常等,此外还可伴有大量非运动症状,如嗅觉减退、便秘、抑郁、睡眠障碍等。有研究认为阿尔茨海默痴呆症与帕金森痴呆症在生理表现、病理特征、病因学和发病机制上存在广泛的重叠,两者可能存在相似的认知损害。因此,需要对上述三种类别的痴呆症进行检测分类。

3、而现有的检测方式,主要有脑脊液相关生物标志物生化检查;计算机断层成像(computed tomography,ct)和磁共振成像(magnetic resonance imaging,mri)影像检查;日常生活能力、神经心理学测验评估等方法。其中生化检查需要进行腰部穿刺,患者不易接受;测验评估则依赖于医师的主观经验评判,不能从客观的角度进行判断;而影像检测则具有价格昂贵,会出现颅骨隐形干扰等缺点。


技术实现思路

1、针对上述现有技术的不足,本专利技术提出了一种基于血浆光谱的多种疾病筛查分类系统,实现利用分析血浆光谱对阿尔茨海默痴呆(alzheimer disease,ad)、帕金森痴呆(parkinson disease,pd)、路易体痴呆(dementia with lewy bodies,dlb)进行高效地分类。

2、本专利技术提出的一种基于血浆光谱的多种疾病筛查分类系统,包括依次连接的:数据增强模块、特征选择模块、筛查模型模块、基于决策有向无环图的多分类模型集成模块以及模型评价模块;

3、所述数据增强模块,用于获取血浆光谱数据并构建血浆光谱样本集,再利用过采样技术进行数据扩充;

4、所述特征选择模块,用于对接收扩充后的血浆光谱样本集进行特征选择,并采用特征选择算法分析该样本集中血浆光谱样本的光谱数据的统计特性;

5、所述筛查模型模块,用于利用随机森林分类器构建若干个二元子分类器,并根据光谱数据的统计特性对若干个二元子分类器进行训练,得到训练好的若干个二元子分类器;

6、所述基于决策有向无环图的多分类模型集成模块,用于对训练好的若干个二元子分类器采用决策有向无环图算法进行集成,得到基于决策有向无环图的血浆光谱多分类器模型;

7、所述模型评价模块,用于通过混淆矩阵求解基于决策有向无环图的血浆光谱多分类器模型的灵敏度和特异性作为评价指标来评价该模型的性能;

8、本专利技术提出的一种基于血浆光谱的多种疾病筛查分类系统,采用以下步骤实现多种疾病的筛查分类,包括:

9、步骤1:获取血浆光谱数据构建血浆光谱样本集,利用kennard-stone算法将血浆光谱样本集划分为训练集和测试集,并对训练集进行样本数据扩充;

10、步骤2:获取扩充后的训练集的样本特征,并利用特征选择算法对该训练集进行特征选择,对该训练集的样本特征进行重要性排序,得到排序后的训练集;

11、步骤3:采用随机森林分类器构建(y-1)*y/2个二元子分类器并输入排序后的训练集,利用交叉验证训练每个二元子分类器并集成,得到基于决策有向无环图的血浆光谱多分类器模型;

12、步骤4:将测试集输入基于决策有向无环图的血浆光谱多分类器模型,得到分类结果;

13、进一步的,步骤1中所述构建血浆光谱样本集的方法为:对于一种疾病的y个亚类,对获取的每个血浆光谱数据进行标记作为血浆光谱样本,其中所述标记的标签为该血浆光谱数据对应的亚类名称,根据标签对血浆光谱样本进行分类并构建若干个血浆光谱样本子集,再利用y个血浆光谱样本子集构建血浆光谱样本集;

14、步骤1中所述利用过采样技术对训练集进行样本数据扩充的方法为:将训练集中样本数量最多的血浆光谱样本子集视为多数类样本集,将其余血浆光谱样本子集视为少数类样本集,利用过采样技术对训练集中的少数类样本集进行样本数据扩充,增加训练集中的少数类样本集的样本数量;

15、步骤2中所述样本特征为训练集中各血浆光谱样本在近红外光谱中固定区域内的吸收度;所述特征选择算法包括:双样本非参数检验tsks、过滤式特征选择方法relief和最小绝对收缩和选择算子lasso;

16、步骤2中所述排序后的训练集包括(y-1)*y/2组排序结果,所述排序结果的获取方法为:对于每一组排序结果来说,从训练集中任意两个血浆光谱样本子集中各自选取若干个样本特征,分别利用tsks、relief和lasso三种特征选择算法对选取的样本特征进行特征提取,得到三组特征向量,并对三组特征向量的特征重要性进行排序,得到一组排序结果;

17、所述步骤3中进一步包括:

18、步骤3.1:对于一种疾病的y个亚类,采用随机森林分类器构建(y-1)*y/2个二元子分类器;

19、步骤3.2:将排序后的训练集分别输入得到的(y-1)*y/2个二元子分类器中,利用交叉验证对每个二元子分类器进行训练,确定每个二元子分类器的最优分类特征波数,并为每一个二元子分类器选择各自的特征选择算法,得到(y-1)*y/2个训练好的二元子分类器;

20、步骤3.3:利用ddag算法对所有训练好的二元子分类器进行集成,得到基于决策有向无环图的血浆光谱多分类器模型;

21、所述步骤3.2中进一步包括:

22、步骤3.2.1:将排序后的训练集中的(y-1)*y/2组排序结果分别输入(y-1)*y/2个二元子分类器中;

23、步骤3.2.2:基于交叉验证来利用每一组排序结果中的三组特征向量训练对应的二元子分类器,得到三组特征向量对应的最优特征波数的数量;

24、步骤3.2.3:根据最优特征波数的数量分别计算经过三组特征向量训练出的二元子分类器的准确率pa、pb、pc,并选择准确率最高的特征选择算法作为该二元子分类器特征选择算法;

25、步骤3.3中所述利用ddag算法对所有训练好的二元子分类器进行集成的方法为:分别计算每一个训练好的二元子分类器的交叉验证准确率,并将交叉验证准确率最高的二元子分类器置于根节点,根据该二元子分类器的输出决定下一层路径的分支方向,依次根据叉验证平均准确率由高到低来选择二元子分类器并依次作为叶子节点进行连接,直至所有二元子本文档来自技高网...

【技术保护点】

1.一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,该系统包括依次连接的:数据增强模块、特征选择模块、筛查模型模块、基于决策有向无环图的多分类模型集成模块以及模型评价模块;

2.根据权利要求1中所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,采用以下步骤实现对多种疾病的筛查分类:

3.根据权利要求2所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤1中所述构建血浆光谱样本集的方法为:对于一种疾病的Y个亚类,对获取的每个血浆光谱数据进行标记作为血浆光谱样本,其中所述标记的标签为该血浆光谱数据对应的亚类名称,根据标签对血浆光谱样本进行分类并构建若干个血浆光谱样本子集,再利用Y个血浆光谱样本子集构建血浆光谱样本集。

4.根据权利要求3所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤1中所述利用过采样技术对训练集进行样本数据扩充的方法为:将训练集中样本数量最多的血浆光谱样本子集视为多数类样本集,将其余血浆光谱样本子集视为少数类样本集,利用过采样技术对训练集中的少数类样本集进行样本数据扩充,增加训练集中的少数类样本集的样本数量。

5.根据权利要求3所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤2中所述样本特征为训练集中各血浆光谱样本在近红外光谱中固定区域内的吸收度;所述特征选择算法包括:双样本非参数检验TSKS、过滤式特征选择方法Relief和最小绝对收缩和选择算子Lasso。

6.根据权利要求5所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤2中所述排序后的训练集包括(Y-1)*Y/2组排序结果,所述排序结果的获取方法为:对于每一组排序结果来说,从训练集中任意两个血浆光谱样本子集中各自选取若干个样本特征,分别利用TSKS、Relief和Lasso三种特征选择算法对选取的样本特征进行特征提取,得到三组特征向量,并对三组特征向量的特征重要性进行排序,得到一组排序结果。

7.根据权利要求6所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,所述步骤3中进一步包括:

8.根据权利要求7所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,所述步骤3.2中进一步包括:

9.根据权利要求8所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤3.3中所述利用DDAG算法对所有训练好的二元子分类器进行集成的方法为:分别计算每一个训练好的二元子分类器的交叉验证准确率,并将交叉验证准确率最高的二元子分类器置于根节点,根据该二元子分类器的输出决定下一层路径的分支方向,依次根据交叉验证准确率由高到低来选择二元子分类器并依次作为叶子节点进行连接,直至所有二元子分类器都连接完毕。

...

【技术特征摘要】

1.一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,该系统包括依次连接的:数据增强模块、特征选择模块、筛查模型模块、基于决策有向无环图的多分类模型集成模块以及模型评价模块;

2.根据权利要求1中所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,采用以下步骤实现对多种疾病的筛查分类:

3.根据权利要求2所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤1中所述构建血浆光谱样本集的方法为:对于一种疾病的y个亚类,对获取的每个血浆光谱数据进行标记作为血浆光谱样本,其中所述标记的标签为该血浆光谱数据对应的亚类名称,根据标签对血浆光谱样本进行分类并构建若干个血浆光谱样本子集,再利用y个血浆光谱样本子集构建血浆光谱样本集。

4.根据权利要求3所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤1中所述利用过采样技术对训练集进行样本数据扩充的方法为:将训练集中样本数量最多的血浆光谱样本子集视为多数类样本集,将其余血浆光谱样本子集视为少数类样本集,利用过采样技术对训练集中的少数类样本集进行样本数据扩充,增加训练集中的少数类样本集的样本数量。

5.根据权利要求3所述一种基于血浆光谱的多种疾病筛查分类系统,其特征在于,步骤2中所述样本特征为训练集中各血浆光谱样本在近红外光谱中固定区域内的吸收度;所述特征...

【专利技术属性】
技术研发人员:李志刚项楠
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1