System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统技术方案_技高网

一种结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统技术方案

技术编号:41498007 阅读:13 留言:0更新日期:2024-05-30 14:41
本发明专利技术公开了一种结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,涉及数据处理分析技术领域;其中包括数据采集模块、数据清洗模块、数据映射转化模块、数据归一化模块、模型训练模块以及模型预测模块;该系统可以更好的挖掘特征间的非实数关联,从而提高了肾病患者的IgA肾病MESTC分型的预测分型准确率,辅助医生诊断患者是否进行肾穿刺活检术检查,为医疗决策提供参考与支持。

【技术实现步骤摘要】

本专利技术涉及数据处理分析,更具体的说,本专利技术涉及一种结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统。


技术介绍

1、iga全称指(immunoglobulin a,即免疫球蛋白a)。iga肾病是全世界最常见的免疫性肾小球肾炎;各个年龄段都有发病。但到目前为止,iga肾病的发病的机制尚未得到有效地研究,对于iga肾病的恶化预测仍依赖于肾穿刺活检术检查。但是肾穿刺活检术检查是一种有创伤性的检查,存在一定风险。特别是对于孤立肾患者,可能增加出血风险,引发严重并发症,甚至需要摘除肾脏。患者在决定进行肾穿刺活检术检查前,应了解可能的危害和益处,并与医生共同权衡决策。因此通过结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,预测患者的iga肾病mestc分型,帮助医生与患者更好的权衡是否进行肾穿刺活检术检查,有重要的科学意义和现实意义。

2、有序规范实数对理论(ordered pair of normalized real numbers)是2020年发表的一整套原创性数学理论。从研究对象的形式上来说,opns类似于复数或模糊数学中的直觉模糊数等概念,但本质上又有非常大的区别。与复数相比,opns具有全序关系;与直觉模糊数相比,opns没有隶属度和非隶属度之和小于1的约束条件限制。opns理论将成对的规范性实数作为基本数据单元,建立了一整套新的数据计算框架。实数范围内的数据转化为opns后,可以在opns框架下进行机器学习的研究和开发工作。

3、在实际的iga肾病数据分析中,肾病的数据特征之间存在某种关联,而传统分类算法只能挖掘特征间的实数关联,无法挖掘特征间的非实数关联。故采用传统分类方法的预测系统预测准确度不高。


技术实现思路

1、本专利技术的目的是提供一套结合机器学习算法的iga肾病预测分析系统,即结合有序规范实数对理论的k近邻算法(opns-knn)的iga肾病预测分析系统,该系统运用众多iga肾病患者的历史临床检查、基本信息、病史数据与肾穿刺活检术检查数据,面向医生会诊疑似iga肾病患者时,衡量是否进一步做肾穿刺活检术检查,采用有序规范实数对理论的k近邻算法的分类技术,预测该患者的iga肾病mestc分型,从而提供参考意见。该预测分析系统包括数据采集模块、数据清洗模块、数据映射转化模块、数据归一化模块、模型训练模块以及模型预测模块。数据清洗模块对临床检查、基本信息、病史数据与肾穿刺活检术检查数据进行清洗拼接;数据映射转化模块将清洗后的数据映射转化为opns实数对数据;数据归一化模块对得到的opns实数对数据进行opns尺度下的归一化操作,以确保数据处于可处理的标准范围内;模型训练模块用于训练opns-knn算法的iga肾病预测模型;模型预测模块用于预测临床样本的iga肾病mestc分型;利用opns-knn算法更好的挖掘数据特征间的非实数关联,从而提高预测肾病患者的iga肾病mestc分型准确率,辅助医生诊断患者,决定是否进行肾穿刺活检术检查,为医疗决策提供参考与支持。

2、本专利技术提供了一种结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,该系统包含以下模块:

3、1、数据采集模块:采集iga肾病患者样本的临床检查、基本信息、病史数据以及样本对应的肾穿刺活检术检查得到的iga肾病mestc分型标签。

4、所诉的临床检查、基本信息、病史数据,是做过肾穿刺活检术检查的iga肾病患者,通过医疗仪器采集血液样本进行血液检查和采集尿液样本进行尿液检查得到的化验单数据,包括血红蛋白、24h尿蛋白定量、尿红细胞计数、血清肌酐、egfr、尿酸、甘油三酯、血清白蛋白、年龄、性别、高血压病史等数据。

5、所诉的iga肾病mestc分型标签,是通过肾穿刺活检术得到的与所患肾脏病相关的诊断标签,包含m、e、s、t、c五类标签,m、e、s为二分类标签,t、c为三分类标签,其中,m表示系膜细胞增生:超过50%的肾小球存在系膜细胞增生则为m1,否则为m0;e表示毛细血管内皮细胞增生:如果有毛细血管内皮细胞增生则为e1,否则为e0;s表示肾小球节段硬化:如果有肾小球节段硬化或黏连为s1,否则为s0;t表示肾小管萎缩或肾间质纤维化:t0表示肾小管萎缩或肾间质纤维化的比例小于25%,t1表示肾小管萎缩或肾间质纤维化的比例大于25%且小于50%,t2表示肾小管萎缩或肾间质纤维化的比例超过50%;c表示细胞性或纤维细胞性新月体:c0表示不存在细胞性或纤维细胞性新月体,c1表示存在小于25%的肾小球存在细胞性或纤维细胞性新月体,c2表示存在超过25%的肾小球细胞性或纤维细胞性新月体。

6、2、数据清洗模块:对iga肾病患者的临床检查数据、基本信息数据和病史数据进行清洗拼接,剔除有数据缺失的样本,再将三者进行直接拼接组合,得到可进一步处理的临床检查数据f。

7、3、数据映射转化模块:是将临床数据f通过函数映射到(0,1)之间,再通过随机两两组合转化为有序规范实数对(opns)数据,得到一个具有opns特征的数据集fopns,对fopns中的opns特征进行随机不重复挑选,由于挑选方式的多样性,组成各种opns特征组合方式,所有opns特征组合方式组合搜索空间opnsset;

8、所诉的函数满足以下条件即可,定义域为r,值域为(0,1),且严格单调递增,同时满足

9、所诉的组合转化,是根据有序规范实数对理论中opns的定义,直接将两个(0,1)范围内的实数特征数据组合为一个opns特征数据,得到一个具有opns特征的数据集fopns。所诉的随机不重复挑选,是在数据集fopns中选择覆盖全部实数特征的opns特征组合方式,对于f=(f1,f2,…,f2n),搜索空间opnsset一共有种组方式;

10、4、数据归一化模块:将opns数据进行opns尺度下的归一化,具体操作方法如下:

11、

12、其中,xopns为fopns中的opns数据,minopns为一列opns特征中opns尺度下最小的opns,maxopns为同一列opns特征中opns尺度下最大的opns,涉及的减法与除法也为opns理论中的运算,xscaled_opns为opns尺度下的归一化后得到的opns数据,将fopns中的每列opns特征下的每个opns特征进行上述归一化后,得到可直接输入模型的数据。

13、5、模型训练模块:是将训练集输入模型,在搜索空间opnsset中找到使opns-knn分类器分类效果最佳的opns特征组合方式,记录每种opns特征组合方式的分类准确率,遍历搜索空间opnsset中的所有组合方式,找出使标签预测准确率最高的opns特征组合方式,每类标签训练一次,配合交叉验证方式经过5次训练,最后得到使5类标签分类准确率分别最高的5组opns特征组合方式,即模型训练完成。

14、所诉的opns-knn分类器,是通过计算测试样本与训练集中每个样本之间的opns广义度本文档来自技高网...

【技术保护点】

1.一种结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,该系统包括数据采集模块、数据清洗模块、数据映射转化模块、OPNs尺度归一化模块、模型训练模块、模型预测模块、报告生成模块;

2.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的临床、基本信息和病史数据,是做过肾穿刺活检术的IgA肾病患者,通过医疗仪器采集血液样本进行血液检查和采集尿液样本进行尿液检查得到的化验单数据,包括血红蛋白、24h尿蛋白定量、尿红细胞计数、血清肌酐、eGFR、尿酸、甘油三酯、血清白蛋白、IgA、C3,还有患者年龄、性别、高血压病史。

3.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所述IgA肾病MESTC分型标签,是通过IgA肾病患者的肾穿刺活检术检查得到的与所患肾脏病相关的诊断标签,包含M、E、S、T、C五类标签,M、E、S为二分类标签,T、C为三分类标签,其中,M表示系膜细胞增生:超过50%的肾小球存在系膜细胞增生则为M1,否则为M0;E表示毛细血管内皮细胞增生:如果有毛细血管内皮细胞增生则为E1,否则为E0;S表示肾小球节段硬化:如果有肾小球节段硬化或黏连为S1,否则为S0;T表示肾小管萎缩或肾间质纤维化:T0表示肾小管萎缩或肾间质纤维化的比例小于25%,T1表示肾小管萎缩或肾间质纤维化的比例大于25%且小于50%,T2表示肾小管萎缩或肾间质纤维化的比例超过50%;C表示细胞性或纤维细胞性新月体:C0表示不存在细胞性或纤维细胞性新月体,C1表示存在小于25%的肾小球存在细胞性或纤维细胞性新月体,C2表示存在超过25%的肾小球细胞性或纤维细胞性新月体。

4.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的映射转化模块,是将临床数据映射到(0,1)之间,再通过随机两两组合转化为OPNs实数对数据,根据所有组合方式形成OPNs组合方式搜索空间OPNsSet;

5.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的将OPNs实数对数据进行OPNs尺度下的归一化,归一化公式如下:

6.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的训练IgA肾病预测模型,是在搜索空间OPNsSet中找到使OPNs-KNN分类器分类效果最佳的OPNs组合方式;

7.根据权利要求6所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的OPNs-KNN分类器,是一个无监督的机器学习算法,用于预测输入的患者样本的IgA肾病MESTC分型;

8.根据权利要求7所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的OPNs广义度量,是衡量两个OPNs数据样本间的相似度度量,具体如下:

9.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的模型预测模块,在采用训练得到的IgA肾病预测模型进行预测时,测试样本数据分别按照5组最优OPNs特征组合方式进行映射转化,设5组最优OPNs组合方式均为((F1,F2),(F3,F 4),...,(Fn-1,Fn)),再进入OPNs尺度归一化模块得到的待测试的IgA肾病患者样本的5组临床数据:

10.根据权利要求1所述的结合有序规范实数对理论的K近邻算法的IgA肾病预测分析系统,其特征在于,所诉的报告生成模块,是针对未做肾穿刺活检术检查的肾病患者的IgA肾病MESTC分型预测结果,输出辅助医生会诊肾病患者,是否进行肾穿刺活检术检查的建议报告。

...

【技术特征摘要】

1.一种结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,其特征在于,该系统包括数据采集模块、数据清洗模块、数据映射转化模块、opns尺度归一化模块、模型训练模块、模型预测模块、报告生成模块;

2.根据权利要求1所述的结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,其特征在于,所诉的临床、基本信息和病史数据,是做过肾穿刺活检术的iga肾病患者,通过医疗仪器采集血液样本进行血液检查和采集尿液样本进行尿液检查得到的化验单数据,包括血红蛋白、24h尿蛋白定量、尿红细胞计数、血清肌酐、egfr、尿酸、甘油三酯、血清白蛋白、iga、c3,还有患者年龄、性别、高血压病史。

3.根据权利要求1所述的结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,其特征在于,所述iga肾病mestc分型标签,是通过iga肾病患者的肾穿刺活检术检查得到的与所患肾脏病相关的诊断标签,包含m、e、s、t、c五类标签,m、e、s为二分类标签,t、c为三分类标签,其中,m表示系膜细胞增生:超过50%的肾小球存在系膜细胞增生则为m1,否则为m0;e表示毛细血管内皮细胞增生:如果有毛细血管内皮细胞增生则为e1,否则为e0;s表示肾小球节段硬化:如果有肾小球节段硬化或黏连为s1,否则为s0;t表示肾小管萎缩或肾间质纤维化:t0表示肾小管萎缩或肾间质纤维化的比例小于25%,t1表示肾小管萎缩或肾间质纤维化的比例大于25%且小于50%,t2表示肾小管萎缩或肾间质纤维化的比例超过50%;c表示细胞性或纤维细胞性新月体:c0表示不存在细胞性或纤维细胞性新月体,c1表示存在小于25%的肾小球存在细胞性或纤维细胞性新月体,c2表示存在超过25%的肾小球细胞性或纤维细胞性新月体。

4.根据权利要求1所述的结合有序规范实数对理论的k近邻算法的iga肾病预测分析系统,其特征在于,所诉的映射转化模块...

【专利技术属性】
技术研发人员:丁旋斌徐鲁强
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1