System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物医学,尤其是涉及糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法。
技术介绍
1、糖尿病(diabetes mellitus,dm)是一种代谢紊乱的慢性多系统疾病。肾脏疾病是dm最重要的长期并发症之一,与发病和死亡风险增加有关。糖尿病相关慢性肾脏病的患病率已超过肾小球肾炎相关ckd,成为ckd的主要病因。此外,它是终末期肾病(esrd)的首要病因。流行病学数据表明,尽管近几十年来糖尿病相关心血管疾病的发病率有所降低,但糖尿病管理的改善对esrd发生率的影响有限。此外,血糖控制不佳的t2dm患者ckd的发生率和严重程度各不相同,ckd也可能发生在血糖水平控制良好的患者中,提示高血糖以外的其他因素也参与2型糖尿病肾病的临床表现和发展。
技术实现思路
1、有鉴于此,本专利技术旨在克服现有技术中上述问题的不足之处,提出糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,利用人工智能xgboost算法从临床数据中筛选预测因素,开发了用于预测糖尿病相关ckd的肾功能进展的预测模型,最终模型纳入了egfr、fib、uacr、tg、rbc、alb共6个指标,在此模型基础上加入功能磁共振成像参数,即bold序列的肾皮质r2、肾髓质r2与dti序列的肾皮质adc值,模型性能有明显提升。
2、为达到上述目的,本专利技术的技术方案是这样实现的:
3、本专利技术第一方面提供了糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,包括以下步骤:
4、步骤1
5、步骤2:利用xgboost算法中的特征重要性排序方法筛选原始数据集、插补数据集以及归一化数据集中的共同候选变量,采用顺序前向选择策略,按由大至小的顺序每次添加一个变量直至当额外的变量添加进行模型后,auc的增量小于0.01,且delong检验时p>0.05,确定纳入模型开发的最终预测因子,应用xgboost算法对纳入模型开发的最终预测因子进行模型构建,构建糖尿病相关慢性肾脏病的肾功能进展预测模型;
6、步骤3:构建模型验证集,通过准确度、敏感度、特异度、区分度及校准度验证模型的性能。
7、进一步的,所述步骤1中,将数据集中的数据进行多维度变量分类及预处理包括:
8、检查每个变量的缺失率,将缺失值超过30%的变量删除,对剩余变量进行缺失值变量插补及数据归一化,将数据分为原始数据、插补数据以及归一化数据,其中,在原始数据中将缺失值用nan填充,在插补数据中应用多重插补法对缺失变量进行插补,在归一化数据中,将插补数据中连续型变量进行归一化处理,使其范围在0-1之间。
9、进一步的,所述步骤2中具体包括,
10、在原始数据集中,利用xgboost算法建立模型,同时利用xgboost算法中的特征重要性排序方法筛选出排序在前50的变量作为预选变量,将50个预选变量进行spearman相关性分析,计算spearman秩相关系数,将相关矩阵转换为距离矩阵,对距离矩阵进行分层聚类,对预选变量进行分组,以0.75作为切分树状图的阈值,并在每个聚类中选择特征重要性排序第一的变量,再结合单因素logistic回归模型筛选p值小于0.05的变量,经过上述筛选步骤,确定影响肾脏复合终点事件结局的变量;
11、在插补数据集中,利用xgboost算法建立模型,同时利用xgboost算法中的特征重要性排序方法筛选出排序在前50的变量作为预选变量,将50个预选变量进行spearman相关性分析,计算spearman秩相关系数,将相关矩阵转换为距离矩阵,对距离矩阵进行分层聚类,对预选变量进行分组,以0.75作为切分树状图的阈值,并在每个聚类中选择特征重要性排序第一的变量,再结合单因素logistic回归模型筛选p值小于0.05的变量,经过上述筛选步骤,确定影响肾脏复合终点事件结局的变量;
12、在归一化数据集中,利用xgboost算法建立模型,同时利用xgboost算法中的特征重要性排序方法筛选出排序在前50的变量作为预选变量,将50个预选变量进行spearman相关性分析,计算spearman秩相关系数,将相关矩阵转换为距离矩阵,对距离矩阵进行分层聚类,对预选变量进行分组,以0.75作为切分树状图的阈值,并在每个聚类中选择特征重要性排序第一的变量,再结合单因素logistic回归模型筛选p值小于0.05的变量,经过上述筛选步骤,确定影响肾脏复合终点事件结局的变量;
13、通过以上筛选方法,3个数据集中的筛选变量出现大于等于2次的变量纳入模型构建候选变量,采用顺序前向选择策略,按由大至小的顺序每次添加一个变量直至当额外的变量添加进行模型后,auc的增量小于0.01,且delong检验时p>0.05,确定纳入模型开发的最终预测因子为:egfr、fib、uacr、tg、rbc、alb,应用lgbm算法对纳入模型开发的最终预测因子进行模型构建,构建糖尿病相关慢性肾脏病的肾功能进展预测模型。
14、进一步的,还包括在糖尿病相关慢性肾脏病的肾功能进展预测模型中加入功能磁共振成像参数,即bold序列的肾皮质r2、肾髓质r2与dti序列的肾皮质adc值构建模型。
15、本专利技术第二方面提供了一种用于预测糖尿病相关慢性肾脏病的肾功能进展的系统,包括
16、数据获取模块,用于获取2型糖尿病及相关慢性肾脏病样本数据,通过随访肾脏复合终点事件是否发生构建数据集,将数据集中的数据进行多维度变量分类及预处理,构建原始数据集、插补数据集以及归一化数据集;
17、模型构建模块,利用xgboost算法中的特征重要性排序方法筛选原始数据集、插补数据集以及归一化数据集中的共同候选变量,采用顺序前向选择策略,按由大至小的顺序每次添加一个变量直至当额外的变量添加进行模型后,auc的增量小于0.01,且delong检验时p>0.05,确定纳入模型开发的最终预测因子,应用xgboost算法对纳入模型开发的最终预测因子进行模型构建,糖尿病相关慢性肾脏病的肾功能进展预测模型;
18、模型验证模块,构建模型验证集,通过准确度、敏感度、特异度、区分度及校准度验证模型的性能。
19、本专利技术第三方面提供了一种用于构建糖尿病相关慢性肾脏病的肾功能进展预测模型的电子设备,包括处理器以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,所述处理器用于执行上述的预测模型构建方法。
20、本专利技术第四方面提供了一种计算机可读取存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述预测模型构建方法。
21、相对于现有技术,本专利技术所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法具有以下优势:
22、本专利技术开发了针对糖尿病相关c本文档来自技高网...
【技术保护点】
1.糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:所述步骤1中,将数据集中的数据进行多维度变量分类及预处理包括:
3.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:所述步骤2中具体包括,
4.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:还包括在糖尿病相关慢性肾脏病的肾功能进展预测模型中加入BOLD序列的肾皮质R2、肾髓质R2与DTI序列的肾皮质ADC值构建模型。
5.一种用于预测糖尿病相关慢性肾脏病的肾功能进展的系统,其特征在于:包括
6.一种用于构建糖尿病相关慢性肾脏病的肾功能进展预测模型的电子设备,包括处理器以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,其特征在于:所述处理器用于执行上述权利要求1-4任一所述的构建方法。
7.一种计算机可读取存储介质,存储有计算机程序,其特征在于:所述计算机程
...【技术特征摘要】
1.糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:所述步骤1中,将数据集中的数据进行多维度变量分类及预处理包括:
3.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:所述步骤2中具体包括,
4.根据权利要求1所述的糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法,其特征在于:还包括在糖尿病相关慢性肾脏病的肾功能进展预测模型中加入...
【专利技术属性】
技术研发人员:于珮,刘红岩,林瑶,周赛君,刘向阳,马泽军,杨阳,王彤丹,张睿,时鑫,吴雪榕,陈思思,马君,
申请(专利权)人:天津医科大学朱宪彝纪念医院天津医科大学代谢病医院,天津代谢病防治中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。