System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种糖尿病预测和可解释性分析方法以及计算机程序产品技术_技高网

一种糖尿病预测和可解释性分析方法以及计算机程序产品技术

技术编号:44258331 阅读:3 留言:0更新日期:2025-02-14 22:04
本发明专利技术公开了一种糖尿病预测和可解释性分析方法以及计算机程序产品,属于医疗信息学技术领域,包括:构建样本数据集;构建特征自注意力模块的数学模型;构建融合特征自注意力模块的改进残差网络模型;利用改进残差网络模型对样本数据进行糖尿病风险预测;使用SHAP模型计算每个输入特征向量的SHAP值,评估输入特征向量对模型输出的边际贡献;生成SHAP值的可视化摘要图,展示各个特征对预测结果的具体影响。本发明专利技术融合自注意力机制和深度残差思想,显著提升了RAC模型的预测性能。通过引入SHAP特征分析,量化各特征对预测的贡献,增强了模型的可解释性,能够为糖尿病预测提供系统性评估。

【技术实现步骤摘要】

本专利技术属于医疗信息学,具体地说,是涉及一种糖尿病预测和可解释性分析方法以及计算机程序产品


技术介绍

1、糖尿病作为一种全球性的代谢性疾病,其预测和监测对于早期干预和治疗至关重要。通过人工智能算法提高糖尿病预测的准确率以及模型的可解释性,可以为糖尿病人群预测发病概率提供有效工具,这对于辅助医生进行糖尿病诊断具有重要的现实意义。

2、目前,利用人工智能算法实现糖尿病预测的方法主要包括决策树、朴素贝叶斯模型、多元贝叶斯逻辑回归模型、基于支持向量机的预测模型等,但多数模型的关键性能指标尚未达标,与临床应用的高要求尚有差距。

3、近年来,对于糖尿病预测方法的研究趋势逐渐转向开发高性能且具备可解释性的预测模型。例如,将深度神经网络应用于体检记录,以实现糖尿病的预测。另外,结合使用lightgbm与shap方法的预测模型不仅提升了预测效果,还增强了模型的解释性。这些研究表明,结合高预测性能与增强的可解释性是当前糖尿病预测模型研发的核心方向。

4、尽管糖尿病预测领域持续涌现新进展,但现有预测方法无论是传统机器学习算法,还是深度学习网络,仍面临多重局限性。例如,由于预测模型结构简单,导致预测精度不高,无法满足临床应用的高要求;由于数据不平衡,导致模型仅对大多数类表现良好,即,高特异性但低灵敏度;多数预测方法为黑箱机器学习模型,临床医生很难理解整个预测过程,因此不利于建立起对预测结果的信任度。

5、本
技术介绍
所公开的上述信息仅仅用于增加对本申请
技术介绍
的理解,因此,其可能包括不构成本领域普通技术人员已知的现有技术。


技术实现思路

1、针对
技术介绍
中存在的上述至少一个技术问题,本专利技术提出了一种融合shap和改进残差网络的糖尿病预测和可解释性分析方法,能够准确预测糖尿病风险并可视化影响预测的关键因素,通过解构数学模型在预测时的黑箱操作,提升了预测逻辑的透明度和预测结果的可信度。

2、为解决上述技术问题,本专利技术采用以下技术方案予以实现:

3、在一个方面,本专利技术提出了一种糖尿病预测和可解释性分析方法,包括:

4、构建样本数据集,在所述样本数据集中记录有由糖尿病人和健康人的样本数据形成的多组输入特征向量 x;

5、构建特征自注意力模块的数学模型:

6、;

7、其中,表示融合后的输入特征向量;为可学习的参数矩阵;、、分别为将输入特征向量 x映射到查询空间、键空间和值空间的权重矩阵;为键空间的维度; softmax( )为归一化指数函数; t为矩阵转置符号;

8、构建融合特征自注意力模块的改进残差网络模型:

9、;

10、;

11、其中, y为改进残差网络中每个残差块的输出向量;是一个可学习的标量,用于调整残差连接的强度;是激活函数;和为全连接层的偏置;bn表示批量归一化操作;是与第 i个残差块相关的权重;是特征自注意力机制层,用于加权特征向量;

12、根据改进残差网络模型的输出值,预测样本数据的患病风险;

13、使用shap模型计算每个输入特征向量的shap值,评估输入特征向量对模型输出的边际贡献;

14、生成shap值的可视化摘要图,展示各个特征对预测结果的具体影响。

15、在本申请的一些实施例中,为了解决卷积运算对预测模型的性能产生负优化的问题,可以配置所述改进残差网络模型采用全连接层代替残差网络原结构中的卷积层,并配置每个残差块的内部结构分别包括第一全连接层和归一化层、第二全连接层和归一化层、特征自注意力模块,以更好地适应样本数据集的特性。

16、在本申请的一些实施例中,可以在所述改进残差网络模型中配置三个串联的残差块,其中,

17、在第一个残差块中,可以配置输入特征向量经过一个全连接层后,将32维特征映射到64维,以扩展特征空间,使模型能够捕捉到更复杂的特征关系;

18、在第二个残差块中,可以配置输入特征向量经过一个全连接层后,将64维特征映射回32维,以压缩特征空间,减少模型的复杂度,防止过拟合;

19、在第三个残差块中,可以配置输入特征向量经过一个全连接层后,将32维特征进一步压缩到16维,以进一步压缩特征空间,简化模型。

20、在本申请的一些实施例中,可以配置所述改进残差网络模型的输出层将第三个残差块输出的16维特征映射到1维,以生成表示糖尿病风险预测的标量值 q,便于患病风险的判断。

21、在本申请的一些实施例中,可以根据所述改进残差网络模型输出的标量值 q,利用 sigmoid函数生成样本数据患有糖尿病风险的概率值。

22、在本申请的一些实施例中,所述 sigmoid函数可以表示为:

23、;

24、其中, p为0~1之间的概率值,该概率值 p能够确切地表示样本数据所对应的个体患糖尿病风险的可能性。可以根据概率值 p由小到大,设置样本数据患有糖尿病风险的等级由低到高。风险等级的递增反映了个体患病风险的相应增加。

25、在本申请的一些实施例中,为了提升模型的计算效率和泛化能力,可以首先对样本数据集中的样本数据进行预处理;然后,对预处理后的样本数据进行标准化处理,以形成统一的数据格式,之后输入所述特征自注意力模块,计算出融合后的输入特征向量 x’后,与数据格式统一后的原始输入特征向量 x一起代入所述改进残差网络模型,进行糖尿病风险预测。

26、在本申请的一些实施例中,为了对改进残差网络模型进行训练、验证和测试,可以将所述样本数据集划分为训练集、验证集和测试集;其中,可以利用训练集中的样本数据对所述改进残差网络模型进行训练;利用验证集中的样本数据对训练后的改进残差网络模型进行调参,得到高性能的糖尿病风险预测模型;利用测试集中的样本数据对所述高性能的糖尿病风险预测模型进行性能评估,以展示本申请的预测模型相比其他经典算法的优势。

27、在本申请的一些实施例中,在构建训练集、验证集和测试集时,可以将所述样本数据集划分成m个大小相似的互斥子集,在每次迭代过程中使用其中m-1个子集的并集形成训练集,余下的一个子集作为测试集,同时在测试集中划分出50%的样本数据形成验证集,以满足改进残差网络模型的训练本文档来自技高网...

【技术保护点】

1.一种糖尿病预测和可解释性分析方法,其特征在于,包括:

2.根据权利要求1所述的糖尿病预测和可解释性分析方法,其特征在于,配置所述改进残差网络模型采用全连接层代替残差网络原结构中的卷积层,并配置每个残差块的内部结构分别包括第一全连接层和归一化层、第二全连接层和归一化层、特征自注意力模块。

3.根据权利要求2所述的糖尿病预测和可解释性分析方法,其特征在于,所述改进残差网络模型包括三个串联的残差块,其中,

4.根据权利要求3所述的糖尿病预测和可解释性分析方法,其特征在于,配置所述改进残差网络模型的输出层将第三个残差块输出的16维特征映射到1维,生成表示糖尿病风险预测的标量值q。

5.根据权利要求4所述的糖尿病预测和可解释性分析方法,其特征在于,根据所述改进残差网络模型输出的标量值q,利用Sigmoid函数生成样本数据患有糖尿病风险的概率值。

6.根据权利要求5所述的糖尿病预测和可解释性分析方法,其特征在于,所述Sigmoid函数表示为:

7.根据权利要求1至6中任一项所述的糖尿病预测和可解释性分析方法,其特征在于,还包括:

8.根据权利要求1至6中任一项所述的糖尿病预测和可解释性分析方法,其特征在于,还包括:

9.根据权利要求8所述的糖尿病预测和可解释性分析方法,其特征在于,将所述样本数据集划分成m个大小相似的互斥子集,在每次迭代过程中使用其中m-1个子集的并集形成训练集,余下的一个子集作为测试集,同时在测试集中划分50%的样本数据形成验证集。

10.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至9中任一项所述糖尿病预测和可解释性分析方法的步骤。

...

【技术特征摘要】

1.一种糖尿病预测和可解释性分析方法,其特征在于,包括:

2.根据权利要求1所述的糖尿病预测和可解释性分析方法,其特征在于,配置所述改进残差网络模型采用全连接层代替残差网络原结构中的卷积层,并配置每个残差块的内部结构分别包括第一全连接层和归一化层、第二全连接层和归一化层、特征自注意力模块。

3.根据权利要求2所述的糖尿病预测和可解释性分析方法,其特征在于,所述改进残差网络模型包括三个串联的残差块,其中,

4.根据权利要求3所述的糖尿病预测和可解释性分析方法,其特征在于,配置所述改进残差网络模型的输出层将第三个残差块输出的16维特征映射到1维,生成表示糖尿病风险预测的标量值q。

5.根据权利要求4所述的糖尿病预测和可解释性分析方法,其特征在于,根据所述改进残差网络模型输出的标量值q,利用sigmoid函数生成样...

【专利技术属性】
技术研发人员:宋廷强魏国政渠蓉蓉张宇曹文娟许鹏飞刘自超
申请(专利权)人:青岛科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1