System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于医疗数据处理的2型糖尿病预测方法及系统技术方案_技高网

一种基于医疗数据处理的2型糖尿病预测方法及系统技术方案

技术编号:44129792 阅读:9 留言:0更新日期:2025-01-24 22:48
本发明专利技术属于糖尿病预测技术领域,更具体地说,是涉及一种基于医疗数据处理的2型糖尿病预测方法及系统,本发明专利技术在对医疗数据处理时,尤其是对医疗数据样本集处理时,首先,对于存在数据缺失的样本进行数据补足操作,针对不同的样本集采用了不同的数据补足方法,针对有准确的可对照样本的样本采用相似度比较的方式进行补足操作,针对无可对照样本的样本则采用深度学习的方式进行补足操作,这样,提高了医疗数据处理的准确性,同时,又兼顾了预测效率,同时,在数据补足后,又设置了质量检测环节,即将经过补足的样本输入至经过未补足样本训练的2型糖尿病预测模型中,根据模型的输出结果判断数据补足效果,使得数据补足效果更为直观和容易信服。

【技术实现步骤摘要】

本专利技术属于糖尿病预测,更具体地说,是涉及一种基于医疗数据处理的2型糖尿病预测方法及系统


技术介绍

1、2型糖尿病(t2dm)是一种胰岛素使用不足或效率降低导致的慢性疾病,常见于成年人,也叫成人发病型糖尿病,这种疾病是由遗传,环境因素如生活方式、营养过剩、体力活动不足等因素共同导致,往往初期症状轻微,许多人直到出现并发症或在常规体检中才被发现,由于2型糖尿病临床并发症比较多,容易使患者出现心脑血管疾病,严重时还会引起四肢和身体多处病症,因此,对2型糖尿病进行预测有着非常重要的现实意义。

2、机器学习(machine learning, ml)是人工智能的子领域,可通过识别和提取带有标签的训练集数据的特征,建立预测模型,利用所学的规律预测和分类新数据,已被广泛应用于医学领域, ml模型可以更灵活地处理缺失数据和变量间的非线性关系,更有利于疾病的诊断和预后。临床医生可籍此对患者的病情做出进一步及时的判断。

3、现有技术中存在基于机器学习对2型糖尿病预测的方案,例如,中国专利技术专利(cn106384013a)公开了一种基于增量式神经网络模型的2型糖尿病预测方法,包括如下步骤:建立2型糖尿病日常数据数据库;对神经网络模型进行训练;采集日常生活数据发送至服务器,保存至用户日常数据记录表中;从用户日常数据记录表中提取当日数据,形成n维向量,做归一化处理后输入2型糖尿病病理神经网络模型中进行糖尿病概率预测;智能家庭糖尿病护理设备判断糖尿病概率值是否大于0.5;当用户判定为得了2型糖尿病时,用户自行去医院检查,并将检查结果通过智能家庭糖尿病护理设备传送回服务器,服务器判断检查结果是否正确;当检查结果错误时执行增量式算法,对神经网络模型进行动态修正,上述诊断结果聚焦于建立预测模型进行糖尿病预测,对数据处理环节关注不够,导致数据处理准确度存在问题,影响2型糖尿病诊断的准确性;同时,现有技术中深度学习模型的建立过程较为粗犷,导致模型解决问题的效率不高。


技术实现思路

1、本专利技术的目的在于提供一种基于医疗数据处理的2型糖尿病预测方法及系统,用于提高2型糖尿病诊断的准确性。

2、为解决上述技术问题,本专利技术具体提供下述技术方案:一种基于医疗数据处理的2型糖尿病预测方法,具体包括步骤:

3、s1:获取用于2型糖尿病预测的样本集;

4、s2:对所述样本集进行第一数据预处理操作,得到第二样本集;

5、s3:对所述第二样本集进行第二数据预处理操作,得到第三样本集;

6、所述s3具体为:s3.1:遍历所述第二样本集,标记所述第二样本集存在指标值缺失的样本;s3.2:对样本中缺失值的指标进行判断,若为基础指标则不进行补足操作,若为实验室指标,则进入下一步;s3.3:对所述实验室指标值进行补足处理;

7、所述s3.3具体为:

8、s3.3.1:判断所述第二样本集中待补足样本与其他样本相似度,若存在相似度超过80%的其他样本,则进入下一步,否则进入s3.3.3;s3.3.2:根据所述相似度超过80%的其他样本中待补足指标的值计算所述待补足样本中待补足指标的值;s3.3.3:采用第二补足方法对所述待补足样本进行数据补正操作;

9、s4:对所述第三样本集中的经过补足操作的样本进行质量检测,得到第四样本集;

10、s4.1:建立2型糖尿病预测模型;s4.2:将所述第三样本集中未进行补足操作的样本对所述2型糖尿病预测模型进行训练;s4.3:将所述第三样本集中进行补足操作的样本输入至所述2型糖尿病预测模型;输出2型糖尿病患病概率;s4.4:对输出的所述2型糖尿病患病概率进行判断,若大于预设值,则保留,否则,删除该样本,得到第四样本集;

11、s5:将第四样本集重新对所述2型糖尿病预测模型训练,将待预测患者数据输入至训练后的2型糖尿病预测模型,得到预测结果。

12、优选地,所述s1中,所述样本集中的样本包括:患者基本指标以及实验室指标。

13、优选地,基本指标包括患者年龄,性别,身高、体重、是否多尿、是否多饮、是否有体虚、是否有多食、是都有视觉模糊、是否有皮肤瘙痒、是否有易怒、是否有肥胖;实验室指标包括:空腹血糖、餐后血糖、糖化血红蛋白、血脂、血压、用餐2hc肽、血尿素氮、空腹c肽。

14、优选地,所述s2中,所述第一数据预处理操作为:样本筛选、特征编码。

15、优选地,所述s3.3.1中,所述相似度比较具体为:首先获取和待补足样本中性别相同,年龄差距少于5周岁的样本作为比较样本,计算所述待补足样本中的除待补足指标外的实验室指标值与比较样本中同样类型的实验室指标值的相似度,然后对所述多个相似度求平均值,基于上述相似度平均值实现待补足样本和其他样本的相似度比较。

16、优选地,所述s3.3.2具体为:计算所述相似度超过80%的其他样本中待补足指标的值的均值作为所述待补足样本中待补足指标的值。

17、优选地,所述s3.3.3中,所述第二补足方法为采用深度学习模型对所述待补足样本进行数据补正操作。

18、优选地,所述深度学习模型为bp神经网络模型。

19、优选地,所述bp神经网络模型的隐含层神经元个数m的确定公式为:

20、

21、式中,ms为所述bp神经网络模型的样本集数量,mo为所述bp神经网络模型的输出层的神经元数量,mi为所述bp神经网络模型的输入层的神经元数量,a为调节系数,在3-5内取值。

22、根据本专利技术的另一方面,提供一种基于医疗数据处理的2型糖尿病预测系统,所述系统采用上述的一种基于医疗数据处理的2型糖尿病预测方法,所述系统还包括:

23、样本集获取模块,获取用于2型糖尿病预测的样本集;

24、第一预处理模块,用于对所述样本集进行第一数据预处理操作,得到第二样本集;

25、第二预处理模块,用于对所述第二样本集进行第二数据预处理操作,得到第三样本集;

26、质量检测模块,用于对所述第三样本集中的经过补足操作的样本进行质量检测,得到第四样本集;

27、2型糖尿病预测模型,用于将第四样本集重新对所述2型糖尿病预测模型训练,将待预测患者数据输入至训练后的2型糖尿病预测模型,得到预测结果。

28、本专利技术与现有技术相比较具有如下有益效果:

29、本专利技术在对医疗数据处理时,尤其是对医疗数据样本集处理时,首先,对于存在数据缺失的样本进行数据补足操作,针对不同的样本集采用了不同的数据补足方法,针对有准确的可对照样本的样本采用相似度比较的方式进行补足操作,针对无可对照样本的样本则采用深度学习的方式进行补足操作,这样,提高了医疗数据处理的准确性,同时,又兼顾了预测效率;

30、同时,在数据补足后,又设置了质量检测环节,即将经过补足的样本输入至经过未补足样本训练的2型糖尿病预测模型中,根据模型的输出结果判断数据补本文档来自技高网...

【技术保护点】

1.一种基于医疗数据处理的2型糖尿病预测方法,其特征在于,具体包括步骤:

2.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述S1中,所述样本集中的样本包括:患者基本指标以及实验室指标。

3.根据权利要求2所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,基本指标包括患者年龄、性别、身高、体重、是否多尿、是否多饮、是否有体虚、是否有多食、是都有视觉模糊、是否有皮肤瘙痒、是否有易怒以及是否有肥胖;实验室指标包括:空腹血糖、餐后血糖、糖化血红蛋白、血脂、血压、用餐2hC肽、血尿素氮以及空腹C肽。

4.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述S2中,所述第一数据预处理操作为:样本筛选、特征编码。

5.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述S3.3.1中,所述相似度比较具体为:首先获取和待补足样本中性别相同,年龄差距少于5周岁的样本作为比较样本,计算所述待补足样本中的除待补足指标外的实验室指标值与比较样本中同样类型的实验室指标值的相似度,然后对所述多个相似度求平均值,基于上述相似度平均值实现待补足样本和其他样本的相似度比较。

6.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述S3.3.2具体为:计算所述相似度超过80%的其他样本中待补足指标的值的均值作为所述待补足样本中待补足指标的值。

7.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述S3.3.3中,所述第二补足方法为采用深度学习模型对所述待补足样本进行数据补正操作。

8.根据权利要求7所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述深度学习模型为BP神经网络模型。

9.根据权利要求8所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述BP神经网络模型的隐含层神经元个数M的确定公式为:

10.一种基于医疗数据处理的2型糖尿病预测系统,其特征在于,所述系统采用权利要求1-9任一项所述的一种基于医疗数据处理的2型糖尿病预测方法,所述系统还包括:

...

【技术特征摘要】

1.一种基于医疗数据处理的2型糖尿病预测方法,其特征在于,具体包括步骤:

2.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述s1中,所述样本集中的样本包括:患者基本指标以及实验室指标。

3.根据权利要求2所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,基本指标包括患者年龄、性别、身高、体重、是否多尿、是否多饮、是否有体虚、是否有多食、是都有视觉模糊、是否有皮肤瘙痒、是否有易怒以及是否有肥胖;实验室指标包括:空腹血糖、餐后血糖、糖化血红蛋白、血脂、血压、用餐2hc肽、血尿素氮以及空腹c肽。

4.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述s2中,所述第一数据预处理操作为:样本筛选、特征编码。

5.根据权利要求1所述的基于医疗数据处理的2型糖尿病预测方法,其特征在于,所述s3.3.1中,所述相似度比较具体为:首先获取和待补足样本中性别相同,年龄差距少于5周岁的样本作为比较样本,计算所述待补足样本中的除待补足指标外的实验室指标值...

【专利技术属性】
技术研发人员:李艳颖隋宝石
申请(专利权)人:天津市中西医结合医院天津市南开医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1