一种基于机器学习的糖尿病处方预测方法技术

技术编号:38327522 阅读:14 留言:0更新日期:2023-07-29 09:10
本发明专利技术提供一种基于机器学习的糖尿病处方预测方法、终端机及存储介质,涉及医疗方案预测领域,收集整理已知的糖尿病病人处方集,确定对应的糖尿病病人体征健康数据集,并建立基本数据集;对建立的基本数据集进行预处理操作;针对每一种药物,分别进行数据集划分;结合多种机器学习模型在每一个数据集上进行训练,得到对应的目标预测模型;基于多种机器学习模型的输出结果,得到最终的预测电子处方,根据药品描述条目数据,生成对应的预测自然语言描述文本。避免了机器学习算法模型受到其传统统计技术的限制,也解决在有效解释非线性关系和变量

【技术实现步骤摘要】
一种基于机器学习的糖尿病处方预测方法


[0001]本专利技术涉及医疗方案预测领域,尤其涉及一种基于机器学习的糖尿病处方预测方法。

技术介绍

[0002]糖尿病是一种以高血糖为特征的代谢性疾病。高血糖则是由于胰岛素分泌缺陷或其生物作用受损,或两者兼有引起。糖尿病是一种受遗传因素、环境因素及生活习惯所影响导致的一种慢性代谢性疾病。主要原因是人体胰腺不能正常产生胰岛素(胰岛素缺乏)或身体不能正常利用胰岛素(胰岛素抵抗),导致血糖高于正常的一种综合征。
[0003]在实际的糖尿病临床治疗中,每位患者的糖尿病病因不同,糖尿病的症状也因人而异,同时各类药物组合非常复杂。各种因素综合起来,使得临床医师很难对每一位患者给出最佳药物治疗方案。
[0004]目前对于糖尿病处方预测方法中,也采用机器学习算法模型来进行预测,但受到传统统计技术的限制,也就是受到解释非线性关系和变量

变量相互作用的能力方面受到限制的问题,并且传统统计技术依赖于在人类生物系统中可能不正确的假设,影响预测结果的准确性和鲁棒性。

技术实现思路

[0005]本专利技术提供一种基于机器学习的糖尿病处方预测方法,方法针对目前临床上糖尿病给药存在的问题,采用机器学习的方法,对使用各种用药方案的病人进行处理,训练多种机器学习模型,来找到各种药物方案的适用人群,最后建立预测模型,得到一个辅助处方预测系统。
[0006]方法包括:
[0007]S101、收集整理已知的糖尿病病人处方集,确定对应的糖尿病病人体征健康数据集,并建立基本数据集;
[0008]S102、对建立的基本数据集进行预处理操作;预处理操作包括对连续性变量的转换、离散型变量的稀疏化处理以及药物的过滤筛选;
[0009]S103、针对每一种药物,分别进行数据集划分;
[0010]S104、结合多种机器学习模型在每一个数据集上进行训练,并测试机器学习模型在测试集上的可靠性,直至预测精度满足要求,得到对应的目标预测模型;
[0011]S105、基于多种机器学习模型的输出结果,得到最终的预测电子处方,根据药品描述条目数据,生成对应的预测自然语言描述文本。
[0012]进一步需要说明的是,步骤S101中,收集整理已知的糖尿病病人处方集为
[0013]M={(M
11
,M
12
,...,M
1(b+1)
),(M
21
,M
22
,...,M
2(b+1)
),...,(M
m1
,M
m2
,...,M
m(b+1)
)};
[0014]确定对应的糖尿病病人体征健康数据集为
[0015]P={(P
11
,P
12
,...,P
1(a+1)
),(P
21
,P
22
,...,P
2(a+1)
),...,(P
p1
,P
p2
,...,P
p(a+1)
)};
[0016]其中,a为病人体征健康数据维度,b为药品描述条目维度,m为处方中药品描述条目数量,p为糖尿病病人数量。
[0017]进一步需要说明的是,步骤S101中还包括:
[0018]S1011、定义P
i
为第i个糖尿病病人的体征健康数据,P
i1
为第i个病人的的编号;
[0019]P
i2
~P
i(a+1)
为病人的a个特征;M
i
为第i条药品描述条目数据,M
i1
为该药品描述条目数据所对应的病人编号,M
i2
为药品名,M
i2
~M
i(m+1)
)为多个药品描述条目数据标签;
[0020]S1012、在药品描述条目数据中,选取的特征包括:M
i2
药品名、M
i3
药品种类、M
i4
是否为胰岛素、M
i5
早餐前注射量、M
i6
午餐前注射量、M
i7
晚餐前注射量、M
i8
睡前注射量、M
i9
是否为口服药、M
i10
服用频率、M
i11
单次服用量、M
i12
是否需要餐前服用、M
i13
是否需要随诊、M
i14
随诊科室、M
i15
是否需要定期复查、M
i16
复查间隔、M
i17
复查项目;
[0021]S1013、选取糖尿病病人的体征健康数据特征,所述体征健康数据特征包括:性别、入院体重指数、是否有家族病史、糖尿病类型、入院收缩压、入院舒张压、入院腰围、入院年龄、发病年龄、是否感染、是否妊娠、是否患有癌症、是否患有糖尿病酮症、是否患有糖尿病视网膜病变、是否患有糖尿病肾病、是否患有糖尿病周围神经病变、是否患有下肢动脉病变、是否患有颈动脉病变、是否患有脑血管病、是否患有冠心病以及是否患有高血压病。
[0022]进一步需要说明的是,步骤S102中,对数据具体的预处理操作步骤如下:
[0023]S1021、针对连续型的变量,根据特点将其转换成离散变量,将变量根据其最大值和最小值进行归一化处理,使得所有数据处于(0,1)范围中,最后根据变量出现的频率,将其划分成三个等频率的区间,使之成为值域规模为三的离散型变量;
[0024]S1022、针对离散型变量,将改变将进行哑变量稀疏化处理;
[0025]S1023、对处方中药物的出现频率进行排序,保留出现频率排名前十三的高频药物D={D1,D2,...D
13
},从数据集中移除所有低频药物;若此操作之后,某病人对应处方为空,则移除该条记录。
[0026]进一步需要说明的是,步骤S103中,通过随机划分的方法将整个数据集划分成训练集和测试集,二者比例通过收敛性测试确定。
[0027]进一步需要说明的是,步骤S104中,所采用的机器学习模型包括但不限于逻辑回归算法、朴素贝叶斯算法、支持向量机算法、深度学习算法、随机森林算法以及AdaBoost算法。
[0028]进一步需要说明的是,步骤S105中,根据药品描述条目数据生成对应自然语言表述的规则描述如下:
[0029]规则一:结果中所有的药品描述条目数据自然语言表述按照药品种类进行聚合;
[0030]规则二:药品描述条目数据自然语言表述的基本格式为:{药品名称}{2}{3}{4};
[0031]规则三:若”是否为胰岛素“为真,则{2}表述为:<早[早餐前注射量]u>,
[0032]<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的糖尿病处方预测方法,其特征在于,方法包括:S101、收集整理已知的糖尿病病人处方集,确定对应的糖尿病病人体征健康数据集,并建立基本数据集;S102、对建立的基本数据集进行预处理操作;预处理操作包括对连续性变量的转换、离散型变量的稀疏化处理以及药物的过滤筛选;S103、针对每一种药物,分别进行数据集划分;S104、结合多种机器学习模型在每一个数据集上进行训练,并测试机器学习模型在测试集上的可靠性,直至预测精度满足要求,得到对应的目标预测模型;S105、基于多种机器学习模型的输出结果,得到最终的预测电子处方,根据药品描述条目数据,生成对应的预测自然语言描述文本。2.根据权利要求1所述的基于机器学习的糖尿病处方预测方法,其特征在于,步骤S101中,收集整理已知的糖尿病病人处方集为M={(M
11
,M
12
,...,M
1(b+1)
),(M
21
,M
22
,...,M
2(b+1)
),...,(M
m1
,M
m2
,...,M
m(b+1)
)};确定对应的糖尿病病人体征健康数据集为P={(P
11
,P
12
,...,P
1(a+1)
),(P
21
,P
22
,...,P
2(a+1)
),...,(P
p1
,P
p2
,...,P
p(a+1)
)};其中,a为病人体征健康数据维度,b为药品描述条目维度,m为处方中药品描述条目数量,p为糖尿病病人数量。3.根据权利要求2所述的基于机器学习的糖尿病处方预测方法,其特征在于,步骤S101中还包括:S1011、定义P
i
为第i个糖尿病病人的体征健康数据,P
i1
为第i个病人的的编号;P
i2
~P
i(a+1)
为病人的a个特征;M
t
为第i条药品描述条目数据,M
i1
为该药品描述条目数据所对应的病人编号,M
i2
为药品名,M
i2
~M
i(m+1)
)为多个药品描述条目数据标签;S1012、在药品描述条目数据中,选取的特征包括:M
i2
药品名、M
i3
药品种类、M
i4
是否为胰岛素、M
i5
早餐前注射量、M
i6
午餐前注射量、M
i7
晚餐前注射量、M
i8
睡前注射量、M
i9
是否为口服药、M
i10
服用频率、M
i11
单次服用量、M
i12
是否需要餐前服用、M
i13
是否需要随诊、M
i14
随诊科室、M
i15
是否需要定期复查、M
i16
复查间隔、M<...

【专利技术属性】
技术研发人员:吴飞跃吴天星陈亚
申请(专利权)人:江苏亚寰软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1