【技术实现步骤摘要】
基于机器学习的老年人营养健康状态评估与风险预测系统
[0001]本专利技术属于医疗健康信息
,具体涉及一种基于机器学习的老年人营养健康状态评估与风险预测系统。
技术介绍
[0002]人口老龄化已成为世界性的社会问题,2021年中国第七次全国人口普查结果显示,中国60岁及以上人口占比超18%,而预计2050年该比例将攀升至31%,65岁以上老人的比例将扩大到总人口的四分之一。伴随着人口老龄化,家庭与社会负担日益加重,社会保障支出压力持续加大,养老和健康服务供需矛盾更加突出,因此,提高老年人的健康服务和管理水平已成为了当前医疗健康领域的重要议题。
[0003]关注老年人的医疗健康,不仅需要探索前沿的疾病治疗方法,更重要的是日常营养健康状态的监测与护理。营养健康状态,包括个体的饮食习惯、营养水平以及各项生理指标,是身体机能的潜在表征,能够反映个体当前的生存状态,而对于老年人而言,营养健康状态往往也体现了其整体的生存风险。因此,准确评估老年人的营养健康状态,进而对其进行风险评估与营养管理,将对于提升老年人的健康服务水平具有重大的推动作用。
[0004]为深入探究老年人营养健康状态的相关风险因素,一系列针对老年人群体的大型队列数据为老年人健康研究提供了丰富而详实的数据基础,例如北京大学“中国老年健康影响因素跟踪调查”(Chinese Longitudinal Healthy Longevity Survey,CLHLS),1998
‑
2018年在中国23个省/市/自治区随机抽取大约一半县 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,包括:(1)数据获取与特征筛选模块:获取大规模的老年人健康因素相关的队列数据,初步确定所能纳入的所有特征信息;提炼临床常用的各项相关指标与营养健康专家知识,筛选得到可用的有效特征,构建结构化的特征集并进行预处理;(2)营养健康状态评估模型构建模块:以数据获取与特征筛选模块得到的特征为输入,以样本的死亡时间为真实标签,构建数据集;通过CatBoost构建营养健康状态评估模型,同时采取交叉验证的方式验证模型的泛化性,通过网格搜索调优模型参数提高模型综合性能;通过序列浮动后向选择算法对全部有效特征进行筛选;(3)风险预测模块:以营养健康状态评估模型为基础,设定相应阈值划分人群为健康、低风险、中风险、高风险人群,进而根据人群区分与真实的生存信息,绘制生存曲线;实际应用时,只需输入当前个体的各项指征,通过营养健康状态评估模型的运算即得到相应的评分,划分为对应人群,并对照相应的生存曲线了解后续风险;(4)营养健康状态分析与建议模块:以营养健康状态评估模型为基础,在个体进行营养健康状态评估时,通过SHAP算法对具体的特征指标进行详细分析,了解各个特征重要性以及对结果的影响,进而提供更具体而精确的建议。2.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述数据获取与特征筛选模块中,采用的有效特征包括:基本信息:年龄、性别、死亡信息;人体测量信息:身高、体重、小腿围、右膝至地面距离、腰围;机体功能状态信息:是否需要辅助洗澡、是否需要辅助穿衣、是否需要辅助排泄、是否需要辅助室内移动、是否需要辅助进食、是否失禁、能否独立拜访邻居、能否独立购物、能否独立烹饪、能否独立洗衣、能否持续行走1公里、能否举起5千克重物、能否连续蹲伏和站立3次、能否乘坐公共交通工具、能否从座椅中站起、能否从地上捡起书、能否将手放在颈后、能否将手放在下背部、能否向上举起手臂;膳食信息:新鲜水果食用频率、新鲜蔬菜食用频率、肉类食用频率、水产品食用频率、蛋类食用频率、豆制品食用频率、腌咸菜或泡菜食用频率、白糖或糖果食用频率、茶食用频率、大蒜食用频率、奶制品食用频率、坚果食用频率、菌藻类食用频率;生活质量信息:个人生活质量自评、个人健康状态自评;生物标志物
‑
血浆生化检查:白蛋白、血尿素氮、胆固醇、肌酐、超敏C
‑
反应蛋白、血糖、糖化血清蛋白、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、超氧化物歧化酶活性、维生素d3、丙二醛、维生素b12;生物标志物
‑
尿液指标:尿微量白蛋白、尿肌酐、尿清蛋白/尿肌酐;生物标志物
‑
血常规检查:白细胞计数、淋巴细胞计数、淋巴细胞百分比、红细胞计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、血小板计数、平均血小板体积、血小板体积分布宽度、血小板压积。3.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述数据获取与特征筛选模块中,预处理时需结合数据文档标记缺失值,从而剔除缺失指标比例大于p的部分样本,同时进行数据分布分析,剔除异常值,保证数据的合理分布;针对存在部分缺失值的样本,通过K近邻进行空值填充。
4.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述营养健康状态评估模型构建模块中,将特征集矩阵化为原始数据集(X,Y),X=[x1,x2,x3,...,x
n
],其中n为样本量,x
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]为单独样本的特征值,其中m为特征数,x
im
代表x
i
相应的特征值,其范围依数据类型而定;Y=[y1,y2,y3,...,y
n
]为样本的真实标签,数值为0或1,表示样本的生存或死亡信息;采用能够对分类变量进行无偏处理的提升树模型CatBoost构建营养健康状态评估模型;采用Greedy TS策略对类别型特征进行处理,即通过添加先验分布项做平滑处理,消除低频率类别型数据以及噪声数据对于数据集分布的影响,具体为:对样本集X进行随机排序,序列记为σ=(σ1,σ2,...,σ
n
),假设样本x
i
的第k个维度特征x
ik
为类别特征,则对x
ik
调整后的特征值为:其中,D={(x
i
,y
i
)}
i=1,...,n
为训练样本集,对于训练样本,D
i
={x
j
:σ(j)<σ(i)}表示序列中位于x
i
之前的部分样本集,对于测试样本,D
i
=D;[
·
]为指示函数,当x
jk
=x
ik
时其值为1,当x
jk
≠x
ik
时其值为0;P为先验值,α为先验值P的权重。5.根据权利要求4所述的基于机器学习的老年人营养健康状态评估...
【专利技术属性】
技术研发人员:杨杰,吴佳耕,袁长征,沈洁,陈辉,陈卫,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。