当前位置: 首页 > 专利查询>浙江大学专利>正文

基于机器学习的老年人营养健康状态评估与风险预测系统技术方案

技术编号:34727438 阅读:73 留言:0更新日期:2022-08-31 18:15
本发明专利技术公开了一种基于机器学习的老年人营养健康状态评估与风险预测系统。该系统包括数据获取与特征筛选模块、营养健康状态评估模型构建模块、风险预测模块、营养健康状态分析与建议模块;本发明专利技术结合大数据与机器学习算法,纳入分析膳食信息、机体功能状态、生物标志物等营养健康状态相关的多维度特征,构建了基于CatBoost的营养健康状态评估模型,将人群划分为高、中、低、健康人群以提供风险预测信息,进而通过机器学习可解释技术提供个性化建议;本发明专利技术能够助力老年人实时而快速地掌握自身的营养健康状态,促进医疗保健人员对老年人营养健康状态的干预。养健康状态的干预。养健康状态的干预。

【技术实现步骤摘要】
基于机器学习的老年人营养健康状态评估与风险预测系统


[0001]本专利技术属于医疗健康信息
,具体涉及一种基于机器学习的老年人营养健康状态评估与风险预测系统。

技术介绍

[0002]人口老龄化已成为世界性的社会问题,2021年中国第七次全国人口普查结果显示,中国60岁及以上人口占比超18%,而预计2050年该比例将攀升至31%,65岁以上老人的比例将扩大到总人口的四分之一。伴随着人口老龄化,家庭与社会负担日益加重,社会保障支出压力持续加大,养老和健康服务供需矛盾更加突出,因此,提高老年人的健康服务和管理水平已成为了当前医疗健康领域的重要议题。
[0003]关注老年人的医疗健康,不仅需要探索前沿的疾病治疗方法,更重要的是日常营养健康状态的监测与护理。营养健康状态,包括个体的饮食习惯、营养水平以及各项生理指标,是身体机能的潜在表征,能够反映个体当前的生存状态,而对于老年人而言,营养健康状态往往也体现了其整体的生存风险。因此,准确评估老年人的营养健康状态,进而对其进行风险评估与营养管理,将对于提升老年人的健康服务水平具有重大的推动作用。
[0004]为深入探究老年人营养健康状态的相关风险因素,一系列针对老年人群体的大型队列数据为老年人健康研究提供了丰富而详实的数据基础,例如北京大学“中国老年健康影响因素跟踪调查”(Chinese Longitudinal Healthy Longevity Survey,CLHLS),1998

2018年在中国23个省/市/自治区随机抽取大约一半县市进行八次跟踪调查,累计入户访问11.3万人,调查涉及内容包括个体的生活状态、饮食习惯、营养状态以及各项生理指标。同时,日益发展的机器学习算法能够通过数据驱动的方式,从大数据中自动挖掘出相关的模式信息,因此已广泛应用于各项医疗健康领域的评估方法建立。
[0005]现有相关研究中已有的营养健康状态评估方法,如Detsky等人[1]提出的SGA评分,Kondrup等人[2]提出的NRS评分,Weekes等人[3]提出的MUST评分,Kruizenga等人[4]提出的SNAQ评分,上述评分仅纳入了体重下降、BMI、食物摄入等营养指标,而且主要面向成年人群,未针对老年人群进行优化调整;适用于老年人群体的MST评分[5]和MNA

SF评分[6],所纳入的指标仅有体重下降与营养摄入等简单指标。
[0006]同时,现有相关技术方案中亦存在一些局限:如授权公开号为CN102902881B的“一种肠外营养筛查计算系统”,仅是针对不同人群采用不同的营养评分方式(NRS、MUST、MNA、SGA),而未提出新的评分方式;如授权公开号为CN108877936B的“健康评估方法、系统及计算机可读存储介质”,以心脑血管系统功能为核心指征进行建模,但其方案主要针对的是慢性代谢性疾病发展模型;如授权公开号为CN111445980A的“膳食方案反应性预测模型及建模方法、电子设备”,主要针对的是膳食方案的评估,缺乏对当前个体营养状态的评估以及后续风险的预测分析。
[0007]综上,现有的相关研究与技术方案中存在以下问题:
[0008]1.大多营养评价指标建立于整体成年人群数据,而并未对老年人群进行进一步调
整优化,因此在老年人群中的适用性较差;
[0009]2.所纳入的信息较为有限,主要为人口学信息、体重变化等基础特征,一方面,未纳入营养习惯、机体功能状态信息,也鲜有客观的生理指标或生物标志物;另一方面,各指标主要于1990至2005年间提出,存在滞后性,未纳入新的一些生物标志物信息,难以具体地、量化地、全面地评价机体的营养健康状态;
[0010]3.方法实施主要依据问卷或评分量表方式,具体的计算方法和公式较为繁琐,所需时长由3至15分钟不等,同时,部分量表还需专业医护人员或营养保健人员评估;
[0011]4.方法输出结果主要为营养状态的整体评价,未对当前的营养状态提供建议,更未对后续生存风险进行评估预测。
[0012]参考文献:
[0013][1].Detsky,A.S.,et al.,What Is Subjective Global Assessment of Nutritional

Status.Journal of Parenteral and Enteral Nutrition,1987.11(1):p.8

13.
[0014][2].Kondrup,J.,Nutritional risk screening(NRS 2002):a new method based on an analysis of controlled clinical trials.Clinical Nutrition,2003.22(3):p.321

336.
[0015][3].Weekes,C.E.,M.Elia,and P.W.Emery,The development,validation and reliability of a nutrition screening tool based on the recommendations of the British Association for Parenteral and Enteral Nutrition(BAPEN).Clin Nutr,2004.23(5):p.1104

12.
[0016][4].Kruizenga,H.M.,et al.,Development and validation of a hospital screening tool for malnutrition:the short nutritional assessment questionnaire(SNAQ).Clin Nutr,2005.24(1):p.75

82.
[0017][5].Ferguson,M.,et al.,Development of a valid and reliable malnutrition screening tool for adult acute hospital patients.Nutrition,1999.15(6):p.458

464.
[0018][6].Rubenstein,L.Z.,et al.,Screening for undernutrition in geriatric practice:Developing the Short

Form Mini

Nutritional Assessment(MNA

SF).Journals of Gerontology Series a

Biological Sciences and Medical Scien本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,包括:(1)数据获取与特征筛选模块:获取大规模的老年人健康因素相关的队列数据,初步确定所能纳入的所有特征信息;提炼临床常用的各项相关指标与营养健康专家知识,筛选得到可用的有效特征,构建结构化的特征集并进行预处理;(2)营养健康状态评估模型构建模块:以数据获取与特征筛选模块得到的特征为输入,以样本的死亡时间为真实标签,构建数据集;通过CatBoost构建营养健康状态评估模型,同时采取交叉验证的方式验证模型的泛化性,通过网格搜索调优模型参数提高模型综合性能;通过序列浮动后向选择算法对全部有效特征进行筛选;(3)风险预测模块:以营养健康状态评估模型为基础,设定相应阈值划分人群为健康、低风险、中风险、高风险人群,进而根据人群区分与真实的生存信息,绘制生存曲线;实际应用时,只需输入当前个体的各项指征,通过营养健康状态评估模型的运算即得到相应的评分,划分为对应人群,并对照相应的生存曲线了解后续风险;(4)营养健康状态分析与建议模块:以营养健康状态评估模型为基础,在个体进行营养健康状态评估时,通过SHAP算法对具体的特征指标进行详细分析,了解各个特征重要性以及对结果的影响,进而提供更具体而精确的建议。2.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述数据获取与特征筛选模块中,采用的有效特征包括:基本信息:年龄、性别、死亡信息;人体测量信息:身高、体重、小腿围、右膝至地面距离、腰围;机体功能状态信息:是否需要辅助洗澡、是否需要辅助穿衣、是否需要辅助排泄、是否需要辅助室内移动、是否需要辅助进食、是否失禁、能否独立拜访邻居、能否独立购物、能否独立烹饪、能否独立洗衣、能否持续行走1公里、能否举起5千克重物、能否连续蹲伏和站立3次、能否乘坐公共交通工具、能否从座椅中站起、能否从地上捡起书、能否将手放在颈后、能否将手放在下背部、能否向上举起手臂;膳食信息:新鲜水果食用频率、新鲜蔬菜食用频率、肉类食用频率、水产品食用频率、蛋类食用频率、豆制品食用频率、腌咸菜或泡菜食用频率、白糖或糖果食用频率、茶食用频率、大蒜食用频率、奶制品食用频率、坚果食用频率、菌藻类食用频率;生活质量信息:个人生活质量自评、个人健康状态自评;生物标志物

血浆生化检查:白蛋白、血尿素氮、胆固醇、肌酐、超敏C

反应蛋白、血糖、糖化血清蛋白、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、超氧化物歧化酶活性、维生素d3、丙二醛、维生素b12;生物标志物

尿液指标:尿微量白蛋白、尿肌酐、尿清蛋白/尿肌酐;生物标志物

血常规检查:白细胞计数、淋巴细胞计数、淋巴细胞百分比、红细胞计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、血小板计数、平均血小板体积、血小板体积分布宽度、血小板压积。3.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述数据获取与特征筛选模块中,预处理时需结合数据文档标记缺失值,从而剔除缺失指标比例大于p的部分样本,同时进行数据分布分析,剔除异常值,保证数据的合理分布;针对存在部分缺失值的样本,通过K近邻进行空值填充。
4.根据权利要求1所述的基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,所述营养健康状态评估模型构建模块中,将特征集矩阵化为原始数据集(X,Y),X=[x1,x2,x3,...,x
n
],其中n为样本量,x
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]为单独样本的特征值,其中m为特征数,x
im
代表x
i
相应的特征值,其范围依数据类型而定;Y=[y1,y2,y3,...,y
n
]为样本的真实标签,数值为0或1,表示样本的生存或死亡信息;采用能够对分类变量进行无偏处理的提升树模型CatBoost构建营养健康状态评估模型;采用Greedy TS策略对类别型特征进行处理,即通过添加先验分布项做平滑处理,消除低频率类别型数据以及噪声数据对于数据集分布的影响,具体为:对样本集X进行随机排序,序列记为σ=(σ1,σ2,...,σ
n
),假设样本x
i
的第k个维度特征x
ik
为类别特征,则对x
ik
调整后的特征值为:其中,D={(x
i
,y
i
)}
i=1,...,n
为训练样本集,对于训练样本,D
i
={x
j
:σ(j)<σ(i)}表示序列中位于x
i
之前的部分样本集,对于测试样本,D
i
=D;[
·
]为指示函数,当x
jk
=x
ik
时其值为1,当x
jk
≠x
ik
时其值为0;P为先验值,α为先验值P的权重。5.根据权利要求4所述的基于机器学习的老年人营养健康状态评估...

【专利技术属性】
技术研发人员:杨杰吴佳耕袁长征沈洁陈辉陈卫
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1