当前位置: 首页 > 专利查询>余妍洁刘峰专利>正文

一种青少年自杀风险预测模型的生成方法和预测系统技术方案

技术编号:32853897 阅读:13 留言:0更新日期:2022-03-30 19:20
本申请提供一种自杀风险预测模型的生成方法,包括:步骤1:在线上平台使用心理健康调查问卷,对我市部分中小学开展问卷调查。步骤2:回收问卷后,将抑郁,焦虑,性别,年龄等作为自变量,自杀高风险作为因变量,使用二元逻辑回归,分析影响自杀行为的高风险因素。步骤3:自杀高风险作为预测目标,抑郁,焦虑,性别,年龄等作为危险因素,使用XGBoost机器学习方法建立样本数据的数学模型,对自杀高风险青少年进行有效预测。此外,在相同数据集上与高斯朴素贝叶斯、支持向量机、随机森林等7种不同机器学习方法进行性能比较,进一步证明XGBoost模型的准确性和可靠性。通过本发明专利技术,数据采集简便,利用简单易懂的问卷和人工智能技术,实现了对青少年自杀可能性的识别,为心理危机的预防和干预提供了强有力的支持。防和干预提供了强有力的支持。

【技术实现步骤摘要】
一种青少年自杀风险预测模型的生成方法和预测系统


[0001]本发现涉及精神病学、心理学、流行病学及人工智能领域,更具体地涉及一种自杀风险预测模型的生成和预测系统。

技术介绍

[0002]国内最新统计学及流行病学调查显示,我国儿童青少年心理异常的总患病率为15.6%,其中抑郁症的患病率约为2.8

4.6%。抑郁是造成青少年自杀的主要原因,世界卫生组织WHO发布的全球疾病负担研究的数据显示,抑郁导致的自杀风险在10

24岁人群中达到顶峰,位列该年龄段所有死亡原因的首位。自杀行为不仅危害青少年自身生命安全,而且给亲友造成巨大心理创伤、给全社会造成巨大的经济负担。研究发现,1例自杀死亡可使6个人受到严重影响,1例自杀未遂可使2个人受到严重影响,自杀死亡给他人造成的心理伤害持续10年;自杀未遂持续6个月。此外,根据WHO的资料,我国因自杀及自伤造成的伤残调整生命年(DALYs)损失占全部疾病负担的4.2%,位列我国第4位重大卫生问题。
[0003]目前针对儿童青少年的预测个体自杀风险的工具较少,包括哥伦比亚

自杀严重程度评定量表儿童版本(C

SSRS),PANSI量表( Positive and Negative Suicide Ideation)以及 SIQ

JR量表( Suicidal Ideation Questionnaire
ꢀ‑ꢀ
Junior ),通过这些工具,可以评估工作对象在将来产生自杀行为的可能性,但是这些方法在我国的应用尚少,且均依靠被试的自我报告,需要被试的积极配合和主动应答,且成本耗费较大。目前已有部分海外研究者根据医疗保健系统的就诊数据进行自杀风险预测工具的开发,但由于其低灵敏度和低阳性预测值,导致大多数人认为这些工具没有临床价值,是以目前应用较少,更多处于科研层面。且目前的预测模型主要见于用于跨企业级的医疗保健系统,包括美国国防部、美国退伍军人事务部和大型医疗机构,尚没有针对普通在校儿童青少年的自杀预测模型出现。

技术实现思路

[0004]为了简单识别青少年高自杀风险人群,本专利技术提供了一种自杀风险预测模型的生成方法。
[0005]本研究首先在重庆市16个区县随机选择抽样近2万名中学生中进行了全面的心理健康筛查,并根据统计分析筛选出重要危险因素,同时判定有自杀计划,自伤行为及曾经实施过自杀行为的参与者为自杀高风险人群,使用XGBoost机器学习(ML)方法建立样本数据的数学模型,并将在未来的更大样本的调研中,进一步对模型的预测精度进行完善和加强。
[0006]步骤1:在线上平台使用自制心理健康调查问卷,由个人基本信息(包括年龄性别、身高、体重、居住地等)、家庭相关问题(父母关系、是否独生子女、每年与父母相处时间、家庭暴力等)、学校相关问题(与老师关系、与同学关系、学习成绩、校园暴力等)、儿童流调中心抑郁量表(CES

DC),儿童焦虑性情绪障碍筛查量表(SCARED),自杀问题(包括自杀意念、自杀行为、自伤行为等)组成,通过基于网络的随机、分层、整群抽样方法,对我市部分初中、
高中、职高开展问卷调查,回收学生问卷17428份;此外,还通过座谈会、深度访谈、部门走访、资料查阅等多种方式开展了我市儿童青少年心理健康综合调研。
[0007]步骤2:回收问卷后,对整体结果进行统计分析,将有自杀计划或已实施过自杀行为的人群判定为自杀高风险人群;使用χ2 检验(二元变量或无序分类变量)和 Mann

Whitney U 检验(序数类别数据)的单变量分析来评估变量之间的关联;使用二元逻辑回归,将所有因素检测潜在因素,进行逐步回归以在逻辑回归中选择显着的自变量;方差膨胀因子用于检查线性回归中变量的多重共线性。
[0008]步骤3:我们将自杀高风险人群作为预测目标,将抑郁,焦虑,性别,年龄,BMI,心理弹性,居住地,父母关系,留守儿童,父母的期望,独生子女,家庭作业,住校,校园暴力,家庭暴力作为危险因素,使用XGBoost机器学习(ML)方法建立样本数据的数学模型。首先,我们随机地将样本数据集分割成比例为8:2的训练集和测试集,训练集只用于训练XGBoost机器学习模型,而独立的测试集只用于模型的验证评估。其次,由于训练集中阳性样本占比仅为7%,而阴性样本占比93%,存在类别比例不平衡的问题,在实际比较了几种不同方法后,选择效果更好的可放回重复采样方法,即对训练集中的阳性样本进行可放回随机过采样,重采样后的阳性样本数保持与阴性样本数一致,并将重采样得到的阳性样本与原来的阴性样本合并成新的训练集。接着,设置合适的超参数在新的均衡训练集上训练XGBoost机器学习模型,并在保留的测试集上独立地验证评估模型的多方位的性能指标。此外,在相同数据集上与高斯朴素贝叶斯、支持向量机、随机森林等7种不同机器学习方法进行性能比较,进一步证明XGBoost模型的准确性和可靠性。最后,保存得到的最优机器学习模型,用于以后未知青少年个体的自杀风险预测。
附图说明
[0009]图1展示了我们训练的不同ML模型在独立测试集上的受试者工作特征曲线下的面积[AUROC]:0.56

0.84。图2总结了我们训练的不同ML模型在独立测试集上的详细性能结果。
具体实施方式
[0010]极端梯度升压(XGBoost)是一种机器学习技术,它是一种高效、灵活、优化的分布式梯度升压库。在当前的研究中,我们使用XGBoost算法训练自杀行为检测模型,并用于预测未来可能的自杀行为。我们将数据集随机分为训练集和测试集,其中训练集和测试集的比例分别为80%和20%,独立的测试数据集用于模型验证。每个人的独立输入变量是抑郁,焦虑,性别,年龄,BMI,心理弹性,居住地,父母关系,留守儿童,父母的期望,独生子女,家庭作业,住校,校园暴力,家庭暴力作为危险因素;输出变量是自杀企图及自杀未遂。此外,我们还使用了高斯朴素贝叶斯(Gaussian Naive Bayes, GNB),支持向量机(Support Vector Machines,SVM),随机森林(Random Forest,RF),多层感知器(Multi

layer Perceptron,MLP),K近邻法(K

Nearest Neighbors,KNN),决策树(Decision Tree, DT)和Adaboost等7种算法在完全相同情况下训练的模型作为对照进行性能比较。
[0011]表1总结了我们训练的不同ML模型在独立测试集上的详细性能结果(图2,受试者工作特征曲线下的面积[AUROC]:0.56

0.84)。总的来说,XGBoost、GNB和SVM模型能够更好
地区分是否有自杀行为,其中,表现最好的XGBoost模型成功预测自杀行为,其总体AUROC为0.84(图2)。为了明确地解释性别造成的差异,我们本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自杀风险预测模型的生成方法,包括:步骤1:在线上平台使用心理健康调查问卷,对我市部分中小学开展问卷调查。2.步骤2:回收问卷后,使用统计回归,分析影响自杀行为的高风险因素。3.步骤3:自杀高风险作为预测目标,抑郁,焦虑,性别,年龄等作为危险因素,使用XGBoost机器学习方法建立样本数据的数学模型。4.青少年自杀风险预测模型,针对对象为12

18岁年龄段人群,其特征在于:纳入被广泛使用的情绪问题量表设计的自制问卷,使用问卷在大样本青少年人群中进行流行病学调查,利用所得数据使用XGBoost机器学习方法建立样本数据的数学模型。5.如权利要求1所诉的数学模型,其特征在于:所诉前期调研所用自制问卷,包括个人基本信息(包括年龄性别、身高、体重、居住地等)、家庭相关问题(父母关系、是否独生子女、每年与父母相处时间、家庭暴力等)、学校相...

【专利技术属性】
技术研发人员:周新雨余妍洁刘峰滕腾李雪梅
申请(专利权)人:余妍洁刘峰
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1