本发明专利技术公开了一种基于机器学习的献血人员识别与招募方法,包括如下步骤:(1)建立献血人员特征库,需采集每位献血人员历年献血情况,根据其献血情况设计并计算其特征;(2)构建xgboost模型,其中模型输入为所述献血人员特征,模型输出为献血人员是否为有效献血人员的期望输出;(3)利用过往短信招募数据得到训练数据,对所述xgboost模型进行训练;(4)对于符合条件的献血人员,根据其特征数据,利用所述xgboost模型给出参考献血人员推荐。本发明专利技术借助于机器学习和大量历史数据,能够给出有效合理的献血人员,从而提高献血招募的效率和质量。
【技术实现步骤摘要】
基于机器学习的献血人员识别与招募方法
本专利技术涉及一种识别与招募献血人员的方法,尤其涉及一种基于机器学习的献血人员识别与招募方法属于智能献血管理方法
技术介绍
血液是生命之源,是非常重要而稀缺的医疗资源。现代医学发展至今,输血作为救死扶伤不可替代的医疗手段,无论是有计划的治疗还是紧急干预,都离不开迄今尚无法人工合成和长期保存,且不可用其他药品替代的血液的支持。输血广泛应用于手术、创伤、恶性肿瘤、怀孕分娩、血友病等多种疾病,成为拯救生命和改善健康至关重要的一环,每年能够帮助数百万罹患危及生命病症的患者延长生命并提高其生活质量。我国自1998年开展无偿献血工作以来,经过多年的努力,全国无偿献血人次数保持连续20年增长,全国无偿献血人次从1998年约30万,上升到2018年的近1500万。尽管全国采血总量从1998年不足500万单位增加到2018年的2500余万单位,增长超过4倍,但仍然无法适应临床对血液需求的增长速度,临床用血的刚性需求与采供血不足的矛盾依然突出,特别是在一些经济发达,医疗资源丰富的大城市成为常态,由局部性、季节性、结构性向广泛性、持续性蔓延,血液供应不足已引发越来越大的医患矛盾,血液安全风险依然存在。目前国内无偿献血的采集方式主要是通过采供血机构在街头等待献血者献血的被动方式实现的,即使一部分无偿献血采用短信、电话和邮件等主动招募方式,但缺乏对历史献血人员的健康动态和献血意愿的科学分析,献血招募的效率普遍不高。因此,在建立和完善政府主导、多部门协调的无偿献血保障和激励机制的基础上,开展基于献血大数据的技术攻关,建立和优化适应无偿献血工作的献血者高效招募技术,提高献血招募的效率和质量,招募更多的献血者,是应对目前血液供应“紧平衡”现状,保证医疗临床用血需要和安全的重要路径。本专利技术旨在解决这一技术问题。
技术实现思路
本专利技术所要解决的技术问题在于解决现有技术的不足,提供一种基于机器学习的献血人员识别与招募方法。为实现上述目的,本专利技术采用下述的技术方案:一种基于机器学习的献血人员识别与招募方法,包括如下步骤:(1)建立献血人员特征库,采集每位献血人员历年献血情况,根据其献血情况设计并计算其特征;(2)构建xgboost模型,其中模型输入为所述献血人员特征,模型输出为献血人员是否为有效献血人员的期望输出;(3)利用过往短信招募得到有/无效献血人员的数据,对所述xgboost模型进行训练;(4)对于符合条件的献血人员,根据其特征数据,利用所述xgboost模型做出有效献血人员排序,并推荐献血人员。其中较优地,所述步骤(1)中,所述设计并计算的特征包括年龄、性别、血型、最近献血量、总献血量、献血次数、献血间隔、献血频率、血液检测是否合格、教育程度、居住状态、职业和献血反应,其中献血频率采用公式(1)计算。其中较优地,所述步骤(1)中,一些属性值存在缺失情况时,采用缺省值进行补足。其中较优地,所述步骤(2)中,所述xgboost模型的基本模型参数,以树模型作为基分类器,设置迭代次数即所使用的树的数量为500,树的最大深度为12。其中较优地,所述步骤(2)中,所述xgboost模型的训练参数,模型的目标函数为Logistic函数,用于分类献血人员;模型评测函数设置为二分类错误率,学习率采用0.3;在训练每棵时,为了避免过拟合带来的影响,设置数据集的采样率为90%,选用特征占比也为90%。其中较优地,所述步骤(3)中,所述训练的步骤如下:(3.1)借助以往短信招募信息,对收到短信的人员进行追踪,如果七日内有献血记录,则认为是有效献血人员,否则为无效献血人员;(3.2)构建收集的有效献血人员与无效献血人员在发短信时的特征,得到模型的训练数据;(3.3)将所述训练数据作为模型输入,将该人员是否为有效献血人员作为期望输出,训练所述xgboost模型。其中较优地,所述步骤(4)包括如下子步骤:(4.1)采集献血间隔期符合规定(两次全血/单采红细胞与全血捐献的间隔期不少于6个月,两次单采血小板/血浆/单采粒细胞与全血捐献的间隔期不少于4周)且年龄在十八周岁至五十五周岁的健康公民或既往无献血反应、符合健康检查要求不超过六十周岁的多次献血者的献血人员特征;(4.2)从献血人员特征库中得到所述对象的特征集;(4.3)将每个献血人员的基本属性输入训练好的xgboost模型中,得到有效献血人员的期望输出,并按输出结果排序,推荐排名较高的人员。与现有技术相比较,本专利技术利用血液中心的历年献血数据构建献血人员基本属性库,同时通过过往短信招募数据得到训练数据,训练得到xgboost模型。在模型训练完成之后,每当需要发布新的短信招募时,可以相应地筛选符合条件的献血人员数据,然后利用该xgboost模型即可给出参考识别结果,并将其排序,按所需人数选择相应的招募对象。本专利技术采用xgboost模型实现,对属性重要性进行有效的重要程度挖掘,有效学习献血对象属性的内在联系。实验结果表明,本专利技术实现的分类精度可以达到80%以上,显著优于现有技术。附图说明图1为传统血液中心选择适宜的招募对象流程图;注:1、年龄规定:在十八周岁至五十五周岁的健康公民或既往无献血反应、符合健康检查要求不超过六十周岁的多次献血者;2、献血间隔期规定:两次采血/单采红细胞与全血捐献的间隔期不少于6个月,两次单采血小板/血浆/单采粒细胞与全血捐献的间隔期不少于4周;图2为本专利技术所采用的xgboost模型的架构示意图。具体实施方式下面结合附图和具体实施例对本专利技术的
技术实现思路
做进一步的详细说明。本专利技术提供了一种借助机器学习方法来提高献血人员短信招募精度的方法,主要包括特征设计、模型构建、模型训练与招募对象推荐四个步骤。下面分别进行具体的阐述:血液中心通常使用的短信招募献血人员的方法如图1所示,主要通过从近一年的献血对象中,选择献血间隔期和年龄符合规定的献血者。这部分对象由于近期参与过献血活动,表明其在近期有献血意愿,是合理的招募目标,因此献血时间是一个对于是否参与献血的有效特征。同时,根据血液中心以往招募献血的经验,发现职业与受教育程度对于一个人员是否来献血也是十分重要的。表1显示了某个献血人员的一次献血记录,该表包含了个人的一些基本特征,如年龄、性别、居住情况、是否有献血反应等,这些基本信息也存在影响个人献血的情况。专利技术人经过研究后发现,献血人员的献血意愿不仅取决于一次献血,常常与其多次献血的记录有关,如献血次数、总献血量、献血次数、献血频率等。根据经验与实验研究相结合,设计出包含年龄、性别、血型、最近献血量、总献血量、献血次数、献血间隔、献血频率、血液检测是否合格、教育程度、居住状态、职业、献血反应13项的特征库,其中献血频率采用公式(1)进行计算。表1某献血人员的献血记录献血记录往往存在一定的缺失值,比本文档来自技高网...
【技术保护点】
1.一种基于机器学习的献血人员识别与招募方法,其特征在于,包括如下步骤:/n(1)建立献血人员特征库,采集每位献血人员历年献血情况,根据其献血情况设计并计算其特征;/n(2)构建xgboost模型,其中模型输入为所述献血人员特征,模型输出为献血人员是否为有效献血人员的期望输出;/n(3)利用过往短信招募得到有/无效献血人员的数据,对所述xgboost模型进行训练;;/n(4)对于符合条件的献血人员,根据其特征数据,利用所述xgboost模型做出有效献血人员排序,并推荐献血人员。/n
【技术特征摘要】
1.一种基于机器学习的献血人员识别与招募方法,其特征在于,包括如下步骤:
(1)建立献血人员特征库,采集每位献血人员历年献血情况,根据其献血情况设计并计算其特征;
(2)构建xgboost模型,其中模型输入为所述献血人员特征,模型输出为献血人员是否为有效献血人员的期望输出;
(3)利用过往短信招募得到有/无效献血人员的数据,对所述xgboost模型进行训练;;
(4)对于符合条件的献血人员,根据其特征数据,利用所述xgboost模型做出有效献血人员排序,并推荐献血人员。
2.如权利要求1所述基于机器学习的献血人员识别与招募方法,其特征在于:
所述步骤(1)中,设计并计算的特征包括年龄、性别、血型、最近献血量、总献血量、献血次数、献血间隔、献血频率、血液检测是否合格、教育程度、居住状态、职业和献血反应,其中献血频率的计算采用公式(1):
3.如权利要求1所述基于机器学习的献血人员识别与招募方法,其特征在于:一些属性值存在缺失情况时,采用缺省值进行补足。
4.如权利要求1所述基于机器学习的献血人员识别与招募方法,其特征在于:
所述步骤(2)中,所述xgboost模型的基本模型参数,以树模型作为基分类器,设置迭代次数为500,树的最大深度为12。
5.如权利要求1所述基于机器学习的献血人员识别与招募方法,其特征在于:...
【专利技术属性】
技术研发人员:梁文飚,薛晖,朱毅,孙新凯,李正刚,郭铭华,刁仁华,
申请(专利权)人:江苏省血液中心,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。