养老机构的数据处理方法技术

技术编号:39847566 阅读:6 留言:0更新日期:2023-12-29 16:45
本申请实施例提供一种养老机构的数据处理方法

【技术实现步骤摘要】
养老机构的数据处理方法、装置、设备及存储介质


[0001]本申请涉及数据分析领域,尤其涉及一种养老机构的数据处理方法

装置

设备及存储介质


技术介绍

[0002]随着老龄人口占比不断增大,新增了大量为老年人提供休息

康复

护理等服务的养老机构,并积累了大量养老机构对应的数据

[0003]银行的分行为了给养老机构提供全面

优质的个性化服务,将其转化为行内用户,在数据分析这一领域,需要对养老机构对应的数据进行高效处理,提高服务效率

然而,相关技术对于如何高效处理养老机构对应的数据尚无有效的方案


技术实现思路

[0004]本申请实施例提供一种养老机构的数据处理方法

装置

设备及存储介质,可以高效处理养老机构对应的数据

[0005]第一方面,本申请提供一种养老机构的数据处理方法,包括:
[0006]获取待处理的至少一个养老机构的特征数据;
[0007]针对每个养老机构,将所述养老机构的特征数据输入预先获取的预测模型进行分析处理,得到所述养老机构对应的价值属性值;其中,所述价值属性值用于指示所述养老机构是否为高价值用户,所述预测模型是预先根据与用户价值相关的多个特征数据训练的用于计算养老机构的价值属性的模型;
[0008]根据每个养老机构对应的价值属性值,获取并输出每个分行对应的高价值用户清单

[0009]在一种可能的实施方式中,所述根据每个养老机构对应的价值属性值,获取并输出每个分行对应的高价值用户清单,包括:
[0010]根据每个养老机构对应的价值属性值,以及每个养老机构的特征数据中的所属分行信息,获取出每个分行对应的属于高价值用户的至少一个目标养老机构;
[0011]针对每个分行,根据所述分行对应的至少一个目标养老机构,生成所述分行对应的高价值用户清单;
[0012]将所述高价值用户清单发送至所述分行的管理设备

[0013]在一种可能的实施方式中,所述针对每个养老机构,将所述养老机构的特征数据,分别输入预先获取的预测模型进行分析处理,得到所述养老机构对应的价值属性值之前,所述方法还包括:
[0014]根据每个养老机构的内部数据,每个养老机构对应的政务数据以及金融数据,获取待处理数据集合,所述待处理数据集合中包括多个养老机构的多个特征数据;
[0015]对所述待处理数据集合中的缺失值和异常值进行清洗处理,得到第一数据集合;
[0016]对所述第一数据集合中养老机构的特征进行扩充,并对扩充后的特征进行筛选,
筛选出与养老机构的价值属性相关的多个特征,组成第二数据集合,所述第二数据集合中包括多个养老机构的多个与价值属性相关的特征数据;
[0017]根据所述第二数据集合对预先配置的初始模型进行模型训练和测试,得到所述预测模型

[0018]在一种可能的实施方式中,所述对所述待处理数据集合中的缺失值和异常值进行清洗处理,得到第一数据集合,包括:
[0019]计算所述待处理数据集合中的每个特征的缺失率;
[0020]将所述待处理数据集合中缺失率大于预设缺失率的特征进行剔除,以及对所述待处理数据集合中,缺失率小于所述预设缺失率的数值类的特征的缺失数据进行填充,并对缺失率小于所述预设缺失率的非数值类的特征采用预设标识进行填充,得到第一中间数据集合;其中,所述预设标识用于指示数据缺失;
[0021]针对所述第一中间数据集合中的每个特征,进行异常值检测,并将存在异常值且异常值产生的原因不是实际业务产生的异常值进行删除,得到所述第一数据集合

[0022]在一种可能的实施方式中,所述对所述第一数据集合中养老机构的特征进行扩充,并对扩充后的特征进行筛选,筛选出与养老机构的价值属性相关的多个特征,组成第二数据集合,包括:
[0023]针对所述第一数据集合中的每个养老机构,扩充预设特征,得到第二中间数据集合,所述预设特征包括以下至少一个:机构申请入驻渠道

是否为民政

机构有效性

统一社会信用代码规范性

企业类型

是否上线机构等级评定

是否上线资金监管

是否上线社区食堂;
[0024]针对所述第二中间数据集合每个特征,采用
IV
值算法,计算出每个特征的
IV
值,所述
IV
值用于指示特征与价值属性之间的关联度;
[0025]将所述第二中间数据集合中,
IV
值大于预设值的特征筛选出来组成所述第二数据集合

[0026]在一种可能的实施方式中,所述根据所述第二数据集合对预先配置的初始模型进行模型训练和测试,得到所述预测模型,包括:
[0027]将所述第二数据集合按照预设比例,分成训练集和测试集;
[0028]根据所述训练集对所述初始模型进行多次训练,并计算每次训练后的模型的
ROC
值;
[0029]根据每次训练后的模型的
ROC
值,选择
ROC
值大于预设值且最高的目标模型;
[0030]根据所述测试集对所述目标模型进行测试,得到所述预测模型

[0031]在一种可能的实施方式中,所述初始模型为
XGboost
模型

[0032]第二方面,本申请提供一种数据处理装置,包括:
[0033]获取模块,用于获取待处理的至少一个养老机构的特征数据;
[0034]第一处理模块,用于针对每个养老机构,将所述养老机构的特征数据输入预先获取的预测模型进行分析处理,得到所述养老机构对应的价值属性值;其中,所述价值属性值用于指示所述养老机构是否为高价值用户,所述预测模型是预先根据与用户价值相关的多个特征数据训练的用于计算养老机构的价值属性的模型;
[0035]第二处理模块,用于根据每个养老机构对应的价值属性值,获取并输出每个分行
对应的高价值用户清单

[0036]在一种可能的实施方式中,所述第二处理模块具体用于:
[0037]根据每个养老机构对应的价值属性值,以及每个养老机构的特征数据中的所属分行信息,获取出每个分行对应的属于高价值用户的至少一个目标养老机构;
[0038]针对每个分行,根据所述分行对应的至少一个目标养老机构,生成所述分行对应的高价值用户清单;
[0039]将所述高价值用户清单发送至所述分行的管理设备

[0040]在一种可能的实施方式中,所述装置还包括第三处理模块,所述第三处理模块用于:...

【技术保护点】

【技术特征摘要】
1.
一种养老机构的数据处理方法,其特征在于,包括:获取待处理的至少一个养老机构的特征数据;针对每个养老机构,将所述养老机构的特征数据输入预先获取的预测模型进行分析处理,得到所述养老机构对应的价值属性值;其中,所述价值属性值用于指示所述养老机构是否为高价值用户,所述预测模型是预先根据与用户价值相关的多个特征数据训练的用于计算养老机构的价值属性的模型;根据每个养老机构对应的价值属性值,获取并输出每个分行对应的高价值用户清单
。2.
根据权利要求1所述的方法,其特征在于,所述根据每个养老机构对应的价值属性值,获取并输出每个分行对应的高价值用户清单,包括:根据每个养老机构对应的价值属性值,以及每个养老机构的特征数据中的所属分行信息,获取出每个分行对应的属于高价值用户的至少一个目标养老机构;针对每个分行,根据所述分行对应的至少一个目标养老机构,生成所述分行对应的高价值用户清单;将所述高价值用户清单发送至所述分行的管理设备
。3.
根据权利要求1或2所述的方法,其特征在于,所述针对每个养老机构,将所述养老机构的特征数据,分别输入预先获取的预测模型进行分析处理,得到所述养老机构对应的价值属性值之前,所述方法还包括:根据每个养老机构的内部数据,每个养老机构对应的政务数据以及金融数据,获取待处理数据集合,所述待处理数据集合中包括多个养老机构的多个特征数据;对所述待处理数据集合中的缺失值和异常值进行清洗处理,得到第一数据集合;对所述第一数据集合中养老机构的特征进行扩充,并对扩充后的特征进行筛选,筛选出与养老机构的价值属性相关的多个特征,组成第二数据集合,所述第二数据集合中包括多个养老机构的多个与价值属性相关的特征数据;根据所述第二数据集合对预先配置的初始模型进行模型训练和测试,得到所述预测模型
。4.
根据权利要求3所述的方法,其特征在于,所述对所述待处理数据集合中的缺失值和异常值进行清洗处理,得到第一数据集合,包括:计算所述待处理数据集合中的每个特征的缺失率;将所述待处理数据集合中缺失率大于预设缺失率的特征进行剔除,以及对所述待处理数据集合中,缺失率小于所述预设缺失率的数值类的特征的缺失数据进行填充,并对缺失率小于所述预设缺失率的非数值类的特征采用预设标识进行填充,得到第一中间数据集合;其中,所述预设标识用于指示数据缺失;针对所述第一中间数据集合中的每个特征,进行异常值检测,并将存在异常值且异常值产生的原因不是实际业务产生的异常值进行删除,得到所述第一数据集合
。5.
根据权利要求3或4所述的方法,其特征在于,所述对所述第一数据集合中养老机构的特征进行扩充,并对扩充后的特征进行筛选,筛选出与养老机构的价值属性相关的多个特征,组成第二数据集合,包括:针对所述第一数据集合中的每个养老机构,扩充预设特征,...

【专利技术属性】
技术研发人员:王珏麟陈勇郑万霖
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1