医疗项目识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:27581810 阅读:27 留言:0更新日期:2021-03-09 22:37
本发明专利技术涉及机器学习,提供一种医疗项目识别方法、装置、设备及介质。本发明专利技术通过先提取医疗项目费用的平均值与标准差作为特征数据,再将其分为免测与目标特征数据,最后通过孤立森林模型基于整体的特征数据上对目标特征数据进行异常识别,使得模型无需对所有特征数据的疏离程度进行评定,减小了模型的计算量,且相比于传统的完全根据经验筛选重点医疗项目的方式,本发明专利技术极大程度上节省了人力资源;相比于基于其他降维算法或特征选择算法的医疗项目识别方式,本发明专利技术利用孤立森林算法为全自动算法,无需进行调参,节省了大量算力,因此多方位提升了现有医疗项目重点识别的识别效果。此外,本发明专利技术还涉及区块链技术,上述特征数据可存储于区块链中。存储于区块链中。存储于区块链中。

【技术实现步骤摘要】
医疗项目识别方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及机器学习
,尤其涉及一种医疗项目识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]在真实世界数据集中,医疗项目的数量非常之多,即使在治疗方案相对清晰的病种中也能达到上千种之多,在医保控费、医疗模式识别等多种应用中,管理者通常希望能够筛选出部分重点医疗项目进行着重分析和研究。然而此步骤目前至少面临以下几点困难:多数决策者无法掌握所有病种的重点医疗项目;纯人工识别耗时非常多;现有的机器学习降维方法运算时间长;现有的降维方法可解释性差。故,上述种种情况均反映出现有的医疗项目重点识别方式的识别效果不佳的问题。

技术实现思路

[0003]本专利技术的主要目的在于提供一种医疗项目识别方法、设备及计算机可读存储介质,旨在解决现有的医疗项目重点识别方式的识别效果不佳的技术问题。
[0004]为实现上述目的,本专利技术提供一种医疗项目识别方法,所述医疗项目识别方法包括:
[0005]获取医疗费用明细数据,确定所述医疗费用明细数据中包含的若干种类医疗项目,并根据所述医疗费用明细数据得到每一种类所述医疗项目的医疗费用的平均值与标准差作为特征数据;
[0006]汇总每一种类所述医疗项目的特征数据为特征数据集,将所述特征数据集划分为目标特征数据子集与无需利用预设孤立森林模型进行疏离程度分析的免测特征数据子集,以作为所述孤立森林模型的输入;
[0007]基于所述孤立森林模型与所述免测特征数据子集,针对所述目标特征数据子集进行异常识别,并将识别出的异常特征数据对应的医疗项目作为重点医疗项目。
[0008]可选地,所述基于所述孤立森林模型与所述免测特征数据子集,针对所述目标特征数据子集进行异常识别,并将识别出的异常特征数据对应的医疗项目作为重点医疗项目的步骤包括:
[0009]联合所述免测特征数据子集与所述目标特征数据子集构建特征平面,并基于所述孤立森林模型针对所述目标特征数据子集中的目标特征数据进行孤立切割,得到所述目标特征数据的疏离程度表征值;
[0010]判断所述疏离程度表征值是否大于预设疏离程度阈值;
[0011]若是,则将大于预设疏离程度阈值的疏离程度表征值所对应的目标特征数据作为异常特征数据,并将所述异常特征数据对应的医疗项目标记为重点医疗项目。
[0012]可选地,所述将所述特征数据集划分为免测特征数据子集与目标特征数据子集的步骤包括:
[0013]基于所述特征数据集的平均值与标准差属性建立特征坐标系,并将所述特征数据集中的每一特征数据对应在所述特征坐标系上;
[0014]在所述特征坐标系中确定出一特征区域;
[0015]将位于所述特征区域内的特征数据标记为免测特征数据,并将所述特征坐标系中位于所述特征区域之外的特征数据标记为目标特征数据,以生成所述免测特征数据子集与所述目标特征数据子集。
[0016]可选地,所述在所述特征坐标系中确定出一特征区域的步骤包括:
[0017]接收用户发送的特征区域指定指令,根据所述特征区域指定指令获取所述特征区域在所述特征坐标系上的边界坐标,以基于所述所述边界坐标确定所述特征区域。
[0018]可选地,所述将识别出的异常特征数据对应的医疗项目作为重点医疗项目的步骤之后,还包括:
[0019]获取所述异常特征数据对应在所述特征坐标系上的位置信息,并根据所述位置信息确定出目标平均值阈值与目标标准差阈值;
[0020]确定所述异常特征数据中高于所述目标平均值阈值且高于所述目标标准差阈值的第一特征数据,高于所述目标平均值阈值但低于所述目标标准差阈值的第二特征数据,以及低于所述目标平均值阈值但高于所述目标标准差阈值的第三特征数据;
[0021]将所述第一、第二与第三特征数据所对应的重点医疗项目分别标记为多样重点医疗项目、通用重点医疗项目与个性化重点医疗项目,其中,所述第一、第二与第三特征数据存储于区块链中。
[0022]可选地,所述获取医疗费用明细数据,确定所述医疗费用明细数据中包含的若干种类医疗项目,并根据所述医疗费用明细数据得到每一种类所述医疗项目的医疗费用的平均值与标准差作为特征数据的步骤包括:
[0023]获取医疗费用明细数据,确定所述医疗费用明细数据中包含的多种类的医疗项目;
[0024]使用预设的平均值计算公式与标准差计算公式分别对所述医疗费用明细数据中每一种类所述医疗项目的医疗费用进行平均值与标准差计算,得到所述医疗费用的平均值与标准差,以作为每一种类所述医疗项目的特征数据。
[0025]可选地,所述获取医疗费用明细数据的步骤之前,还包括:
[0026]获取初始医疗费用明细数据,对所述初始医疗费用明细数据进行数据清洗,以将数据清洗后的初始医疗费用明细数据作为所述医疗费用明细数据。
[0027]此外,为实现上述目的,本专利技术还提供一种医疗项目识别装置,所述医疗项目识别装置包括:
[0028]特征获取模块,用于获取医疗费用明细数据,确定所述医疗费用明细数据中包含的若干种类医疗项目,并根据所述医疗费用明细数据得到每一种类所述医疗项目的医疗费用的平均值与标准差作为特征数据;
[0029]模型输入模块,用于汇总每一种类所述医疗项目的特征数据为特征数据集,将所述特征数据集划分为目标特征数据子集与无需利用预设孤立森林模型进行疏离程度分析的免测特征数据子集,以作为所述孤立森林模型的输入;
[0030]项目识别模块,用于基于所述孤立森林模型与所述免测特征数据子集,针对所述
目标特征数据子集进行异常识别,并将识别出的异常特征数据对应的医疗项目作为重点医疗项目。
[0031]可选地,所述项目识别模块包括:
[0032]梳理表征获取单元,用于联合所述免测特征数据子集与所述目标特征数据子集构建特征平面,并基于所述孤立森林模型针对所述目标特征数据子集中的目标特征数据进行孤立切割,得到所述目标特征数据的疏离程度表征值;
[0033]疏离程度判断单元,用于判断所述疏离程度表征值是否大于预设疏离程度阈值;
[0034]重点项目标记单元,用于若是,则将大于预设疏离程度阈值的疏离程度表征值所对应的目标特征数据作为异常特征数据,并将所述异常特征数据对应的医疗项目标记为重点医疗项目。
[0035]可选地,所述模型输入模块包括:
[0036]数据对应单元,用于基于所述特征数据集的平均值与标准差属性建立特征坐标系,并将所述特征数据集中的每一特征数据对应在所述特征坐标系上;
[0037]区域确定单元,用于在所述特征坐标系中确定出一特征区域;
[0038]子集生成单元,用于将位于所述特征区域内的特征数据标记为免测特征数据,并将所述特征坐标系中位于所述特征区域之外的特征数据标记为目标特征数据,以生成所述免测特征数据子集与所述目标特征数据子集。
[0039]可选地,所述区域确定单元还用于:...

【技术保护点】

【技术特征摘要】
1.一种医疗项目识别方法,其特征在于,所述医疗项目识别方法包括:获取医疗费用明细数据,确定所述医疗费用明细数据中包含的若干种类医疗项目,并根据所述医疗费用明细数据得到每一种类所述医疗项目的医疗费用的平均值与标准差作为特征数据;汇总每一种类所述医疗项目的特征数据为特征数据集,将所述特征数据集划分为目标特征数据子集与无需利用预设孤立森林模型进行疏离程度分析的免测特征数据子集,以作为所述孤立森林模型的输入;基于所述孤立森林模型与所述免测特征数据子集,针对所述目标特征数据子集进行异常识别,并将识别出的异常特征数据对应的医疗项目作为重点医疗项目。2.如权利要求1所述的医疗项目识别方法,其特征在于,所述基于所述孤立森林模型与所述免测特征数据子集,针对所述目标特征数据子集进行异常识别,并将识别出的异常特征数据对应的医疗项目作为重点医疗项目的步骤包括:联合所述免测特征数据子集与所述目标特征数据子集构建特征平面,并基于所述孤立森林模型针对所述目标特征数据子集中的目标特征数据进行孤立切割,得到所述目标特征数据的疏离程度表征值;判断所述疏离程度表征值是否大于预设疏离程度阈值;若是,则将大于预设疏离程度阈值的疏离程度表征值所对应的目标特征数据作为异常特征数据,并将所述异常特征数据对应的医疗项目标记为重点医疗项目。3.如权利要求1所述的医疗项目识别方法,其特征在于,所述将所述特征数据集划分为免测特征数据子集与目标特征数据子集的步骤包括:基于所述特征数据集的平均值与标准差属性建立特征坐标系,并将所述特征数据集中的每一特征数据对应在所述特征坐标系上;在所述特征坐标系中确定出一特征区域;将位于所述特征区域内的特征数据标记为免测特征数据,并将所述特征坐标系中位于所述特征区域之外的特征数据标记为目标特征数据,以生成所述免测特征数据子集与所述目标特征数据子集。4.如权利要求3所述的医疗项目识别方法,其特征在于,所述在所述特征坐标系中确定出一特征区域的步骤包括:接收用户发送的特征区域指定指令,根据所述特征区域指定指令获取所述特征区域在所述特征坐标系上的边界坐标,以基于所述所述边界坐标确定所述特征区域。5.如权利要求3所述的医疗项目识别方法,其特征在于,所述将识别出的异常特征数据对应的医疗项目作为重点医疗项目的步骤之后,还包括:获取所述异常特征数据对应在所述特征坐标系上的位置信息,并根据所述位置信息确定出目标平均值阈值与目标标准差阈值;确定所述异常特征数据中高于所述目标平均值阈值且高于所述目标标准差阈...

【专利技术属性】
技术研发人员:卞思雯
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1