医疗健康案例知识匹配方法和系统技术方案

技术编号：23673513 阅读：33 留言：0更新日期：2020-04-04 18:43

本发明专利技术提供一种医疗健康案例知识匹配方法和系统，涉及数据处理技术领域。本发明专利技术首先获取医疗健康案例数据和外部标注性特征信息，并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理；对经过预处理后的医疗健康案例数据进行特征选择处理，得到关键特征；再基于遗传算法获取关键特征的特征权重；基于所述特征权重和Pearson参数r法获取初步案件相似度；最后基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度，基于最终案例相似度得到相似医疗健康案例。本发明专利技术引入外部标注性特征信息，能有效的降低质量差、水平低的信息对检索结果的影响，在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。

Knowledge matching method and system of medical and health cases

全部详细技术资料下载

【技术实现步骤摘要】
医疗健康案例知识匹配方法和系统
本专利技术涉及数据处理
，具体涉及一种医疗健康案例知识匹配方法和系统。
技术介绍
随着医疗信息化的进一步推进，医疗信息资源的规模也随之庞大起来，这为医疗信息资源管理的发展提出来挑战，也为辅助决策专家系统的性能改进提供了思路，例如基于案例的推理。以CBR技术为核心的案例推理系统能够有效地实现人类推理思维的模拟，成为医疗智能决策支持系统的新的发展方向。目前常见的CBR技术为基于集成角度与距离的相似案例检索方法改进的案例推理流程。该技术方案是在医疗信息化的环境下，将角度与距离的相似度检索方法集成为一个新的相似度检索方法，并通过收集的实验数据，对该方法的实验结果与仅基于角度或距离的相似度检索方法的实验结果进行对比，验证该技术方案所用的相似度检索方法更加有效，最后提出这种基于集成角度与距离的相似案例检索方法的新的案例推理流程，利用这种改进的案例推理流程来检索相似的案例。然而，大数据时代的来临，促使医疗类信息资源的数量出现爆发式增长，在这些大量的医疗数据中总会有利用率低，质量差，水平低下的医疗诊断信息。然而这些质量差、水平低的信息可能误导医生进行医疗诊断，损害诊断决策的正确性，导致案例检索的准确度低。
技术实现思路
(一)解决的技术问题针对现有技术的不足，本专利技术提供了一种医疗健康案例知识匹配方法和系统，解决了现有的案例检索的准确度低的技术问题。(二)技术方案为实现以上目的，本专利技术通过以下技术方案予以实现：本专利技术提...

【技术保护点】
1.一种医疗健康案例知识匹配方法，其特征在于，所述方法由计算机执行，包括以下步骤：/nS1、获取医疗健康案例数据和外部标注性特征信息，并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理；/nS2、对经过预处理后的医疗健康案例数据进行特征选择处理，得到关键特征；/nS3、基于遗传算法获取所述关键特征的特征权重；/nS4、基于所述特征权重和Pearson参数r法获取初步案件相似度；/nS5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度，基于最终案例相似度得到相似医疗健康案例。/n

【技术特征摘要】
1.一种医疗健康案例知识匹配方法，其特征在于，所述方法由计算机执行，包括以下步骤：
S1、获取医疗健康案例数据和外部标注性特征信息，并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理；
S2、对经过预处理后的医疗健康案例数据进行特征选择处理，得到关键特征；
S3、基于遗传算法获取所述关键特征的特征权重；
S4、基于所述特征权重和Pearson参数r法获取初步案件相似度；
S5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度，基于最终案例相似度得到相似医疗健康案例。

2.如权利要求1所述的医疗健康案例知识匹配方法，其特征在于，所述预处理包括标准化处理，所述标准化处理包括0-1标准化方法和最大最小值0-1标准化方法。

3.如权利要求1所述的医疗健康案例知识匹配方法，其特征在于，在S2中，所述特征选择处理的方法包括：
计算每个特征的F-Score值，并根据F-Score值进行降序排序；
确定一个被选特征子集，利用SVM的分类正确率对当前特征集合进行评估；
迭代，每一次从未被选择的特征中选取一个F-Score值最大的特征加入上一阶段的待选集合中，再利用SVM对当前集合进行评价；
迭代完所有特征之后，根据SVM的分类准确度获取关键特征。

4.如权利要求3所述的医疗健康案例知识匹配方法，其特征在于，所述F-Score值计算公式包括：

其中：
n+为正类样本的个数，n-为负类样本的个数，为第j个特征在全部医疗健康案例数据样本上的特征平均值；为在正类样本中的特征平均值，为在负类样本中的特征平均值；代表的是第i个正类样本中第j个特征的特征值，为第i个负类样本...

【专利技术属性】
技术研发人员：顾东晓，赵旺，梁昌勇，王晓玉，杨雪洁，苏凯翔，陆文星，赵树平，欧阳纯萍，刘永彬，李晓玥，鲍超，丁庆秀，解玉光，苗夏雨，周晨，张波达，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人