一种用于识别病历的疾病类型的模型的构建方法及应用技术

技术编号：24290688 阅读：47 留言：0更新日期：2020-05-26 20:31

本发明专利技术实施例公开了一种用于对病历的疾病类型进行识别的模型的构建方法及应用，所述方法包括：A、获取指定数量患者的各类病历信息；B、对所述各类病历信息分别进行特征提取；C、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征；D、将所述每位患者的整体的病历特征输入至Soft‑max分类器中进行分类训练，以获取用于对病历进行病历类型识别的神经网络模型。由上，本申请的方法构建的模型可以准确快速有效地实现对病历的疾病类型的识别。

The method and application of a model for identifying disease types in medical records

全部详细技术资料下载

【技术实现步骤摘要】
一种用于识别病历的疾病类型的模型的构建方法及应用
本专利技术涉及纳米材料领域，具体涉及一种用于识别病历的疾病类型的模型的构建方法及应用。
技术介绍
结构化数据是指存储在数据库里，可以用二维表结构来逻辑表达实现的数据；反之，非结构化数据是指不方便用数据库二维逻辑表来表现的数据，包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。其中，结构化数据内容遵循固定的格式，比较容易查询和处理。非结构化数据，由于占用内存交大和大小的不一致性，以及文件的性质导致对其存储和处理都不如结构化数据方便。医疗行业信息化程度高，但也存在大量非结构化数据，严重影响临床医疗数据的数据处理和使用，导致医疗数据的利用率并不高，目前医疗数据的结构化势在必行，但是由于不同的疾病存在着明显区别，所以病历的结构化方式也有很大差异，采用通用结构化方式就会造成大量的结构冗余，不能满足不同疾病的个性化特点。因此，对病历的疾病类型的识别，对整份病历的结构化起着至关重要的作用。目前，对病历疾病类型识别的方法通常分为两种：1、由专业的医学人员去人工读病历，作出疾病类型的判断；2、基于专业的医学知识，制定一些用于疾病确认的强规则来作出对疾病类型的判断。其中，前者需要花费大量的人力，并且产能完全无法匹配海量的病历数据；后者也需要人工花费时间去设计，评估，同时由于病历描述的多样性，规则的泛化能力很弱，维护起来非常困难。因此，目前亟需一种用于对病历进行疾病类型识别的系统及应用，以实现准确快速有效地对病历的疾病类型的识...

【技术保护点】
1.一种用于对病历的疾病类型进行识别的模型的构建方法，其特征在于，包括：/nA、获取指定数量患者的各类病历信息；/nB、对所述各类病历信息分别进行特征提取；/nC、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征；/nD、将所述每位患者的整体的病历特征输入至Soft-max分类器中进行分类训练，以获取用于对病历进行病历类型识别的神经网络模型。/n

【技术特征摘要】
1.一种用于对病历的疾病类型进行识别的模型的构建方法，其特征在于，包括：
A、获取指定数量患者的各类病历信息；
B、对所述各类病历信息分别进行特征提取；
C、将提取的各类病历信息的特征进行连接以获取每位患者的整体的病历特征；
D、将所述每位患者的整体的病历特征输入至Soft-max分类器中进行分类训练，以获取用于对病历进行病历类型识别的神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述步骤A，包括：
A1、获取指定数量患者的病历；
A2、对所述病历中的各类病历信息分别进行定位；
A3、对定位后的各类病历信息分别进行原始文本的提取；
A4、对提取后的各类病历信息分别进行预处理。

3.根据权利要求2所述的方法，其特征在于，所述病历信息的类型至少包括但不限于以下其一：
病理描述、病理诊断、出院诊断、出院小结。

4.根据权利要求1所述的方法，其特征在于，所述步骤B，包括：
B1、对各类病历信息的原始文本分别进行向量化处理，将所述原始文本转换成one-hot独热特征向量；
B2、将所述one-hot独热特征向量，通过一指定大小的矩阵映射转换为长度为所述原始文本长度的矩阵；
B3、分别采用不同窗口大小的卷积核将所述长度为原始文本长度的矩阵处理生成一维卷积向量；
B4...

【专利技术属性】
技术研发人员：罗立刚，刘晓华，罗翔凤，赵丽艳，康悦，
申请(专利权)人：零氪医疗智能科技广州有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人