地区疾病的监控方法及装置、存储介质制造方法及图纸

技术编号:22724343 阅读:22 留言:0更新日期:2019-12-04 06:22
本申请提供了一种地区疾病的监控方法,包括:获取线上问诊的多份诊疗数据;其中,每份所述诊疗数据包括诊疗对话记录和患者的地址信息;分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇;分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称;其中,所述诊断模型基于诊断数据的症状词汇和疾病名称的映射关系构建得到;基于多份所述诊疗数据对应的疾病名称,统计得到所述地址信息的所属地区的每种疾病的患病人数;其中,所述疾病为所述诊疗数据对应的疾病名称。基于线上问诊的诊疗数据,实现对地区疾病的快速统计,从而及时得到地区疾病的情况,实现对地区疾病的有效监控。

Monitoring methods, devices and storage media of regional diseases

The application provides a monitoring method for regional diseases, including: obtaining multiple diagnosis and treatment data of online consultation; wherein, each diagnosis and treatment data includes diagnosis and treatment dialogue record and patient address information; extracting symptom vocabulary from each diagnosis and treatment dialogue record of diagnosis and treatment data; inputting the symptom vocabulary of each diagnosis and treatment data into the pre built In the diagnosis model, the disease name corresponding to the diagnosis and treatment data is inferred from the diagnosis model; wherein, the diagnosis model is constructed based on the mapping relationship between the symptom vocabulary and the disease name of the diagnosis data; based on the disease name corresponding to multiple diagnosis and treatment data, the number of patients of each disease in the region where the address information belongs is calculated; wherein, the disease Is the disease name corresponding to the diagnosis and treatment data. Based on the diagnosis and treatment data of online consultation, the rapid statistics of regional diseases can be realized, so as to get the situation of regional diseases in time and realize the effective monitoring of regional diseases.

【技术实现步骤摘要】
地区疾病的监控方法及装置、存储介质
本专利技术涉及疾病监控
,特别涉及一种地区疾病的监控方法及装置、存储介质。
技术介绍
通常,每个地区的医疗卫生主管部门,都会对所管辖的地区进行疾病监控,以能及时的进行预警,提醒居民注意防护,防止疾病的大面积地爆发。具体的,疾病的监控方法,一般是收集管辖地区的各个下属医院的患者诊疗信息,再进行统计,从而得到管辖地区在不同时间段、不同的年龄段内,各种疾病的患病人数。通过监控各种疾病的患病人数,实现对管辖地区的级别的监控。但是,由于医疗卫生主管部门收集所管辖的各个下属医院的患者诊疗情况,在进行统计的整个过程涉及多部门之间的协调配合,所以整个统计的过程耗时通常都比较长,所得到统计结果的时效性也因此较差。所以,以通过现有的对地区疾病的监控方法,所得到的统计结果的准确性较差,并不能很好地对地区的疾病进行监控。
技术实现思路
基于上述现有技术的不足,本专利技术提供了一种地区疾病的监控方法及装置、存储介质,现有技术中地区疾病的统计方式不够及时,从而造成统计结果不够准确,无法对地区疾病进行准确地监控的问题。为了实现上述目的,本专利技术提供了以下技术方案:本专利技术第一方面提供了一种地区疾病的监控方法,其特征在于,包括:获取线上问诊的多份诊疗数据;其中,每份所述诊疗数据包括诊疗对话记录和患者的地址信息;分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇;分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称;其中,所述诊断模型基于诊断数据的症状词汇和疾病名称的映射关系构建得到;基于多份所述诊疗数据对应的疾病名称,统计得到所述地址信息的所属地区的每种疾病的患病人数;其中,所述疾病为所述诊疗数据对应的疾病名称。可选地,在上述的方法中,所述诊断模型的构建方法,包括:获取线上问诊的多份诊疗数据;其中,所述诊疗数据包括诊疗结果和诊疗对话记录,所述诊疗结果包括疾病名称;过滤掉所述多份诊疗数据中的无效诊疗数据,得到有效诊疗数据;其中,所述无效诊疗数据包括诊疗数据的信息不完整、诊疗对话记录内容少于预设数量以及评分低于预设分值的诊疗数据;对所述每份有效诊疗数据中的诊疗对话记录进行分词,得到分词结果;对所述每份有效诊疗数据的所述分词结果进行停用词去除操作,得到多个症状词汇;构建得到所述每份有效诊疗数据的每个所述症状词汇的词向量;利用聚类算法对所述多份诊疗数据的所有所述症状词汇的词向量进行聚类,得到所述症状词汇的聚类结果;为所述聚类结果中的每类症状词汇,标注对应的疾病名称,得到症状词汇与疾病名称的映射关系。可选地,在上述的方法中,所述分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇,包括:对每份所述诊疗数据的诊疗对话记录进行分词,得到分词结果;对所述每份诊疗数据的所述分词结果进行停用词去除操作,得到多个症状词汇;计算得到所述每份诊疗数据的每个所述症状词汇在所述诊疗数据的诊疗对话记录中出现的词频,以及每个所述症状词汇在获取的所述多份诊疗数据中的逆向文件频率;计算得到每份所述诊疗数据中的每个所述症状词汇的词频与逆向文件频率的乘积;根据所述乘积的数值由大到小的顺序,从每份所述诊疗数据的所述症状词汇中选择出预设数量的症状词汇。可选地,在上述的方法中,所述分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称,包括:构建得到所述每份诊疗数据的每一个所述症状词汇的词向量;将每份所述诊疗数据的所有症状词汇的词向量全部输入所述诊断模型,由所述诊断模型分别计算每个疾病名称所映射的所有症状词汇的词向量与全部输入的所述词向量的余弦值,并将所述余弦值的最小值所对应的疾病名称,确定为所述诊疗数据对应的疾病名称。可选地,在上述的方法中,所述诊疗数据还包括患者的个人信息和诊疗时间,所述分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称之后,还包括:分别为每份所述诊疗数据,配置唯一的用户标识,并将按照预设格式存储所述诊疗数据的疾病信息;其中,所述疾病信息包括所述用户标识、所述诊疗数据对应的疾病名称以及所述诊疗数据的症状词汇、所述地址信息、患者的个人信息和诊疗时间;所述患者的个人信息包括患者的性别和年龄;基于多份所述疾病数据,以每N岁为一个年龄段、每M小时为一个时间段,分别统计每个所述地址信息所属的地区的每种疾病,在每个时间段和每个年龄段内,男性的患病人数和女性的患病人数,得到低维统计结果。可选地,在上述的方法中,所述基于多份所述诊疗数据对应的疾病名称,对所述地址信息的所属地区的每种疾病的患病人数进行统计,包括:基于所述低维统计结果,以预设的统计规则所规定的每个年龄段的大小和每个时间段的大小,分别统计每个所述地址信息所属的地区的每种疾病,在每个时间段和每个年龄段内,男性的患病人数和女性的患病人数,得到统计结果;其中,统计规则规定的所述每个年龄段的大小为N的正整数倍,所述每个时间段的大小为M的正整数倍。本专利技术第二方面提供了一种地区疾病的监控装置,包括:第一获取单元,用于获取线上问诊的多份诊疗数据;其中,每份所述诊疗数据包括诊疗对话记录和患者的地址信息;提取单元,用于分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇;推断单元,用于分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称;其中,所述诊断模型基于诊断数据的症状词汇和疾病名称的映射关系构建得到;统计单元,用于基于多份所述诊疗数据对应的疾病名称,统计得到所述地址信息的所属地区的每种疾病的患病人数;其中,所述疾病为所述诊疗数据对应的疾病名称。可选地,在上述的装置中,还包括构建单元;所述构建单元,包括:第二获取单元,用于获取线上问诊的多份诊疗数据;其中,所述诊疗数据包括诊疗结果和诊疗对话记录,所述诊疗结果包括疾病名称;过滤单元,用于过滤掉所述多份诊疗数据中的无效诊疗数据,得到有效诊疗数据;其中,所述无效诊疗数据包括诊疗数据的信息不完整、诊疗对话记录内容少于预设数量以及评分低于预设分值的诊疗数据;第一分词单元,用于对所述每份有效诊疗数据中的诊疗对话记录进行分词,得到分词结果;第一去除单元,用于对所述每份有效诊疗数据的所述分词结果进行停用词去除操作,得到多个症状词汇;第一词向量构建单元,用于构建得到所述每份有效诊疗数据的每个所述症状词汇的词向量;聚类单元,用于利用聚类算法对所述多份诊疗数据的所有所述症状词汇的词向量进行聚类,得到所述症状词汇的聚类结果;标注单元,用于为所述聚类结果中的每类症状词汇,标注对应的疾病名称,得到症状词汇与疾病名称的映射关系。...

【技术保护点】
1.一种地区疾病的监控方法,其特征在于,包括:/n获取线上问诊的多份诊疗数据;其中,每份所述诊疗数据包括诊疗对话记录和患者的地址信息;/n分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇;/n分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称;其中,所述诊断模型基于诊断数据的症状词汇和疾病名称的映射关系构建得到;/n基于多份所述诊疗数据对应的疾病名称,统计得到所述地址信息的所属地区的每种疾病的患病人数;其中,所述疾病为所述诊疗数据对应的疾病名称。/n

【技术特征摘要】
1.一种地区疾病的监控方法,其特征在于,包括:
获取线上问诊的多份诊疗数据;其中,每份所述诊疗数据包括诊疗对话记录和患者的地址信息;
分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇;
分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称;其中,所述诊断模型基于诊断数据的症状词汇和疾病名称的映射关系构建得到;
基于多份所述诊疗数据对应的疾病名称,统计得到所述地址信息的所属地区的每种疾病的患病人数;其中,所述疾病为所述诊疗数据对应的疾病名称。


2.根据权利要求1所述的方法,其特征在于,所述诊断模型的构建方法,包括:
获取线上问诊的多份诊疗数据;其中,所述诊疗数据包括诊疗结果和诊疗对话记录,所述诊疗结果包括疾病名称;
过滤掉所述多份诊疗数据中的无效诊疗数据,得到有效诊疗数据;其中,所述无效诊疗数据包括诊疗数据的信息不完整、诊疗对话记录内容少于预设数量以及评分低于预设分值的诊疗数据;
对所述每份有效诊疗数据中的诊疗对话记录进行分词,得到分词结果;
对所述每份有效诊疗数据的所述分词结果进行停用词去除操作,得到多个症状词汇;
构建得到所述每份有效诊疗数据的每个所述症状词汇的词向量;
利用聚类算法对所述多份诊疗数据的所有所述症状词汇的词向量进行聚类,得到所述症状词汇的聚类结果;
为所述聚类结果中的每类症状词汇,标注对应的疾病名称,得到症状词汇与疾病名称的映射关系。


3.根据权利要求1所述的方法,其特征在于,所述分别从每份所述诊疗数据的诊疗对话记录中,提取出症状词汇,包括:
对每份所述诊疗数据的诊疗对话记录进行分词,得到分词结果;
对所述每份诊疗数据的所述分词结果进行停用词去除操作,得到多个症状词汇;
计算得到所述每份诊疗数据的每个所述症状词汇在所述诊疗数据的诊疗对话记录中出现的词频,以及每个所述症状词汇在获取的所述多份诊疗数据中的逆向文件频率;
计算得到每份所述诊疗数据中的每个所述症状词汇的词频与逆向文件频率的乘积;
根据所述乘积的数值由大到小的顺序,从每份所述诊疗数据的所述症状词汇中选择出预设数量的症状词汇。


4.根据权利要求1所述的方法,其特征在于,所述分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称,包括:
构建得到所述每份诊疗数据的每一个所述症状词汇的词向量;
将每份所述诊疗数据的所有症状词汇的词向量全部输入所述诊断模型,由所述诊断模型分别计算每个疾病名称所映射的所有症状词汇的词向量与全部输入的所述词向量的余弦值,并将所述余弦值的最小值所对应的疾病名称,确定为所述诊疗数据对应的疾病名称。


5.根据权利要求1所述的方法,其特征在于,所述诊疗数据还包括患者的个人信息和诊疗时间,所述分别将每份所述诊疗数据的所述症状词汇输入预先构建的诊断模型中,由所述诊断模型推断出所述诊疗数据对应的疾病名称之后,还包括:
分别为每份所述诊疗数据,配置唯一的用户标识,并将按照预设格式存储所述诊疗数据的疾病信息;其中,所述疾病信息包括所述用户标识、所述诊疗数据对应的疾病名称以及所述诊疗数据的症状词汇、所述地址信息、患者的个人信息和诊疗时间;所述患者的个人信息包括患者的性别和年龄;
基于多份所述疾病数据,以每N岁为一个年龄段、每M小时...

【专利技术属性】
技术研发人员:王聪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1