本发明专利技术公开了一种流行病学调查装置及方法:问答模块,将患者输入的自然语言回答进行识别,输出结构化描述;还将从策略模块接收到的问题的结构化描述进行转换,输出患者能够理解的自然语言;特征提取模块,根据问答模块输出的患者回答的结构化描述以及策略模块输出的历史问题的结构化描述,对患者当前回答的结构化描述进行特征提取;主题识别模块,根据策略模块输出的历史问题的结构化描述,以及问答模块输出的患者回答的结构化描述,输出当前问答的所属主题;策略模块,根据特征提取模块所提取的患者当前回答的特征以及主题识别模块所识别的历次问答的所属主题,输出下一个问题目标。能够对下一个问题进行预测,得到详尽准确的流行病学调查结果。确的流行病学调查结果。确的流行病学调查结果。
【技术实现步骤摘要】
一种流行病学调查装置及方法
[0001]本专利技术涉及医学调查
,特别涉及一种流行病学调查装置及方法。
技术介绍
[0002]流行病调查对于流行病传播的早期阻断非常重要,尽快确认病人发病前后的来龙去脉,探寻病人感染的来源、过程、分析可能扩展的范围,界定哪些密切接触者有潜在感染风险。在感染扩大的初期,需要大量人力进行流行病学调查, 这个过程即增加了医护人员风险,又不能保证最快速及时的获取信息,而通过调查表并不能针对具体情况进行具体分析,无法保障调查质量,不能获取到详尽准确的流行病学调查结果。
技术实现思路
[0003]本专利技术的目的在于提供一种流行病学调查装置及方法,能够针对每个调查对象的不同情况有针对性的提问,获取到详尽准确的流行病学调查结果。
[0004]为实现上述专利技术目的,本专利技术提供了一种流行病学调查装置,该装置包括:问答模块,用于将患者输入的自然语言回答进行语音识别、语义解析以及标准化识别,输出结构化描述;还用于将从策略模块接收到的问题的结构化描述进行转换,输出患者能够理解的自然语言;特征提取模块,用于根据问答模块输出的患者回答的结构化描述以及策略模块输出的历史问题的结构化描述,对患者当前回答的结构化描述进行特征提取;主题识别模块,用于根据策略模块输出的历史问题的结构化描述,以及问答模块输出的患者回答的结构化描述,输出当前问答的所属主题;策略模块,用于根据特征提取模块所提取的患者当前回答的特征以及主题识别模块所识别的历次问答的所属主题,输出下一个问题目标。
[0005]为实现上述专利技术目的,本专利技术还提供了一种流行病学调查方法,该方法包括:将患者输入的自然语言回答进行语音识别、语义解析以及标准化识别,输出结构化描述;根据患者回答的结构化描述以及历史问题的结构化描述,对患者当前回答的结构化描述进行特征提取;根据历史问题的结构化描述以及患者回答的结构化描述,输出当前问答的所属主题;根据患者当前回答的特征以及历次问答的所属主题,输出下一个问题目标。
[0006]综上所述,本专利技术提出一种流行病学调查装置及方法。通过本专利技术的方案,通过多轮问答逐步提问,获取到病人的症状,基本情况,活动轨迹,明确如何感染,并列出密切接触者、确认是否有可能将病毒传染给他人。针对接触者,通过症状、接触情况的提问评估其感染风险并给出处理意见。与现有技术相比,本专利技术的方案能够自动进行精准的问题预测,形成准确详尽的问答记录,确保调查质量。
附图说明
[0007]图1为本专利技术流行病学调查装置的结构示意图。
[0008]图2为本专利技术流行病学调查方法的流程示意图。
具体实施方式
[0009]为使本专利技术的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本专利技术所述方案作进一步地详细说明。
[0010]本专利技术的核心思想是:根据患者当前回答的特征以及历次问答的所属主题,输出下一个问题目标。通过多轮问答逐步提问,获取到详尽准确的流行病学调查结果。
[0011]图1为本专利技术流行病学调查装置的结构示意图,包括以下模块:问答模块101,用于将患者输入的自然语言回答进行语音识别、语义解析以及标准化识别,输出结构化描述;还用于将从策略模块接收到的问题的结构化描述进行转换,输出患者能够理解的自然语言;其中,问答模块101用于自然语言和结构化描述相互转化。
[0012]特征提取模块102,用于根据问答模块输出的患者回答的结构化描述以及策略模块输出的历史问题的结构化描述,对患者当前回答的结构化描述进行特征提取;其中,特征提取模块102包括:诊断单元1021,用于根据历史问答,输出为当前诊断结果;具体地,诊断单元1021,用于调查未确认的患者,评估其感染风险,并给出处理意见。例如在家隔离,无风险,需到医院检查,及注意事项等。通过问答获取到的症状和行程、估算其感染风险。模型为分类模型,输入为问答模块的答案理解结果,输出为诊断结果,诊断结果例如:新冠疑似病例,概率80%; 或者感染风险低, 概率90%。
[0013]诊断单元1021为融合模型,其基本结构如下:先通过分类模型得到诊断结果情况,再通过规则及知识图谱检索其处理意见。
[0014]分类模型如下:模型选型:word2vec + LR,bert及其变种,决策树等分类模型。
[0015]输入:问答症状、检查及结果输入表达为one
‑
hot模式或其他向量形式,one
‑
hot模式一种将词汇表达为向量的方式,具体的向量长度为词表总长n,向量中n
‑
1个元素为0,该词汇所对应的位置的元素值为1。行程通过感染源分析单元1024的匹配结果输入。
[0016]输出:诊断结果及其概率数据集:数据集主要从获取到的病历样本中构建,以确诊病历为正样本,以确认未患病样本为负样本。采用10%的样本为测试集,90%的样本为训练集。
[0017]训练过程:将训练集中的样本的输入分批依次输入模型,将模型输出结果与训练集对应的输出标签相比较,通过交叉熵代价函数计算损失,用梯度下降法更新模型参数,经过迭代使得损失函数逐渐收敛,完成模型的训练过程。并在测试集中测试实际的模型效果。
[0018]处理意见是针对诊断结果给出的具体建议:其结构形式为知识图谱或者规则构建的字典。
[0019]输入:诊断结果及其概率。
[0020]计算方式:根据诊断结果及其概率,检索知识图谱或规则字典获取处理意见及注
意事项。
[0021]输出:处理意见及注意事项。
[0022]活动轨迹分析单元1022,用于根据历史问答,输出为近期活动时间及地点的路径列表;具体地,活动轨迹分析单元1022,从问答结果中构建病人活动轨迹,通过活动轨迹圈出风险区和疑似接触者,并依据策略准备接触者的流行病学调查。输入为问答模块答案理解的结果,输出为,近期活动时间及地点的路径列表。可通过数据库精确匹配查找进行处理,用于分析风险区域和筛查疑似接触者。
[0023]活动轨迹分析单元1022:输入:语义理解识别到的病人的活动时间、路径、交通方式等。
[0024]计算方式:将病人的活动时间、路径、交通方式表达为时间序列结构。
[0025]1.计算时间及路径的联通性,判定是否有缺失或待确认部分,并与策略模块结合,通过对话获取待补充或待确认信息。
[0026]2.通过刻画高风险的场地及交通方式等信息,例如学校、医院、火车、出租等。根据高风险场地信息,通过对话策略确认其时间,接触人群,是否有防护(戴口罩)等。计算方式为依据政策构建的风险场地库,并赋予权重。其中学校、医院名称、火车车次等是通过NER系统结合场地数据库结合的系统,NER结果来自语义理解的输出。
[0027]3.根据病人的活动信息的时间序列结构及高风险地区识别,刻画出详细的活动轨迹图。
[0028]4.根据活动轨迹图,调用数据库匹配同时间段出现在与病人同位置的人群,获取疑似接触者信息,并根据感染病情、疾病传染本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种流行病学调查装置,其特征在于,该装置包括:问答模块,用于将患者输入的自然语言回答进行语音识别、语义解析以及标准化识别,输出结构化描述;还用于将从策略模块接收到的问题的结构化描述进行转换,输出患者能够理解的自然语言;特征提取模块,用于根据问答模块输出的患者回答的结构化描述以及策略模块输出的历史问题的结构化描述,对患者当前回答的结构化描述进行特征提取;主题识别模块,用于根据策略模块输出的历史问题的结构化描述,以及问答模块输出的患者回答的结构化描述,输出当前问答的所属主题;策略模块,用于根据特征提取模块所提取的患者当前回答的特征以及主题识别模块所识别的历次问答的所属主题,输出下一个问题目标。2.如权利要求1所述的装置,其特征在于,所述特征提取模块包括:诊断单元,用于根据历史问答,输出为当前诊断结果;活动轨迹分析单元,用于根据历史问答,输出为近期活动时间及地点的路径列表;情绪识别单元,用于根据历史问答,输出为当前患者情绪表达;感染源分析单元,用于根据历史问答,输出为当前疑似感染源。3.如权利要求1所述的装置,其特征在于,所述策略模块具体用于,将流行病学调查者的问答记录作为神经网络模型的训练集中的样本;根据样本的训练值和真实值更新网络权值参数,得到训练后的神经网络模型;将患者当前回答的特征以及历次问答的所属主题输入到神经网络模型,得到下一个问题目标;其中,所述神经网络...
【专利技术属性】
技术研发人员:赵韡,袁靖,刁晓林,李众,
申请(专利权)人:中国医学科学院阜外医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。