本申请公开了一种疾病预测方法、装置、设备和介质,提供了语义表达模型,该模型可以对疾病的描述信息进行特征提取。在该模型应用于疾病预测时,首先将候选疾病的描述信息输入语义表达模型获得相应的表达特征,将待预测疾病的描述信息输入语义表达模型获得相应的表达特征。还可以根据候选疾病与待预测疾病的表达特征之间的相似度,得到待预测疾病。该方法应用疾病特征之间的相似度进行疾病预测,通过增加候选疾病即可实现更多疾病的预测,具有很强的可扩展性;同时,由于模型提取到的特征与疾病其他维度的描述信息具有关联,在表达语义的同时具有丰富的表达能力,依赖表达特征之间的相似度进行疾病预测,能够有效提高预测的准确性。性。性。
【技术实现步骤摘要】
疾病预测方法、装置、设备和介质
[0001]本公开一般涉及疾病预测
,具体涉及一种疾病预测方法、装置、设备和介质。
技术介绍
[0002]随着人工智能的发展,疾病预测功能被广泛应用于线上医疗领域,例如,智能导诊、在线问诊等。相关技术中,通常根据有限的样本及标签训练分类模型,利用分类模型进行疾病预测。在具体应用中,分类模型可以输出模型的输入所命中的一个疾病标签,作为疾病预测结果。
[0003]虽然分类模型能够实现疾病的预测,但由于模型所能预测的分类结果(即疾病标签)是非常有限的,且在增加疾病时,需要根据新增加的疾病标签重新训练模型,模型的可扩展性非常有限,也就严重影响了线上医疗系统的功能扩展。
技术实现思路
[0004]鉴于现有技术中的上述缺陷或不足,期望提供一种疾病预测方法、装置、设备和介质,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。
[0005]第一方面,本申请实施例提供了一种疾病预测方法,包括:
[0006]获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;
[0007]获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;
[0008]根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。
[0009]第二方面,本申请实施例提供了一种疾病预测装置,包括:
[0010]第一表达模块,用于获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;
[0011]第二表达模块,用于获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;
[0012]确定模块,用于根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。
[0013]第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描
述的方法。
[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例描述的方法。
[0015]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如本申请实施例描述的方法。
[0016]本申请实施例提出的疾病预测方法,提供语义表达模型,该模型可以对疾病的某个维度的描述信息进行特征提取。在该模型应用于疾病预测时,首先根据候选疾病的描述信息确定候选疾病的表达特征以及根据待预测疾病的描述信息确定待预测疾病的表达特征,然后根据候选疾病的表达特征与待预测疾病的表达特征之间的相似度,对待预测疾病进行预测。本申请应用疾病特征之间的相似度进行疾病预测,在实现疾病预测的同时,通过增加候选疾病即可实现更多疾病的预测,具有很强的可扩展性。例如,可以增加候选疾病并通过语义表达模型获得新增候选疾病的表达特征,将新增候选疾病的表达特征也作为待预测疾病的匹配对象,则可以实现更多类型的疾病预测。有效避免了使用分类模型进行疾病预测时需要根据新增的疾病预测需求重新训练模型,模型扩展性较差等问题,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。
[0017]另外,将疾病某一维度的描述信息输入语义表达模型进行特征提取时,语义表达模型提取到的表达特征与疾病其他维度的描述信息具有关联,这样的表达特征在表达语义的同时具有丰富的表达能力。本申请依赖表达特征之间的相似度进行疾病预测,不仅仅关注到疾病描述信息本身的语义,还可关注到不同描述信息之间的关联关系,基于这两方面的特性可以有效匹配到与待预测疾病的表达特征更为相似的特征,根据匹配到的特征进行准确的疾病预测。
[0018]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0019]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0020]图1示出了本申请实施例提供的疾病预测方法的实施环境架构图;
[0021]图2示出了本申请一实施例提供的用户通过应用程序输入描述症状的流程示意图;
[0022]图3示出了本申请一实施例提供的疾病预测方法的流程示意图;
[0023]图4示出了本申请一实施例提供的表达特征关联关系的示意图;
[0024]图5示出了本申请另一实施例提供的疾病预测方法的流程示意图;
[0025]图6示出了本申请一实施例提供的基于两个历史病历确定第一损失的原理示意图;
[0026]图7示出了本申请一实施例提供的基于历史病历和疾病名称确定第二损失的原理示意图;
[0027]图8示出了本申请一实施例提供的基于疾病概述和疾病名称确定第二损失的原理示意图;
[0028]图9示出了本申请一实施例提供的基于疾病症状和疾病名称确定第二损失的原理示意图;
[0029]图10示出了本申请一实施例提供的基于一个历史病历确定第一损失的原理示意图;
[0030]图11示出了本申请又一实施例提供的疾病预测方法的流程示意图;
[0031]图12示出了本申请一实施例提供的疾病预测装置的结构框图;
[0032]图13示出了本申请另一实施例提供的疾病预测装置的结构框图;
[0033]图14示出了适于用来实现本申请实施例的电子设备或服务器的计算机系统的结构示意图。
具体实施方式
[0034]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。
[0035]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0036]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种疾病预测方法,其特征在于,包括:获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。2.根据权利要求1所述的方法,其特征在于,所述语义表达模型的训练过程包括:获取多个样本疾病的历史描述信息,将所述历史描述信息输入初始模型进行语义提取,获得所述历史描述信息对应的表达特征;基于不同所述历史描述信息对应的表达特征对所述初始模型进行迭代训练,在不同所述历史描述信息对应的表达特征存在关联关系时获得所述语义表达模型。3.根据权利要求2所述的方法,其特征在于,所述基于不同所述历史描述信息对应的表达特征对所述初始模型进行迭代训练,在不同所述历史描述信息对应的表达特征存在关联关系时获得所述语义表达模型,包括:针对每一所述样本疾病,根据不同所述历史描述信息对应的表达特征之间的损失,对初始模型进行迭代训练,在所述损失达到收敛时获得所述语义表达模型;其中,所述损失包括同一纬度下的不同描述信息对应的表达特征之间的第一损失,以及不同纬度下的描述信息对应的表达特征之间的第二损失。4.根据权利要求3所述的方法,其特征在于,所述历史描述信息包括历史病历,所述方法还包括:针对每一所述样本疾病,基于所述样本疾病对应的至少两个历史病历的表达特征,确定所述第一损失,所述第一损失用于表征所述至少两个病历之间的关联关系。5.根据权利要求3或4所述的方法,其特征在于,所述历史描述信息包括历史病历和疾病名称,所述方法还包括:针对每一所述样本疾病,基于所述样本疾病对应的所述历史病历的表达特征和所述疾病名称的表达特征,确定所述第二损失,第二损失用于表征所述历史病历与所述疾病名称之间的关联关系。6.根据权利要求4
‑
5中任一所述的方法,其特征在于,所述历史描述信息包括疾病概述和疾病名称,所述方法还包括:针对每一所述样本疾病,基于所述样本疾病对应的所述疾病概述的表达特征和疾病名称的表达特征,确定所述第二损失,所述第二损失用于表征所述疾病概述与...
【专利技术属性】
技术研发人员:张世伟,孙继超,吴贤,丁雪琪,郑冶枫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。