医疗对话模型的训练方法、医疗问询方法、装置及设备制造方法及图纸

技术编号：40071752 阅读：18 留言：0更新日期：2024-01-17 00:17

本申请公开了一种医疗对话模型的训练方法、医疗问询方法、装置及设备，方法包括基于预设病例数据集及语言模型生成候选病史采集对话集；基于预设医患对话评测表对候选病史采集对话集进行筛选，以得到病史采集对话集；基于病史采集对话集确定训练数据集；基于训练数据集对预设语言模型进行训练，以得到医疗对话模型。本申请实施例在基于预设病例数据集生成候选病史采集对话集后，通过预设医患对话评测表对候选病史采集对话集进行筛选，这样可以提高用于确定训练数据集的病史采集对话集的准确性，从而可以提高基于训练数据集训练得到的医疗对话模型的模型精确，从而可以提高基于医疗对话模型询问得到的患者病史的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能医疗，特别涉及一种医疗对话模型的训练方法、医疗问询方法、装置及设备。

技术介绍

1、随着ai（artificial intelligence）技术和理论的日益成熟，语言模型的发展取得了长足的进步，例如chatgpt3.5、chatgpt4.0等。语言模型被应用于医疗领域中，通过语言模型来对患者进行病史询问以获知患者的既往病史以及目前状况，提高医疗服务效率，缓解医疗资源紧缺的问题。然而，目前在使用语言模型进行病史询问时，普遍存在询问获知的病史数据准确性低，需要医生重新进行病史询问的问题。

技术实现思路

1、本申请要解决的技术问题在于，针对现有技术的不足，提供一种医疗对话模型的训练方法、医疗问询方法、装置及设备。

2、为了解决上述技术问题，本申请实施例第一方面提供了一种医疗对话模型的训练方法，所述方法包括：

3、基于预设病例数据集及语言模型生成候选病史采集对话集；

4、基于预设医患对话评测表对所述候选病史采集对话集进行筛选，以得到病史采集对话集；

5、基于所述病史采集对话集确定训练数据集；

6、基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型。

7、所述的医疗对话模型的训练方法，其中，所述的基于预设病例数据集及语言模型生成候选病史采集对话集具体包括：

8、提取预设病例数据集中的各病例数据中的病历摘要；

9、基于各病历摘要、预设医生要求及预设患者要求构建第一输入数据，

10、所述的医疗对话模型的训练方法，其中，所述基于预设医患对话评测表对所述候选病史采集对话集进行筛选，以得到病史采集对话集具体包括：

11、对于候选病史采集对话集中的每个候选病史采集对话，基于预设医患对话评测表确定所述候选病史采集对话对应的采集评分；

12、将采集评分小于预设评分的候选病史采集对话从所述候选病史采集对话集中去除，以得到病史采集对话集。

13、所述的医疗对话模型的训练方法，其中，所述基于预设医患对话评测表确定所述候选病史采集对话对应的采集评分具体包括：

14、在预设医患对话评测表中选取候选病史采集对话所包括的目标评测项；

15、获取各目标评测项对应的评测分数，并计算获取到的所有评测分数的和，以得到所述候选病史采集对话对应的采集评分。

16、所述的医疗对话模型的训练方法，其中，所述基于所述病史采集对话集确定训练数据集具体包括：

17、在所述病史采集对话集中选取一个病史采集对话，在所述病史采集对话中选取一个医生语句及所述医生语句的前序对话；

18、基于所述医生语句和所述前序对话生成训练数据，重新在所述病史采集对话集中选取一个病史采集对话，直至生成预设数量的训练数据，以得到训练数据集。

19、所述的医疗对话模型的训练方法，其中，所述基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型具体包括：

20、基于训练数据集中的训练数据确定第二输入数据，并将第二输入数据输入所述预设语言模型，通过所述预设语言模型输出预测医生语句，其中，所述训练数据包括训练样本数据和标签医生语句；

21、基于所述训练数据中的标签医生语句和所述预测医生语句确定损失项；

22、基于所述损失项对所述预设语言模型进行训练，以得到医疗对话模型。

23、所述的医疗对话模型的训练方法，其中，所述基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型之后，所述方法还包括：

24、基于医疗对话模型生成医患对话数据；

25、根据预设医患对话评测表确定所述医患对话数据对应的对话质量评分，以得到所述医疗对话模型对应的模型表现分数。

26、所述的医疗对话模型的训练方法，其中，所述基于医疗对话模型生成医患对话数据具体包括：

27、采用预设语言模型根据预设获取的患者主诉数据模拟患者角色，并采用所述医疗对话模型模拟医生角色；

28、控制所述预设语言模型和所述医疗对话模型进行对话，以得到医患对话数据。

29、所述的医疗对话模型的训练方法，其中，所述根据预设医患对话评测表确定所述医患对话数据对应的对话质量评分，以得到所述医疗对话模型对应的模型表现分数之后，所述方法还包括：

30、将所述模型表现分数与预设表现分数进行比较；

31、若所述模型表现分数大于或者等于所述预设表现分数，则将所述医疗对话模型作为训练完成的医疗对话模型；

32、若所述模型表现分数小于所述预设表现分数，则将所述医疗对话模型作为预设语言模型，并重新执行基于预设病例数据集及语言模型生成候选病史采集对话集的步骤，直至所述模型表现分数大于或者等于所述预设表现分数。

33、所述的医疗对话模型的训练方法，其中，在重新执行基于预设病例数据集及语言模型生成候选病史采集对话集的步骤时，控制所述病史采集对话集中的每个病史采集对话至少包括医患对话数据中缺少的评测项中的一项。

34、本申请实施例第二方面提供了一种医疗问询方法，应用基于如上所述的医疗对话模型的训练方法训练得到的医疗对话模型，所述医疗问询方法具体包括：

35、接收患者主诉数据；

36、将所述主诉数据作为输入数据，并控制所述医疗对话模型基于所述输入数据生成医生语句；

37、接收患者基于所述医生语句所形成的患者语句，并基于所述患者语句以及所述患者语句前的所有医生语句和所有患者语句形成前序医疗对话；

38、将所述前序医疗对话作为输入数据，并重新执行控制所述医疗对话模型基于所述输入数据生成医生语句的步骤，直至医疗问询结束。

39、本申请实施例第三方面提供了一种医疗对话模型的训练装置，所述装置包括：

40、生成模块，用于基于预设病例数据集及语言模型生成候选病史采集对话集；

41、筛选模块，用于基于预设医患对话评测表对所述候选病史采集对话集进行筛选，以得到病史采集对话集；

42、确定模块，用于基于所述病史采集对话集确定训练数据集；

43、训练模块，用于基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型。

44、本申请实施例第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如上所述的医疗对话模型的训练方法中的步骤，和/或如上所述的医疗问询方法中的步骤。

45、本申请实施例第五方面提供了一种终端设备，其包括：处理器和存储器；

46、所述存储器上存储有可被所述处理器执行的计算机可读程序；

47、所述处理器执行所述计算机可读程序时现如上所述的医疗对话模型的训练方法中的步骤，和/或如上所述的医疗本文档来自技高网...

【技术保护点】

1.一种医疗对话模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述的基于预设病例数据集及语言模型生成候选病史采集对话集具体包括：

3.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于预设医患对话评测表对所述候选病史采集对话集进行筛选，以得到病史采集对话集具体包括：

4.根据权利要求3所述的医疗对话模型的训练方法，其特征在于，所述基于预设医患对话评测表确定所述候选病史采集对话对应的采集评分具体包括：

5.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于所述病史采集对话集确定训练数据集具体包括：

6.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型具体包括：

7.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型之后，所述方法还包括：

8.根据权利要求7所述的医疗对话模型的

9.根据权利要求7所述的医疗对话模型的训练方法，其特征在于，所述根据预设医患对话评测表确定所述医患对话数据对应的对话质量评分，以得到所述医疗对话模型对应的模型表现分数之后，所述方法还包括：

10.根据权利要求9所述的医疗对话模型的训练方法，其特征在于，在重新执行基于预设病例数据集及语言模型生成候选病史采集对话集的步骤时，控制所述病史采集对话集中的每个病史采集对话至少包括医患对话数据中缺少的评测项中的一项。

11.一种医疗问询方法，其特征在于，应用基于如权利要求1-10任意一项所述的医疗对话模型的训练方法训练得到的医疗对话模型，所述医疗问询方法具体包括：

12.一种医疗对话模型的训练装置，其特征在于，所述装置包括：

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1-10任意一项所述的医疗对话模型的训练方法中的步骤，和/或如权利要求11所述的医疗问询方法中的步骤。

14.一种终端设备，其特征在于，包括：处理器和存储器；

...

【技术特征摘要】

1.一种医疗对话模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述的基于预设病例数据集及语言模型生成候选病史采集对话集具体包括：

4.根据权利要求3所述的医疗对话模型的训练方法，其特征在于，所述基于预设医患对话评测表确定所述候选病史采集对话对应的采集评分具体包括：

5.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于所述病史采集对话集确定训练数据集具体包括：

6.根据权利要求1所述的医疗对话模型的训练方法，其特征在于，所述基于所述训练数据集对预设语言模型进行训练，以得到医疗对话模型具体包括：

8.根据权利要求7所述的医疗对话模型的训练方法，其特征在于，所述基于医疗对话模...

【专利技术属性】
技术研发人员：孙双龙，谭维，谢育涛，
申请(专利权)人：粤港澳大湾区数字经济研究院福田，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人