【技术实现步骤摘要】
病历文本生成方法、装置、计算机设备及存储介质
[0001]本申请实施例涉及计算机
,特别涉及一种病历文本生成方法、装置、计算机设备及存储介质。
技术介绍
[0002]问诊是指医生通过与患者进行沟通,了解患者病情的过程。通常医生在问诊之后,可以将患者的病情整理成病历文本,以便于后续根据病历文本随时查阅患者的病情。
[0003]相关技术中,将问诊过程中产生的对话文本进行结构化处理,得到固定格式的医疗数据,调用病历生成模型对该医疗数据进行处理,得到固定格式的病历文本。但是,由于对话文本的类型繁多,会存在一些难以结构化处理的对话文本,导致无法调用上述病历生成模型进行处理,因此该病历文本生成方法的通用性较差。
技术实现思路
[0004]本申请实施例提供了一种病历文本生成方法、装置、计算机设备及存储介质,能够提高病历文本生成方法的通用性。所述技术方案如下:
[0005]一方面,提供了一种病历文本生成方法,所述方法包括:
[0006]获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;
[0007]基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;
[0008]调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。
[0009]另一方面,提供了一种病历文本生成装置,所述 ...
【技术保护点】
【技术特征摘要】
1.一种病历文本生成方法,其特征在于,所述方法包括:获取多个第一样本数据,所述第一样本数据包括样本对话文本和所述样本对话文本对应的样本病历文本,其中多个所述第一样本数据中,存在多种格式的样本对话文本;基于多个所述第一样本数据,训练病历生成模型,所述病历生成模型用于根据所述多种格式中任一格式的对话文本生成对应的病历文本;调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本。2.根据权利要求1所述的方法,其特征在于,所述基于多个所述第一样本数据,训练病历生成模型,包括:基于候选字符集合和所述样本病历文本,确定所述样本病历文本对应的样本特征信息,所述候选字符集合包括多个候选字符,所述样本特征信息表示每个所述候选字符属于所述样本病历文本的可能性;调用所述病历生成模型,对所述样本对话文本进行处理,得到预测特征信息,所述预测特征信息表示每个所述候选字符属于所述样本对话文本对应的预测病历文本的可能性;基于所述样本特征信息和所述预测特征信息,训练所述病历生成模型。3.根据权利要求2所述的方法,其特征在于,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述调用所述病历生成模型,对所述样本对话文本进行处理,得到预测特征信息,包括:调用所述特征提取网络,对所述样本对话文本进行特征提取,得到所述样本对话文本中的每个对话语句对应的预测文本特征;调用所述编码网络,对得到的多个预测文本特征进行融合编码,得到预测融合特征;调用所述解码网络,基于所述预测融合特征进行解码,得到所述预测特征信息。4.根据权利要求3所述的方法,其特征在于,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息包括每个所述候选字符对应的预测特征值,所述预测特征值表示所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;所述调用所述解码网络,基于所述预测融合特征进行解码,得到所述预测特征信息,包括:调用所述解码网络,对所述预测融合特征进行解码,得到第一预测子信息,将所述第一预测子信息中最大的预测特征值对应的候选字符确定为第一预测字符;继续调用所述解码网络,根据已经得到的预测字符,对所述预测融合特征进行解码,得到第二预测子信息,将所述第二预测子信息中最大的预测特征值对应的候选字符确定为第二预测字符,直至得到的预测字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。5.根据权利要求2所述的方法,其特征在于,所述样本特征信息包括所述样本病历文本中的多个位置对应的样本子信息,所述样本子信息表示每个所述候选字符属于所述样本病历文本中对应位置上的字符的可能性,所述预测特征信息包括所述预测病历文本中的多个位置对应的预测子信息,所述预测子信息表示每个所述候选字符属于所述预测病历文本中对应位置上的字符的可能性;
所述基于所述样本特征信息和所述预测特征信息,训练所述病历生成模型,包括:基于每个所述位置对应的所述预测子信息与所述样本子信息之间的差异,确定每个所述位置对应的损失分量;基于多个所述损失分量,确定损失值,所述损失值与多个所述损失分量正相关;基于所述损失值,训练所述病历生成模型。6.根据权利要求1
‑
5任一项所述的方法,其特征在于,所述调用所述病历生成模型,根据采集到的第一对话文本,生成所述第一对话文本对应的病历文本,包括:调用所述病历生成模型,对所述第一对话文本进行识别,得到特征信息,根据所述特征信息,在候选字符集合中的多个候选字符中确定属于所述病历文本的多个目标字符,所述特征信息表示每个所述候选字符属于所述第一对话文本对应的病历文本的可能性;将每个所述目标字符进行拼接,得到所述病历文本。7.根据权利要求6所述的方法,其特征在于,所述病历生成模型包括特征提取网络、编码网络和解码网络,所述调用所述病历生成模型,对所述第一对话文本进行识别,得到特征信息,根据所述特征信息,在候选字符集合中的多个候选字符中确定属于所述病历文本的多个目标字符,包括:调用所述特征提取网络,对所述第一对话文本进行特征提取,得到所述第一对话文本中的每个对话语句对应的文本特征;调用所述编码网络,对得到的多个文本特征进行融合编码,得到融合特征;调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符。8.根据权利要求7所述的方法,其特征在于,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;所述调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个所述候选字符中确定属于所述病历文本的多个所述目标字符,包括:调用所述解码网络,对所述融合特征进行解码,得到第一子信息,将所述第一子信息中最大的特征值对应的候选字符确定为第一目标字符;继续调用所述解码网络,根据已经得到的目标字符,对所述融合特征进行解码,得到第二子信息,将所述第二子信息中最大的特征值对应的候选字符确定为第二目标字符,直至得到的目标字符为第一标志字符,所述第一标志字符用于表示病历文本的结尾。9.根据权利要求7所述的方法,其特征在于,所述特征信息包括所述病历文本中的多个位置对应的子信息,所述子信息包括每个所述候选字符对应的特征值,所述特征值表示所述候选字符属于所述病历文本中对应位置上的字符的可能性;所述调用所述解码网络,基于所述融合特征进行解码,得到所述特征信息,根据所述特征信息,在多个...
【专利技术属性】
技术研发人员:曾广韬,鞠美芝,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。