本申请提供了一种文本分类模型的训练方法和装置、电子设备及存储介质,属于人工智能技术领域及数字医疗领域,通过获取多个预设的第一文本类别标签,对第一文本类别标签进行标签转换处理,得到问题文本,将问题文本和预设的未标注文本进行文本拼接,得到初始文本,通过预设的文本分析模型对初始文本进行文本分析,得到问题文本的答案文本和问答匹配数据,问答匹配数据用于表示答案文本与问题文本之间的匹配程度,根据问答匹配数据进行标签构建,得到未标注文本的第二文本类别标签,根据未标注文本和第二文本类别标签对预设的神经网络模型进行参数优化,以训练神经网络模型,得到文本分类模型,能够提高模型对文本分类的准确性。准确性。准确性。
【技术实现步骤摘要】
文本分类模型的训练方法和装置、电子设备及存储介质
[0001]本申请涉及人工智能
及数字医疗领域,尤其涉及一种文本分类模型的训练方法和装置、电子设备及存储介质。
技术介绍
[0002]随着互联网与人工智能技术的发展,数字医疗技术已应用于医疗行业。在数字医疗的背景下,医疗行业通过医疗系统存储不同患者诊断和治疗的医疗文本数据。医疗文本数据通常数据量大,若采用人工方式对医疗文本进行分类来获知患者疾病类型,会耗费大量的时间和精力。因此,采用自动化的分类方法对医疗文本进行分类,以节省医生时间,辅助医生治疗。
[0003]相关技术中,通过文本分类模型对医疗文本进行文本分类,但需要大量的标注文本数据对文本分类模型进行训练。现有开源数据集往往集中于情感分类等特定领域的任务,在工业实际落地应用中分类场景需要根据具体的业务决定,这导致无法利用开源的一些数据集。而采用人工标注的方式对文本数据进行标注会耗费大量资源,且不同任务场景的标注文本数据的数据格式不同,无法将其他任务场景的标注文本应用于分类任务场景,只能利用少量的与分类任务场景相关的标注文本数据对文本分类模型进行训练,会导致文本分类模型进行文本分类的准确性降低。因此,如何提高文本分类的准确性,成为了亟待解决的问题。
技术实现思路
[0004]本申请实施例的主要目的在于提出一种文本分类模型的训练方法和装置、电子设备及存储介质,旨在提高模型对文本分类的准确性,从而辅助医生进行诊断、治疗等方面的决策。
[0005]为实现上述目的,本申请实施例的第一方面提出了一种文本分类模型的训练方法,所述训练方法包括:
[0006]获取多个预设的第一文本类别标签;
[0007]对所述第一文本类别标签进行标签转换处理,得到问题文本;
[0008]将所述问题文本和预设的未标注文本进行文本拼接,得到初始文本;
[0009]通过预设的文本分析模型对所述初始文本进行文本分析,得到所述问题文本的答案文本和问答匹配数据;所述问答匹配数据用于表示所述答案文本与所述问题文本之间的匹配程度;
[0010]根据所述问答匹配数据进行标签构建,得到所述未标注文本的第二文本类别标签;
[0011]根据所述未标注文本和所述第二文本类别标签对预设的神经网络模型进行参数优化,以训练所述神经网络模型,得到文本分类模型。
[0012]在一些实施例,所述文本分析模型包括第一编码模块、第一分类层和第二分类层,
所述通过预设的文本分析模型对所述初始文本进行文本分析,得到所述问题文本的答案文本和问答匹配数据,包括:
[0013]通过所述第一编码模块对所述初始文本进行文本编码,得到目标文本向量;
[0014]通过所述第一分类层对所述目标文本向量进行文本分类,得到所述答案文本在所述未标注文本中的预测起始位置信息和第一位置相似数据;所述第一位置相似数据用于表示所述预测起始位置信息与预设的基准起始位置信息的相似程度;
[0015]通过所述第二分类层对所述目标文本向量进行文本分类,得到所述答案文本在所述未标注文本中的预测终止位置信息和第二位置相似数据;所述第二位置相似数据用于表示所述预测终止位置信息与预设的基准终止位置信息的相似程度;
[0016]根据所述预测起始位置信息和所述预测终止位置信息对所述未标注文本进行文本定位,得到所述答案文本;
[0017]根据所述第一位置相似数据和所述第二位置相似数据得到所述问答匹配数据。
[0018]在一些实施例,所述第一编码模块包括多头自注意力层和前馈神经网络层,所述通过所述第一编码模块对所述初始文本进行文本编码,得到目标文本向量,包括:
[0019]对所述初始文本进行向量化处理,得到所述初始文本的初始文本向量;
[0020]对所述初始文本进行相对位置编码,得到所述初始文本的位置编码向量;
[0021]对所述初始文本向量和所述位置编码向量进行向量融合,得到中间文本向量;
[0022]通过所述多头自注意力层对所述中间文本向量进行自注意力计算,得到所述中间文本向量的自注意力向量;
[0023]通过所述前馈神经网络层对所述自注意力向量进行特征抽取,得到所述目标文本向量。
[0024]在一些实施例,所述通过所述前馈神经网络层对所述自注意力向量进行特征抽取,得到所述目标文本向量,包括:
[0025]对所述自注意力向量和所述中间文本向量进行残差连接,得到第一残差向量;
[0026]通过所述前馈神经网络层对所述第一残差向量进行特征转换,得到第二残差向量;
[0027]对所述第一残差向量和所述第二残差向量进行残差连接,得到所述目标文本向量。
[0028]在一些实施例,所述神经网络模型包括第二编码模块和第三分类层,所述根据所述未标注文本和所述第二文本类别标签对预设的神经网络模型进行参数优化,以训练所述神经网络模型,得到文本分类模型,包括:
[0029]通过所述第二编码模块对所述未标注文本进行文本编码,得到文本编码向量;
[0030]通过所述第三分类层对所述文本编码向量进行文本分类,得到所述未标注文本的预测文本类别标签;
[0031]根据所述预测文本类别标签和所述第二文本类别标签进行损失计算,得到目标损失数据;
[0032]根据所述目标损失数据对所述神经网络模型进行参数优化,以训练所述神经网络模型,得到所述文本分类模型。
[0033]为实现上述目的,本申请实施例的第二方面提出了一种文本分类方法,所述文本
分类方法包括:
[0034]获取目标文本;
[0035]将所述目标文本输入至文本分类模型进行文本分类,得到所述目标文本的文本类别;所述文本分类模型根据如第一方面任一项所述的文本分类模型的训练方法训练得到。
[0036]为实现上述目的,本申请实施例的第三方面提出了一种文本分类模型的训练装置,所述训练装置包括:
[0037]标签获取模块,获取多个预设的第一文本类别标签;
[0038]标签转换模块,用于对所述第一文本类别标签进行标签转换处理,得到问题文本;
[0039]文本拼接模块,用于将所述问题文本和预设的未标注文本进行文本拼接,得到初始文本;
[0040]文本分析模块,用于通过预设的文本分析模型对所述初始文本进行文本分析,得到每一所述问题文本的答案文本和问答匹配数据;所述问答匹配数据用于表示所述答案文本与所述问题文本之间的匹配程度;
[0041]标签构建模块,用于根据所述问答匹配数据进行标签构建,得到未标注文本的第二文本类别标签;
[0042]训练模块,用于根据所述未标注文本和所述第二文本类别标签对预设的神经网络模型进行参数优化,以训练所述神经网络模型,得到文本分类模型。
[0043]为实现上述目的,本申请实施例的第四方面提出了一种文本分类装置,所述文本分类装置包括:
[0044]文本获取模块,用于获取目标文本;
...
【技术保护点】
【技术特征摘要】
1.文本分类模型的训练方法,其特征在于,所述训练方法包括:获取多个预设的第一文本类别标签;对所述第一文本类别标签进行标签转换处理,得到问题文本;将所述问题文本和预设的未标注文本进行文本拼接,得到初始文本;通过预设的文本分析模型对所述初始文本进行文本分析,得到所述问题文本的答案文本和问答匹配数据;所述问答匹配数据用于表示所述答案文本与所述问题文本之间的匹配程度;根据所述问答匹配数据进行标签构建,得到所述未标注文本的第二文本类别标签;根据所述未标注文本和所述第二文本类别标签对预设的神经网络模型进行参数优化,以训练所述神经网络模型,得到文本分类模型。2.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述文本分析模型包括第一编码模块、第一分类层和第二分类层,所述通过预设的文本分析模型对所述初始文本进行文本分析,得到所述问题文本的答案文本和问答匹配数据,包括:通过所述第一编码模块对所述初始文本进行文本编码,得到目标文本向量;通过所述第一分类层对所述目标文本向量进行文本分类,得到所述答案文本在所述未标注文本中的预测起始位置信息和第一位置相似数据;所述第一位置相似数据用于表示所述预测起始位置信息与预设的基准起始位置信息的相似程度;通过所述第二分类层对所述目标文本向量进行文本分类,得到所述答案文本在所述未标注文本中的预测终止位置信息和第二位置相似数据;所述第二位置相似数据用于表示所述预测终止位置信息与预设的基准终止位置信息的相似程度;根据所述预测起始位置信息和所述预测终止位置信息对所述未标注文本进行文本定位,得到所述答案文本;根据所述第一位置相似数据和所述第二位置相似数据得到所述问答匹配数据。3.根据权利要求2所述的文本分类模型的训练方法,其特征在于,所述第一编码模块包括多头自注意力层和前馈神经网络层,所述通过所述第一编码模块对所述初始文本进行文本编码,得到目标文本向量,包括:对所述初始文本进行向量化处理,得到所述初始文本的初始文本向量;对所述初始文本进行相对位置编码,得到所述初始文本的位置编码向量;对所述初始文本向量和所述位置编码向量进行向量融合,得到中间文本向量;通过所述多头自注意力层对所述中间文本向量进行自注意力计算,得到所述中间文本向量的自注意力向量;通过所述前馈神经网络层对所述自注意力向量进行特征抽取,得到所述目标文本向量。4.根据权利要求3所述的文本分类模型的训练方法,其特征在于,所述通过所述前馈神经网络层对所述自注意力向量进行特征抽取,得到所述目标文本向量,包括:对所述自注意力向量和所述中间文本向量进行残差连接,得到第一残差向量;通过所述前馈神经网络层对所述第一残差向量进行特征转换,得到第...
【专利技术属性】
技术研发人员:张镛,王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。