一种文本分类方法和装置制造方法及图纸

技术编号:31227660 阅读:15 留言:0更新日期:2021-12-08 09:36
本发明专利技术公开了一种文本分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型,得到文本分类模型;根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型;将所述第二系统的预测样本输入所述预测模型,得到所述预测样本的类别标签。该实施方式能够降低文本分类的成本,缩短文本分类的时间。缩短文本分类的时间。缩短文本分类的时间。

【技术实现步骤摘要】
一种文本分类方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种文本分类方法和装置。

技术介绍

[0002]在实际应用场景中,常常需要对用户反馈的文本进行分类,以确定用户反馈的问题所属的类别。目前,一般通过用户反馈的文本及其类别标签训练分类模型,利用训练后的分类模型预测文本所属的类别。
[0003]在系统升级的过程中,数据的风格会产生变化。对于同一类别的问题,在不同系统中可能存在不同的表述,例如,文本的长短和文本的用词发生变化。以第一系统升级至第二系统为例,为了适应系统的变化,现有技术对从第二系统中获取的文本进行标注,重新训练分类模型。
[0004]但是,由于需要标注大量的文本,现有技术对文本进行分类的成本较高,而且,需要花费较长的时间。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种文本分类方法和装置,能够降低文本分类的成本,缩短文本分类的时间。
[0006]第一方面,本专利技术实施例提供了一种文本分类方法,包括:
[0007]根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型,得到文本分类模型;
[0008]根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型;
[0009]将所述第二系统的预测样本输入所述预测模型,得到所述预测样本的类别标签。
[0010]可选地,
[0011]所述根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型,包括:
[0012]根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k 次分类的类别标签;
[0013]根据所述第一训练文本及其类别标签、所述第二训练文本及第二训练文本第k次分类的类别标签训练经过k-1次训练的文本分类模型;
[0014]根据经过k次训练的文本分类模型,确定所述第二训练文本第k+1 次分类的类别标签;
[0015]确定第二训练文本第k次和第k+1次分类的类别标签是否满足预设的相似条件,如果是,确定经过k次训练的文本分类模型为所述预测模型,否则,将k更新为k+1后执行所述根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k次分类的类别标签;
[0016]其中,k为大于0的整数。
[0017]可选地,
[0018]所述相似条件,包括:第二训练文本第k次和第k+1次分类的类别标签的重合率大于相似阈值。
[0019]可选地,
[0020]所述初始分类模型,包括:BERT(Bidirectional EncoderRepresentations from Transformers,基于Transformer的双向编码器表征)模型和全连接层。
[0021]可选地,
[0022]进一步包括:
[0023]确定超参数;其中,所述超参数用于控制所述第一训练文本和所述第二训练文本对损失值的影响程度;
[0024]根据所述超参数,确定所述损失函数;
[0025]所述根据所述第一训练文本及其类别标签、所述第二训练文本及第二训练文本第k次分类的类别标签训练经过k-1次训练的文本分类模型,包括:
[0026]根据所述损失函数、所述第一训练文本及其类别标签、所述第二训练文本及其第k次分类的类别标签训练经过k-1次训练的文本分类模型。
[0027]可选地,
[0028]进一步包括:
[0029]确定验证文本及其类别标签;
[0030]根据所述验证文本及其类别标签,确定所述超参数对应的分类准确率;
[0031]根据所述分类准确率调整所述超参数。
[0032]第二方面,本专利技术实施例提供了一种文本分类装置,包括:
[0033]第一训练模块,配置为根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型,得到文本分类模型;
[0034]第二训练模块,配置为根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型;
[0035]预测模块,配置为将所述第二系统的预测样本输入所述预测模型,得到所述预测样本的类别标签。
[0036]可选地,
[0037]所述第二训练模块,配置为根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k次分类的类别标签;根据所述第一训练文本及其类别标签、所述第二训练文本及第二训练文本第k次分类的类别标签训练经过k-1次训练的文本分类模型;根据经过k次训练的文本分类模型,确定所述第二训练文本第k+1次分类的类别标签;确定第二训练文本第k次和第k+1次分类的类别标签是否满足预设的相似条件,如果是,确定经过k次训练的文本分类模型为所述预测模型,否则,将k更新为k+1后执行所述根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k次分类的类别标签;
[0038]其中,k为大于0的整数。
[0039]第三方面,本专利技术实施例提供了一种电子设备,包括:
[0040]一个或多个处理器;
[0041]存储装置,用于存储一个或多个程序,
[0042]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。
[0043]第四方面,本专利技术实施例提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
[0044]上述专利技术中的一个实施例具有如下优点或有益效果:考虑到系统变化前后,文本的类别标签是一致的,因此,本专利技术实施例基于第一系统的第一训练文本和第二系统的第二训练文本对文本分类模型进行训练,使得到的预测模型能够对第二系统产生的预测样本进行分类。本专利技术实施例不需要对第二训练文本进行标注,能够节省标注的成本,提高文本分类的效率。
[0045]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0046]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0047]图1是本专利技术的一个实施例提供的一种文本分类方法的流程图;
[0048]图2是本专利技术的另一个实施例提供的一种文本分类方法的流程图;
[0049]图3是本专利技术的一个实施例提供的一种文本分类装置的示意图;
[0050]图4是本专利技术实施例可以应用于其中的示例性系统架构图;
[0051]图5是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0052]以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型,得到文本分类模型;根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型;将所述第二系统的预测样本输入所述预测模型,得到所述预测样本的类别标签。2.如权利要求1所述的方法,其特征在于,所述根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型,得到预测模型,包括:根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k次分类的类别标签;根据所述第一训练文本及其类别标签、所述第二训练文本及第二训练文本第k次分类的类别标签训练经过k-1次训练的文本分类模型;根据经过k次训练的文本分类模型,确定所述第二训练文本第k+1次分类的类别标签;确定第二训练文本第k次和第k+1次分类的类别标签是否满足预设的相似条件,如果是,确定经过k次训练的文本分类模型为所述预测模型,否则,将k更新为k+1后执行所述根据经过k-1次训练的文本分类模型,确定所述第二训练文本第k次分类的类别标签;其中,k为大于0的整数。3.如权利要求2所述的方法,其特征在于,所述相似条件,包括:第二训练文本第k次和第k+1次分类的类别标签的重合率大于相似阈值。4.如权利要求1所述的方法,其特征在于,所述初始分类模型,包括:基于Transformer的双向编码器表征BERT模型和全连接层。5.如权利要求1所述的方法,其特征在于,进一步包括:确定超参数;其中,所述超参数用于控制所述第一训练文本和所述第二训练文本对损失值的影响程度;根据所述超参数,确定所述损失函数;所述根据所述第一训练文本及其类别标签、所述第二训练文本及第二训练文本第k次分类的类别标签训练经过k-1次训练的文本分类模型,包括:根据所述损失函数...

【专利技术属性】
技术研发人员:陈生泰刘洋
申请(专利权)人:北京京东振世信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1