【技术实现步骤摘要】
训练文本审核模型的方法和装置
[0001]本公开涉及人工智能领域,尤其涉及自然语言处理领域,具体为一种训练文本审核模型的方法和装置。
技术介绍
[0002]文本审核系统是基于自然语言处理技术,用于判断一段文本内容是否遵循互联网、媒体等平台内容规范的一个自动化和智能化系统。常见的文本审核应用场景包括用户签名/昵称、评论/留言、即时通讯文本内容、用户帖子、媒体资讯、商品信息、视频直播弹幕、图文信息等。文本审核处理的违禁类型包括:政治、色情、暴力恐怖、广告推广、低俗辱骂。互联网上每天产生海量的用户数据,人力无法负担如此繁重的审核任务。文本审核系统利用计算机和自然语言处理技术,实现了自动化的内容违规检测和识别,主导或者辅助人工审核的功能,大大减少了相关人员的工作成本。
技术实现思路
[0003]本公开提供了一种训练文本审核模型的方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的第一方面,提供了一种训练文本审核模型的方法,包括:获取预训练语言模型、预训练语言微小模型、标注数据、无标注数据;将所述标注数据输入预训练语言模型进行有监督训练,得到教师模型;将所述标注数据输入预训练语言微小模型进行有监督训练,得到学生模型;将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型。
[0005]根据本公开的第二方面,提供了一种文本审核方法,包括:获取待审核的文本信息;将所述文本信息输入根据第一方面中任一项所述的方法训练出的文本审核模型,输出 ...
【技术保护点】
【技术特征摘要】
1.一种训练文本审核模型的方法,包括:获取预训练语言模型、预训练语言微小模型、标注数据、无标注数据;将所述标注数据输入预训练语言模型进行有监督训练,得到教师模型;将所述标注数据输入预训练语言微小模型进行有监督训练,得到学生模型;将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型。2.根据权利要求1所述的方法,其中,所述将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型,包括:将所述无标注数据输入所述教师模型,输出软标签向量;将所述无标注数据输入所述学生模型,输出预测概率向量;根据所述软标签向量和所述预测概率向量计算软标签蒸馏损失;基于所述软标签蒸馏损失调整所述学生模型的网络参数,得到文本审核模型。3.根据权利要求1所述的方法,其中,所述将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型,包括:获取所述教师模型的嵌入层第一输出向量和所述学生模型的嵌入层第二输出向量;计算所述嵌入层第一输出向量和所述嵌入层第二输出向量的均方误差作为嵌入层蒸馏损失;基于所述嵌入层蒸馏损失调整所述学生模型的网络参数,得到文本审核模型。4.根据权利要求1所述的方法,其中,所述将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型,包括:获取所述教师模型的隐含层第一输出向量和所述学生模型的隐含层第二输出向量;计算所述隐含层第一输出向量和所述隐含层第二输出向量的均方误差作为隐含层蒸馏损失;基于所述隐含层蒸馏损失调整所述学生模型的网络参数,得到文本审核模型。5.根据权利要求1所述的方法,其中,所述将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型,包括:对于所述无标注数据的每个元素,获取该元素在所述教师模型中的注意力第一矩阵和所述学生模型中的注意力第二矩阵;计算每个元素的注意力第一矩阵和注意力第二矩阵的均方误差作为注意力蒸馏损失;基于所述注意力蒸馏损失调整所述学生模型的网络参数,得到文本审核模型。6.根据权利要求1所述的方法,其中,所述将所述无标注数据分别输入所述教师模型和所述学生模型,使用教师模型对学生模型进行蒸馏,得到文本审核模型,包括:获取软标签蒸馏损失、嵌入层蒸馏损失、隐含层蒸馏损失、注意力蒸馏损失;基于软标签蒸馏损失、嵌入层蒸馏损失、隐含层蒸馏损失、注意力蒸馏损失的加权和调整所述学生模型的网络参数,得到文本审核模型。7.一种文本审核方法,包括:获取待审核的文本信息;将所述文本信息输入根据权利要求1
‑
6中任一项所述的方法训练出的文本审核模型,输出审核结果。
8.一种训练文本审核模型的装置,包括:获取单元,被配置成获取预训练语言模型、预训练语言微小模型、标注数据、无标注数据;第一训练单元,被配置成将所...
【专利技术属性】
技术研发人员:王赞博,曹宇慧,黄硕,陈永锋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。