【技术实现步骤摘要】
文本分类方法、装置以及设备
[0001]本公开涉及人工智能
,具体涉及自然语言处理、深度学习和人工智能生成等
技术介绍
[0002]文本合理性判定指的是判定一段文本是否是合理的,是否存在错误,是否存在不实的问题。目前,通过构建机器学习模型能够进行文本合理性判定。例如,构建二分类模型或多分类模型来判定文本是否合理。对于二分类模型,若预测结果是1,则判定文本合理;若预测结果是0,则判定文本不合理。
技术实现思路
[0003]本公开实施例提出了一种文本分类方法、装置、设备、存储介质以及程序产品。
[0004]第一方面,本公开实施例提出了一种文本分类方法,包括:获取目标文本;对目标文本进行理解,得到目标文本的理解结果;基于目标文本的理解结果和与目标文本关联的参考信息进行校验,得到校验结果;基于校验结果,确定目标文本的合理性类别。
[0005]第二方面,本公开实施例提出了一种文本分类装置,包括:获取模块,被配置成获取目标文本;理解模块,被配置成对目标文本进行理解,得到目标文本的理解结果;校验模块,被配置成基于目标文本的理解结果和与目标文本关联的参考信息进行校验,得到校验结果;第一分类模块,被配置成基于校验结果,确定目标文本的合理性类别。
[0006]第三方面,本公开实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类方法,包括:获取目标文本;对所述目标文本进行理解,得到所述目标文本的理解结果;基于所述目标文本的理解结果和与所述目标文本关联的参考信息进行校验,得到校验结果;基于所述校验结果,确定所述目标文本的合理性类别。2.根据权利要求1所述的方法,其中,所述基于所述目标文本的理解结果和与所述目标文本关联的参考信息进行校验,得到校验结果,包括:基于所述目标文本的理解结果,识别所述目标文本的至少两种句子成分;获取所述至少两种句子成分中的一种句子成分对应的知识,以及基于所述一种句子成分的知识对其他句子成分进行校验,得到句子成分校验结果。3.根据权利要求2所述的方法,其中,所述获取所述至少两种句子成分中的一种句子成分对应的知识,以及基于所述一种句子成分的知识对其他句子成分进行校验,得到句子成分校验结果,包括:若所述至少两种句子成分包括主语和谓语,利用链指技术将所述主语链指到所述主语对应的知识,以及检测所述主语对应的知识中是否包含与所述谓语相关的信息,得到谓语校验结果;若所述至少两种句子成分包括主语和宾语,利用链指技术将所述主语链指到所述主语对应的知识,以及检测所述主语对应的知识中是否包含与所述宾语相关的信息,得到宾语校验结果。4.根据权利要求2所述的方法,其中,所述对所述目标文本进行理解,得到所述目标文本的理解结果,包括:将所述目标文本输入至知识标注模型,得到所述目标文本的特征标注序列。5.根据权利要求4所述的方法,其中,所述对所述目标文本进行理解,得到所述目标文本的理解结果,还包括:将所述目标文本输入至主题分类模型,得到所述目标文本的主题;和/或将所述目标文本输入至意图分类模型,得到所述目标文本的意图。6.根据权利要求1所述的方法,其中,所述获取目标文本,包括:获取参考信息,确定与所述参考信息关联的目标文本;以及所述基于所述目标文本的理解结果和与所述目标文本关联的参考信息进行校验,得到校验结果,包括:对所述参考信息进行理解,得到所述参考信息的理解结果;对所述参考信息的理解结果和所述目标文本的理解结果进行一致性校验,得到一致性校验结果。7.根据权利要求6所述的方法,其中,所述获取参考信息,确定与所述参考信息关联的目标文本,包括:获取用户查询信息,以及确定与所述用户查询信息对应的推送信息,作为所述目标文本;和/或获取输入文本,以及将所述输入文本输入至人工智能生成模型,得到输出文本,作为所
述目标文本。8.根据权利要求7所述的方法,其中,所述对所述目标文本进行理解,得到所述目标文本的理解结果,包括:将所述目标文本输入至知识标注模型,得到所述目标文本的特征标注序列;和/或将所述目标文本输入至主题分类模型,得到所述目标文本的主题;和/或将所述目标文本输入至意图分类模型,得到所述目标文本的意图。9.根据权利要求1
‑
8中任一项所述的方法,其中,所述方法还包括:将所述目标文本输入至风险分类模型,得到所述目标文本的风险类别结果;基于所述风险类别结果,确定所述目标文本的合理性类别。10.一种文本分类装置,包括:获取模块,被配置成获取目标文本;理解模块,被配置成对所述目标文本进行理解,得到所述目标文本的理解结果;校验模块,被配置成基于所述目标文本的理解结果和与所述目标文本关联的参考信息进行校验,得到校验结果;第一分类模块,被配置...
【专利技术属性】
技术研发人员:林泽南,赵岷,傅瑜,张国鑫,秦华鹏,蒋烨,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。