一种预测问题回复质量并给与反馈的方法技术

技术编号：38617821 阅读：15 留言：0更新日期：2023-08-26 23:45

本发明专利技术涉及人工智能自然语言处理领域，提供了一种预测问题回复质量并给与反馈的方法。主旨在于解决现有方法虽然分析了文本内容，但是却忽略了文本以外的信息，最终文本分类准确性差的问题。主要方案包括获取待分类的文本数据集；对文本训练集进行向量化，得到原始文本的单词向量和标签的单词向量；基于得到的原始文本的单词向量和标签的单词向量，通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取，得到过滤的文本特征向量和过滤的标签特征向量；通过和交互，得到文本特定标签表示，结合过滤的文本特征，得到最终文本向量表示，训练多标签文本分类模型；利用训练好的模型对待分类文本数据集进行多标签文本分类。本分类。本分类。

全部详细技术资料下载

【技术实现步骤摘要】
一种预测问题回复质量并给与反馈的方法

[0001]本技术涉及人工智能自然语言处理领域，尤其涉及一种预测问题回复质量并给与反馈的方法。

技术介绍

[0002]调查问卷的问题设置对调查结果有巨大影响，好的问卷设计可用高效高质量地帮助使用者获取所需信息，反之，则会给问题调查工作带来巨大障碍，影响工作的正常进行。因此预测问题回复质量并给予反馈的技术至关重要，可以将其看作一个多标签文本分类任务进行研究。
[0003]多标签文本分类是自然语言处理中的一项关键任务。它广泛应用于情感识别、问题解答和网页标记等领域。它的目标是学习一种可以为未知文本分配适当多个标签的模型。与单标签分类相比，多标签分类方法可以更好地应用于现实生活，符合客观对象的特征和规律。然而，面对实际文本，标签的类别数量相当大，一些标签涉及的内容非常少，导致标签不平衡的问题很大，标签的输出空间会随着标签的数量呈指数增长。对于所有多标签文本分类问题，当需要更细粒度的标签分类时，还需要研究标签数量增加和标签不平衡的问题。现有的方法常常忽略标签之间的相关性，只考虑不同标签对同一文本的影响，因此它们没有很好地挖掘文本中涉及的多个标签之间的关系。因此，本文提出了一种基于隐藏空间数据和标签关联的多标签文本分类方法。多标签分类算法为一个样本分配多个标签，广泛应用于推荐系统、舆论分析、情感分类等领域。样本的不同标签之间通常存在相关性。如何在建模过程中学习标签之间的相关性是一个巨大的挑战。在新闻文本分类中，标签之间的关系是分层的。同时，每个标签与新闻文本的不同部分之间的关联程度...

【技术保护点】

【技术特征摘要】
1.一种预测问题回复质量并给与反馈的方法，其特征在于，包括以下步骤：步骤1、获取待分类的文本数据集,文本数据集包含多标签的文本训练集；步骤2、对文本训练集中的原始文本和文本训练集所对应标签集合中的标签分别进行向量化，得到原始文本的单词向量和标签的单词向量；步骤3、基于得到的原始文本的单词向量和标签的单词向量，通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取，得到过滤的文本特征向量和过滤的标签特征向量；步骤4、通过过滤的文本特征向量和过滤的标签特征向量交互，得到文本特定标签表示，根据文本特定标签表示和文本的真实标签之间的差异，多次训练多标签文本分类模型，更新模型参数，从而得到训练好的多标签文本分类模型，具体的公式如下：型，更新模型参数，从而得到训练好的多标签文本分类模型，具体的公式如下：型，更新模型参数，从而得到训练好的多标签文本分类模型，具体的公式如下：、、、分别为不同神经网络的线性映射参数，CrossAttention()表示一个交互式注意力机制，为用于进行判断的向量，为多类别映射函数，为偏移量，为最终类别结果，以一个向量进行表示，允许有类别的索引激活值为1，其余位置激活值为0；步骤5、利用训练好的多标签文本分类模型对待分类文本数据集进行多标签文本分类。2.根据权利要求1所述的一种预测问题回复质量并给与反馈的方法，其特征在于，步骤1中，对获取的待分类的文本数据集...

【专利技术属性】
技术研发人员：付立军，刘雨江，李旭，徐知非，侯卫国，
申请(专利权)人：中科智禾数字科技山东有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人