一种多阶段多任务的文本阅读理解方法及装置制造方法及图纸

技术编号：31926236 阅读：54 留言：0更新日期：2022-01-15 13:11

本发明专利技术是关于一种多阶段多任务的文本阅读理解方法及装置。该方法包括：采用第一训练集对文本分类模型进行预训练，第一训练集为同一业务方向的不同类型的题目；采用第二训练集对经过预训练的文本分类模型进行训练，第二训练集为相似业务方向的同类型的题目；使用文本分类模型对待预测文本进行预测，输出预测结果。本发明专利技术提供的技术方案，能够融合其他问题类型和其他业务方向的知识，增加了同业务方向的训练样本和同问题的回答范式，进一步提升模型效果；针对训练样本比较少的业务场景，可以有效利用到同业务的其他数据进行预训练，从而获取了更多的先验知识，有效提高了模型精度，降低了对特定训练数据集大小的依赖，适用于少样本的业务问题解决。样本的业务问题解决。样本的业务问题解决。

全部详细技术资料下载

【技术实现步骤摘要】
一种多阶段多任务的文本阅读理解方法及装置

[0001]本专利技术涉及文本处理领域，尤其涉及一种多阶段多任务的文本阅读理解方法及装置。

技术介绍

[0002]在如今这样一个人工智能蓬勃发展的时代，人们对智能问答、机器阅读理解越来越感兴趣，比如IBM沃森、百度小度音箱等等，训练出一款能够具备文本智能的机器成为各个公司展现实力的一种途径。然而如何提高多项选择阅读理解的准确性和全面性成为一个亟待解决的问题。
[0003]针对这一问题，目前采用的一种现有技术是通过FAQ的方式存储所有标准问答句，然后用户输入问句时，匹配最相似的问句，并返回相似问句的结果，作为答案返回给用户。这种现有技术的缺点在于，由于相似问句不等同于相同问句，容易造成错误回答，同时，面对多项选择题目，还存在选项和FAQ的回答不匹配的形式，需要进一步做处理。
[0004]目前采用的另一种现有技术的技术方案，是通过大规模预训练模型，将问题和选项拼接进行训练，然后输出CLS得到分类结果。这种现有技术的缺点在于，模型效果依赖特定训练数据的大小，不能从其他数据或者同类型的训练数据当中习得有效经验。

技术实现思路

[0005]本专利技术目的在于实现一种多阶段多任务学习模型，能够从其他类型数据和本类型其他业务数据当中吸取到有用知识，从而提高多项选择阅读理解的智能程度。
[0006]根据本专利技术实施例的第一方面，提供一种多阶段多任务的文本阅读理解方法，包括：
[0007]在粗调阶段，采用第一训练集对文本分类模型进行预训练，所述...

【技术保护点】

【技术特征摘要】
1.一种多阶段多任务的文本阅读理解方法，其特征在于，包括：在粗调阶段，采用第一训练集对文本分类模型进行预训练，所述第一训练集为与待预测文本属于同一业务方向的不同类型的题目；在多任务学习阶段，采用第二训练集对经过预训练的文本分类模型进行训练，所述第二训练集为所述待预测文本的相似业务方向的同类型的题目；使用完成训练的文本分类模型对所述待预测文本进行预测，输出预测结果。2.根据权利要求1所述的多阶段多任务的文本阅读理解方法，其特征在于，所述文本分类模型采用bert模型。3.根据权利要求1所述的多阶段多任务的文本阅读理解方法，其特征在于，所述第一训练集的题目类型为是非题或单选题，所述第二训练集的题目类型为单选题或多选题。4.根据权利要求1
‑
3任一项所述的多阶段多任务的文本阅读理解方法，其特征在于，在使用完成训练的文本分类模型对所述待预测文本进行预测之前，还包括：将所述待预测文本的数据处理成所述文本分类模型的编码器的输入格式。5.一种多阶段多任务的文本阅读理解装置，其特征在于，包括：粗调模块，用于在粗调阶段，采用第一训练集对文本分类模型进行预训练，所述第一训练集为与待预测文本属于同一业务方向的不同类型的题目；多任务学习模块，用于在多任务学习阶段，采用第二训练集对经过...

【专利技术属性】
技术研发人员：邓礼志，于皓，张杰，吴信东，吴明辉，
申请(专利权)人：上海明略人工智能集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人