内容理解模型的训练方法、内容理解方法以及相关装置制造方法及图纸

技术编号：37764343 阅读：15 留言：0更新日期：2023-06-06 13:22

本公开提供了一种内容理解模型的训练方法、内容理解方法以及相关装置，涉及人工智能技术领域，尤其涉及深度学习、知识图谱、知识获取与知识挖掘等技术领域。具体实现方案为：利用样本参考信息来生成样本数据，能够实现自动化地生成样本数据，能够极大地提升数据生成的效率，并采用样本数据来驱动内容理解模型的迭代优化，同时，利用内容理解模型所输出的内容理解结果，来反向指导数据生成的过程，提升了样本数据的质量，进一步地，质量更优的样本数据又可以作为内容理解模型新的输入，来优化内容理解模型的迭代过程，能够获得内容理解能力更优的模型，如此，数据生成过程和内容理解过程形成了优化闭环，能够实现数据生成和内容理解的双重优化。解的双重优化。解的双重优化。

全部详细技术资料下载

【技术实现步骤摘要】
内容理解模型的训练方法、内容理解方法以及相关装置

[0001]本公开涉及人工智能
，尤其涉及深度学习、知识图谱、知识获取与知识挖掘等
，具体涉及一种内容理解模型的训练方法、内容理解方法以及相关装置。

技术介绍

[0002]随着人工智能技术的快速发展进步，人们的生活也受益于人工智能产生了巨大改变，越来越多的行业(如医疗、电力、物流等)开始应用人工智能技术。其中，数据作为人工智能技术中最关键的要素，对数据进行内容理解也显得十分重要，以便人工智能技术能够更好地服务于人们的生活及各行各业。

技术实现思路

[0003]本公开提供了一种内容理解模型的训练方法、内容理解方法以及相关装置。
[0004]根据本公开的一方面，提供了一种内容理解模型的训练方法，该方法包括：
[0005]对初始模型进行迭代训练，以获得内容理解模型，该内容理解模型用于对数据资源进行内容识别以获得该数据资源的内容理解结果；
[0006]其中，任一次迭代训练包括如下过程：
[0007]根据样本参考信息生成样本数据；其中，响应于该任一次迭代训练为第一次迭代训练，该样本参考信息包括预设数据资源，响应于该任一次迭代训练为第一次之后的迭代训练，该样本参考信息包括该预设数据资源以及上一次迭代训练输出的内容理解结果；
[0008]将该样本数据输入上一次迭代训练后得到的内容理解模型中，以完成对模型的本次训练。
[0009]根据本公开的另一方面，提供了一种内容理解方法，该方法包括：
[0010]...

【技术保护点】

【技术特征摘要】
1.一种内容理解模型的训练方法，包括：对初始模型进行迭代训练，以获得内容理解模型，所述内容理解模型用于对数据资源进行内容识别以获得所述数据资源的内容理解结果；其中，任一次迭代训练包括如下过程：根据样本参考信息生成样本数据；其中，响应于所述任一次迭代训练为第一次迭代训练，所述样本参考信息包括预设数据资源，响应于所述任一次迭代训练为第一次之后的迭代训练，所述样本参考信息包括所述预设数据资源以及上一次迭代训练输出的内容理解结果；将所述样本数据输入上一次迭代训练后得到的内容理解模型中，以完成对模型的本次训练。2.根据权利要求1所述的方法，其中，所述样本数据包括基础样本数据、噪声数据及困难样本数据中至少一项；其中，所述基础样本数据通过对所述样本参考信息进行样本构建处理得到；所述噪声数据通过对所述基础样本数据进行数据增强处理得到；所述困难样本数据通过对所述基础样本数据进行困难样本挖掘处理得到。3.根据权利要求2所述的方法，其中，所述基础样本数据包括样本实体数据、样本分面数据、样本标签数据、样本三元组以及样本键值对；其中，所述样本实体数据用于表征数据对象的实体；所述样本分面数据用于从不同维度来表征所述数据对象；所述样本标签数据用于表征所述数据对象的实体特征；所述样本三元组用于以三元组的形式来表示所述数据对象；所述样本键值对用于以键值对的形式来表示所述数据对象。4.根据权利要求3所述的方法，其中，所述样本实体数据通过对所述样本参考信息进行实体识别处理、词法分析处理及术语挖掘处理中的至少一项处理得到；所述样本三元组根据所述样本实体数据所关联的实体信息生成；所述样本键值对根据所述样本实体数据所关联的实体信息生成；所述样本标签数据根据所述样本参考信息中的摘要信息生成；所述样本分面数据通过由所述样本参考信息所生成的检索词进行检索得到。5.根据权利要求2所述的方法，其中，所述困难样本挖掘处理的过程，包括：将所述基础样本数据输入困难样本挖掘模型，通过所述困难样本挖掘模型对所述基础样本数据进行困难样本挖掘处理，得到所述困难样本数据，所述困难样本挖掘模型提供有困难样本挖掘的功能。6.根据权利要求1所述的方法，其中，所述将所述样本数据输入上一次迭代训练后得到的内容理解模型中，以完成对模型的本次训练，包括：将所述样本数据输入上一次迭代训练后得到的内容理解模型中，以获得本次迭代训练输出的内容理解结果；根据本次迭代训练输出的内容理解结果以及所述样本数据中的样本信息，调整所述内容理解模型的模型参数，所述样本信息用于指示所述样本数据的内容信息。7.根据权利要求1至6任一项所述的方法，其中，所述内容理解模型包括基础内容理解模型、通用内容理解模型与行业内容理解模型中至少一项；其中，所述基础内容理解模型采用多任务统一训练的方式训练得到；所述通用内容理
解模型根据通用数据资源对所述基础内容理解模型进行训练得到；所述行业内容理解模型根据行业数据资源对所述基础内容理解模型进行训练得到。8.根据权利要求1至7任一项所述的方法，还包括：在满足预设条件的情况下，停止所述迭代训练；其中，所述预设条件包括下述条件中的至少一项：所生成的样本数据的数据量大于或等于预设数据量；所生成的样本数据的样本均衡度大于或等于预设均衡度，所述样本均衡度用于衡量样本分布的均衡程度；迭代次数大于或等于预设次数；所述内容理解模型的损失值小于预设阈值。9.一种内容理解方法，包括：获取待进行内容识别的数据资源；将所述数据资源输入内容理解模型，通过所述内容理解模型对所述数据资源进行内容识别，以获得所述数据资源的内容理解结果；其中，所述内容理解模型是采用样本数据对初始模型进行迭代训练得到的；所述样本数据根据样本参考信息生成，响应于第一次迭代训练，所述样本参考信息包括预设数据资源，响应于第一次之后的迭代训练，所述样本参考信息包括所述预设数据资源以及上一次迭代训练输出的内容理解结果。10.一种内容理解模型的训练装置，包括：训练模块，用于对初始模型进行迭代训练，以获得内容理解模型，所述内容...

【专利技术属性】
技术研发人员：王建华，杨宝山，贾桐，冯知凡，崔骁鹏，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人