模型训练方法、模型训练平台、电子设备和存储介质技术

技术编号：28478247 阅读：52 留言：0更新日期：2021-05-15 21:47

本公开提供了一种模型训练方法、模型训练平台、电子设备和存储介质，可以用于人工智能领域，特别是自然语言处理领域和深度学习领域中。该模型训练方法包括：接收输入；基于输入来确定面向用户的预制功能；基于输入来确定模型训练功能；基于输入来确定预训练模型；基于输入来确定与预训练模型相关联的网络结构，以支持对预训练模型的使用；基于输入，使用预制功能、模型训练功能和预训练模型来训练模型；以及提供与经训练的模型相关联的输出。上述模型训练方法可以通过提供高效的模型训练、特别是深度学习模型训练的能力来提升用户体验。深度学习模型训练的能力来提升用户体验。深度学习模型训练的能力来提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、模型训练平台、电子设备和存储介质

[0001]本公开涉及计算机技术，并且更具体地，涉及模型训练方法、模型训练平台、电子设备和存储介质，可以用于人工智能领域，特别是自然语言处理领域和深度学习领域中。

技术介绍

[0002]近年来，人工智能领域中的、以预训练为代表的自然语言处理技术获得了爆发式发展，新技术和新模型层出不穷。在新时代背景下，如何将多样化的先进的自然语言处理领域科研成果高效地应用到产业实践中并解决实际问题，是自然语言处理领域中的核心问题。此外，深度学习是人工智能领域中的关键技术，研发人员通常基于深度学习框架来开展相关工作。
[0003]然而，传统的用于模型训练的方法和平台无法满足复杂的深度学习开发要求，并且因此无法满足用户对于高效模型训练方法和模型训练平台的需求。

技术实现思路

[0004]根据本公开的实施例，提供了一种模型训练方法、模型训练平台、电子设备和存储介质。
[0005]在本公开的第一方面中，提供了一种模型训练方法，包括：通过利用至少一种交互模式进行的交互来接收输入，交互模式与交互界面相关联；基于输入来确定面向用户的预制功能，预制功能与被训练的模型相关联；基于输入来确定支持进行模型训练所需的模型训练功能，模型训练功能与模型的训练过程相关联；基于输入来确定基于深度学习而被预先训练好的预训练模型；基于输入来确定与预训练模型相关联的网络结构，以支持对预训练模型的使用；基于输入，使用预制功能、模型训练功能和预训练模型来训练模型；以及通过利用至少一种交互模式进行的...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：通过利用至少一种交互模式进行的交互来接收输入，所述交互模式与交互界面相关联；基于所述输入来确定面向用户的预制功能，所述预制功能与被训练的模型相关联；基于所述输入来确定支持进行模型训练所需的模型训练功能，所述模型训练功能与所述模型的训练过程相关联；基于所述输入来确定基于深度学习而被预先训练好的预训练模型；基于所述输入来确定与所述预训练模型相关联的网络结构，以支持对所述预训练模型的使用；基于所述输入，使用所述预制功能、所述模型训练功能和所述预训练模型来训练模型；以及通过利用所述至少一种交互模式进行的交互来提供与经训练的所述模型相关联的输出。2.根据权利要求1所述的方法，其中所述交互包括以下一种或多种交互：与网络选择相关联的交互；与网络组装相关联的交互；与网络存储相关联的交互；与训练包组装相关联的交互；与训练任务启动相关联的交互；与鉴权相关联的交互；以及与统计相关联的交互。3.根据权利要求1所述的方法，还包括：接收与请求应用与关联于模型训练的功能相关联的配置信息。4.根据权利要求3所述的方法，其中接收与请求应用与关联于模型训练的功能相关联的配置信息包括以下一项或多项：导入所述配置信息；注册所述配置信息；基于所述配置信息进行json解析；以及基于所述配置信息进行类名匹配。5.根据权利要求1所述的方法，还包括：对接收的所述输入进行预处理。6.根据权利要求5所述的方法，其中对接收的所述输入进行预处理包括以下一项或多项：从所述输入读取数据集以用于预处理；从所述输入读取域以用于预处理；对所述输入进行分词以用于预处理；以及从所述输入获取词表以用于预处理。7.根据权利要求1所述的方法，还包括：使用对复杂学习任务的网络结构设计开发的支持。
8.根据权利要求7所述的方法，其中使用对复杂学习任务的网络结构设计开发的支持包括以下一项或多项：使用用于所述复杂学习任务的前向传播网络；使用用于所述网络结构设计开发的优化策略；以及使用用于所述网络结构设计开发的评估指标。9.根据权利要求1所述的方法，还包括：基于所述输入来调整与模型训练相关联的操作。10.根据权利要求9所述的方法，其中基于所述输入来调整与模型训练相关联的操作包括以下一项或多项：基于所述输入来调整与所述模型训练相关联的训练流程；基于所述输入来调整与所述模型训练相关联的评估流程；以及基于所述输入来调整与所述模型训练相关联的可视化评估。11.根据权利要求1所述的方法，还包括：使用与应用经训练的所述模型相关联的功能来应用经训练的所述模型。12.根据权利要求11所述的方法，其中使用与应用经训练的所述模型相关联的功能包括使用以下一种或多种功能：专用处理单元部署功能、中央处理单元部署功能、单条预测功能、批量预测功能、C++应用编程接口功能、以及Python应用编程接口功能。13.一种模型训练平台，包括：数据交互模块，被配置为提供至少一种交互模式，以支持从所述模型训练平台的外部接收输入以及向所述模型训练平台的所述外部提供输出，所述交互模式与交互界面相关联；交互支持模块，被配置为提供对所述数据交互模块与所述模型训练平台中的其他模块之间的交互的支持，所述交互与模型训练相关联；功能提供模块，被配置为提供面向用户的预制功能，所述预制功能与由所述模型训练平台训练的模型相关联；模型训练支持模块，被配置为提供支持使用所述模型训练平台进行模型训练所需的模型训练功能，所述模型训练功能与所述模型的训练过程相关联；预训练模型模块，...

【专利技术属性】
技术研发人员：龚建，孙宇，田浩，吴华，王海峰，佘俏俏，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人