AI模型的训练方法、使用方法、计算机设备及存储介质技术

技术编号：25441148 阅读：23 留言：0更新日期：2020-08-28 22:28

一种AI模型的训练方法、使用方法、计算机设备及存储介质，其中，所述训练方法包括：获取参与交互任务的用户对应的信息数据；从所述信息数据筛选出多个不同等级的训练数据；根据所述交互任务的任务节点和每个所述任务节点对应的动作节点，从每个等级的所述训练数据中提取对应的特征向量，其中，不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同；将所述特征向量输入至预设神经网络进行AI模型训练，直至所述AI模型收敛得到相应等级的AI模型。该训练方法可以减少AI模型训练使用时所需求的硬件资源，并提高AI模型的准确率以及用户的体验度。

全部详细技术资料下载

【技术实现步骤摘要】
AI模型的训练方法、使用方法、计算机设备及存储介质
本申请涉及AI
，尤其涉及一种AI模型的训练方法、使用方法、计算机设备及存储介质。
技术介绍
人工智能(ArtificialIntelligence，AI)技术自面世以来，其应用范围越来越广，比如目前已经将AI应用在双陆棋、国际跳棋、国际象棋、围棋等博弈类的应用程序中，并且达到超越人类职业选手的水平。相对于上述棋类博弈而言，扑克、桥牌、麻将等牌类对应的博弈则被认为是另一类博弈，在这些博弈类的应用程序中参与方的信息是不对称的，这类博弈被称为不完美信息博弈，对于这些不完美信息博弈类的应用程序也可以使用AI技术。但是，对于参与方的信息不对称的场景，AI模型的训练需要更多训练数据，并且需要依赖于运算量庞大的超级计算机才能完成，同时还无法保证AI模型的准确率，由此限制了AI技术在这些应用场景中的应用。因此，有必要提供一种AI模型的训练方法，以便减少AI模型训练使用时所需求的硬件资源，并提高AI模型的准确率。
技术实现思路
基于此，本申请提供了一种AI模型的训练方法、AI模型的使用方法、计算机设备及存储介质，以便在计算量较小的计算机设备中也可以进行模型训练，并提高AI模型的准确率。第一方面，本申请提供了一种AI模型的训练方法，所述方法包括：获取参与交互任务的用户对应的信息数据；从所述信息数据筛选出多个不同等级的训练数据；根据所述交互任务的任务节点和每个所述任务节点对应的动作节点，从每个等级的所述训练数据中提取对应...

【技术保护点】
1.一种AI模型的训练方法，其特征在于，所述方法包括：/n获取参与交互任务的用户对应的信息数据；/n从所述信息数据筛选出多个不同等级的训练数据；/n根据所述交互任务的任务节点和每个所述任务节点对应的动作节点，从每个等级的所述训练数据中提取对应的特征向量，其中，不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同；/n将所述特征向量输入至预设神经网络进行AI模型训练，直至所述AI模型收敛得到相应等级的AI模型。/n

【技术特征摘要】
1.一种AI模型的训练方法，其特征在于，所述方法包括：
获取参与交互任务的用户对应的信息数据；
从所述信息数据筛选出多个不同等级的训练数据；
根据所述交互任务的任务节点和每个所述任务节点对应的动作节点，从每个等级的所述训练数据中提取对应的特征向量，其中，不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同；
将所述特征向量输入至预设神经网络进行AI模型训练，直至所述AI模型收敛得到相应等级的AI模型。

2.根据权利要求1所述的方法，其特征在于，所述信息数据包括单局信息数据和局间信息数据，所述单局信息数据包括全局信息数据和当前用户信息数据，所述局间信息数据包括参与所述交互任务的多个用户的历史信息数据；
所述将所述特征向量输入至预设神经网络进行AI模型训练，包括：
对所述全局信息数据和所述当前用户信息数据对应的特征向量进行融合处理，得到第一特征向量；
将所述第一特征向量输入至预设神经网络的第一子神经网络，得到第一输出量；
将多个用户的历史信息数据对应的特征向量输入至所述预设神经网络的第二子神经网络得到多个特征输出量，以及将多个所述特征输出量进行融合处理得到第二输出量；
将所述第一输出量和第二输出量进行融合后输入至所述预设神经网络的第三子神经网络，得到输出结果。

3.根据权利要求2所述的方法，其特征在于，所述第一子神经网络、第二子神经网络和第三子神经网络为2层全连接层；
或者，所述第二子神经网络包括残差网络或长短期记忆网络。

4.根据权利要求1所述的方法，其特征在于，所述从所述信息数据筛选出多个不同等级的训练数据之前，包括：
对所述信息数据进行异常数据筛选，得到筛选后的信息数据，其中，所述异常数据包括中途掉线数据、中途离场数据和操作错误数据；
所述从所述信息数据筛选出多个不同等级的训练数据，包括：从所述筛选后的信息数据筛选出多个不同等级的训练数据。

5.根据权利要求1所述的方法，其特征在于，所述从所述信息数据筛选出多个不同等级的训练数据，包括：
获取用于评价用户的水平能力的评价参数；
根据所述评价参数，对所述信息数据进行分类，得到多个不同等级的训练数据。

6.根据权利要求1所述的方法，其特征在于，所述将所述特征向量输入至预设神经网络进行AI模型训练，直至所述AI模型收敛得到AI模型，包括：
随机确定所述交互任务的风格模式...

【专利技术属性】
技术研发人员：朱展图，周正，李宏亮，张正生，刘永升，
申请(专利权)人：超参数科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人