AI模型的训练方法、使用方法、计算机设备及存储介质技术

技术编号:25441148 阅读:23 留言:0更新日期:2020-08-28 22:28
一种AI模型的训练方法、使用方法、计算机设备及存储介质,其中,所述训练方法包括:获取参与交互任务的用户对应的信息数据;从所述信息数据筛选出多个不同等级的训练数据;根据所述交互任务的任务节点和每个所述任务节点对应的动作节点,从每个等级的所述训练数据中提取对应的特征向量,其中,不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同;将所述特征向量输入至预设神经网络进行AI模型训练,直至所述AI模型收敛得到相应等级的AI模型。该训练方法可以减少AI模型训练使用时所需求的硬件资源,并提高AI模型的准确率以及用户的体验度。

【技术实现步骤摘要】
AI模型的训练方法、使用方法、计算机设备及存储介质
本申请涉及AI
,尤其涉及一种AI模型的训练方法、使用方法、计算机设备及存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)技术自面世以来,其应用范围越来越广,比如目前已经将AI应用在双陆棋、国际跳棋、国际象棋、围棋等博弈类的应用程序中,并且达到超越人类职业选手的水平。相对于上述棋类博弈而言,扑克、桥牌、麻将等牌类对应的博弈则被认为是另一类博弈,在这些博弈类的应用程序中参与方的信息是不对称的,这类博弈被称为不完美信息博弈,对于这些不完美信息博弈类的应用程序也可以使用AI技术。但是,对于参与方的信息不对称的场景,AI模型的训练需要更多训练数据,并且需要依赖于运算量庞大的超级计算机才能完成,同时还无法保证AI模型的准确率,由此限制了AI技术在这些应用场景中的应用。因此,有必要提供一种AI模型的训练方法,以便减少AI模型训练使用时所需求的硬件资源,并提高AI模型的准确率。
技术实现思路
基于此,本申请提供了一种AI模型的训练方法、AI模型的使用方法、计算机设备及存储介质,以便在计算量较小的计算机设备中也可以进行模型训练,并提高AI模型的准确率。第一方面,本申请提供了一种AI模型的训练方法,所述方法包括:获取参与交互任务的用户对应的信息数据;从所述信息数据筛选出多个不同等级的训练数据;根据所述交互任务的任务节点和每个所述任务节点对应的动作节点,从每个等级的所述训练数据中提取对应的特征向量,其中,不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同;将所述特征向量输入至预设神经网络进行AI模型训练,直至所述AI模型收敛得到相应等级的AI模型。第二方面,本申请还提供了一种AI模型的使用方法,应用于服务器,所述AI模型为采用上述的训练方法进行训练得到的模型,并部署在所述服务器中;所述方法包括:确定交互任务中AI用户所对应的任务节点以及所述任务节点对应的动作节点;获取所述交互任务中所有用户在所述确定的任务节点以及所述任务节点对应的动作节点下的信息数据;将所述信息数据输入至所述AI模型,以得到输出结果;将所述输出结果发送至所述AI用户,以使所述AI用户根据所述输出结果执行对应的动作。第三方面,本申请还提供了一种计算机设备,所述计算机设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现本申请的实施例提供的任一项所述AI模型的训练方法的步骤。此外,本申请还提供了另一种计算机设备,所述计算机设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现本申请的实施例提供的任一项所述AI模型的使用方法的步骤。第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的AI模型的训练方法,或者,实现本申请实施例提供的任一项所述的AI模型的使用方法。本申请实施例提供的一种AI模型的训练方法、AI模型的使用方法、计算机设备及存储介质,可以提高AI模型的准确率,同时该AI模型的训练对运算资源需求量较小,能够更好地在线服务大量用户,进而提高了用户的体验度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请的实施例提供的一种AI模型的训练使用的实施场景示意图;图2是本申请的实施例提供的另一种AI模型的训练使用的实施场景示意图;图3是本申请的实施例提供的一种AI模型的训练方法的步骤示意流程图;图4是本申请的实施例提供的大盲筹码的盈亏效果示意图;图5是本申请的实施例提供的筛选不同等级的训练数据的过程示意图;图6是本申请的实施例提供的另一种AI模型的训练方法的步骤示意流程图;图7是本申请的实施例提供的预设的神经网络的结构示意图;图8是本申请的实施例提供的一种AI模型的使用方法的步骤示意流程图;图9是本申请的实施例提供的AI模型训练使用部署的示意图;图10是本申请的实施例提供的一种计算机设备的示意框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。目前,已经将AI应用在双陆棋、国际跳棋、国际象棋、围棋等博弈类的应用程序中,并且达到超越人类职业选手的水平。相对于上述棋类博弈而言,扑克、桥牌、麻将等牌类对应的博弈则被认为是另一类博弈,在这些博弈类的应用程序中参与方的信息是不对称的,这类博弈被称为不完美信息博弈,对于这些不完美信息博弈类也可以使用AI技术。但是,专利技术人发现对于参与方的信息不对称的场景,AI模型的训练需要更多训练数据,并且需要依赖于运算量庞大的超级计算机才能完成,同时还无法保证AI模型的准确率,由此限制了AI技术在这些应用场景中的应用。因此,对于信息不对称的场景,比如不完美信息博弈类场景,如何进行AI模型训练,以确保AI模型的训练速度和效果,成为了本领域技术人员亟待解决的一个问题。为此,本申请实施例提供一种AI模型的训练方法、AI模型的使用方法、计算机设备和存储介质,以解决上述问题。在对本申请实施例进行详细介绍之前,先对本申请实施例涉及到的一些名词进行解释说明。由于在本申请实施例中将以AI模型应用在游戏场景为例进行介绍,因此还对涉及到游戏名词进行解释说明。需要说明的是,本申请实施例提供的AI模型并不局限于游戏场景,可以适合其他信息不对称的场景本文档来自技高网...

【技术保护点】
1.一种AI模型的训练方法,其特征在于,所述方法包括:/n获取参与交互任务的用户对应的信息数据;/n从所述信息数据筛选出多个不同等级的训练数据;/n根据所述交互任务的任务节点和每个所述任务节点对应的动作节点,从每个等级的所述训练数据中提取对应的特征向量,其中,不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同;/n将所述特征向量输入至预设神经网络进行AI模型训练,直至所述AI模型收敛得到相应等级的AI模型。/n

【技术特征摘要】
1.一种AI模型的训练方法,其特征在于,所述方法包括:
获取参与交互任务的用户对应的信息数据;
从所述信息数据筛选出多个不同等级的训练数据;
根据所述交互任务的任务节点和每个所述任务节点对应的动作节点,从每个等级的所述训练数据中提取对应的特征向量,其中,不同的所述任务节点以及不同的所述动作节点对应的特征向量的标签不同;
将所述特征向量输入至预设神经网络进行AI模型训练,直至所述AI模型收敛得到相应等级的AI模型。


2.根据权利要求1所述的方法,其特征在于,所述信息数据包括单局信息数据和局间信息数据,所述单局信息数据包括全局信息数据和当前用户信息数据,所述局间信息数据包括参与所述交互任务的多个用户的历史信息数据;
所述将所述特征向量输入至预设神经网络进行AI模型训练,包括:
对所述全局信息数据和所述当前用户信息数据对应的特征向量进行融合处理,得到第一特征向量;
将所述第一特征向量输入至预设神经网络的第一子神经网络,得到第一输出量;
将多个用户的历史信息数据对应的特征向量输入至所述预设神经网络的第二子神经网络得到多个特征输出量,以及将多个所述特征输出量进行融合处理得到第二输出量;
将所述第一输出量和第二输出量进行融合后输入至所述预设神经网络的第三子神经网络,得到输出结果。


3.根据权利要求2所述的方法,其特征在于,所述第一子神经网络、第二子神经网络和第三子神经网络为2层全连接层;
或者,所述第二子神经网络包括残差网络或长短期记忆网络。


4.根据权利要求1所述的方法,其特征在于,所述从所述信息数据筛选出多个不同等级的训练数据之前,包括:
对所述信息数据进行异常数据筛选,得到筛选后的信息数据,其中,所述异常数据包括中途掉线数据、中途离场数据和操作错误数据;
所述从所述信息数据筛选出多个不同等级的训练数据,包括:从所述筛选后的信息数据筛选出多个不同等级的训练数据。


5.根据权利要求1所述的方法,其特征在于,所述从所述信息数据筛选出多个不同等级的训练数据,包括:
获取用于评价用户的水平能力的评价参数;
根据所述评价参数,对所述信息数据进行分类,得到多个不同等级的训练数据。


6.根据权利要求1所述的方法,其特征在于,所述将所述特征向量输入至预设神经网络进行AI模型训练,直至所述AI模型收敛得到AI模型,包括:
随机确定所述交互任务的风格模式...

【专利技术属性】
技术研发人员:朱展图周正李宏亮张正生刘永升
申请(专利权)人:超参数科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1