一种数据处理的方法以及相关装置制造方法及图纸

技术编号:22784194 阅读:18 留言:0更新日期:2019-12-11 04:24
本申请实施例公开了一种数据处理的方法以及相关装置,用于实现最终经过数据处理得到的目标出牌路径可以适用于不同的对战局面中,具有很强的通用性,并且从效益值上来决定目标出牌路径,对于玩家的手牌数据的质量要求并不是很严格。本申请实施例提供的数据处理的方法包括:获取第一玩家的第一手牌数据;基于第一手牌数据确定第一玩家的至少一个出牌动作;当至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值;基于第一状态值、第二状态值以及第三状态值确定目标出牌路径。

A method of data processing and related devices

The embodiment of the application discloses a data processing method and related devices, which are used to realize the target licensing path finally obtained through data processing, which can be applied to different war situations, has strong universality, and determines the target licensing path from the benefit value, and the quality requirements for the player's licensing data are not very strict. The data processing method provided by the embodiment of the application includes: obtaining the first hand data of the first player; determining at least one card issuing action of the first player based on the first hand data; determining that the second player, the third player and the fourth player receive at least one card issuing action of the first player respectively when at least one card issuing action coincides with the decision node in the preset mahjong game tree The first state value, the second state value and the third state value after the card corresponding to the card action; based on the first state value, the second state value and the third state value, determine the target licensing path.

【技术实现步骤摘要】
一种数据处理的方法以及相关装置
本申请实施例涉及计算机
,具体涉及一种数据处理的方法以及相关装置。
技术介绍
麻将,是一种广为流行的益智牌类游戏,它属于非完美信息的博弈。一般麻将用具由一百多张牌和若干骰子组成,传统的麻将游戏是四位玩家在桌面上当面进行,一局游戏先后由洗牌、码牌、开牌和行牌等构成。随着计算机和互联网技术的发展,麻将游戏也有了新的玩法。基于互联网的麻将游戏,由游戏运营商的服务器和不计其数的玩家个人电脑构成。玩家通过互联网连接到游戏的服务器,输入自己唯一的用户名、密码,即可参与麻将游戏。基于互联网的麻将游戏,玩家不必因找不到玩伴,凑不成一桌开局而烦恼,也不必花时间关注洗牌、码牌、计分等环节,这些都会由电脑系统准确无误地完成,玩家只需集中注意力在行牌阶段即可。目前,基于互联网的麻将游戏通常需要由多个玩家参与到一个对局中来进行游玩,而目前存在的监督学习麻将AI系统通常需要大量的在各种不同局面下的人类对战数据来学习人类的对战,并且针对这些数据的质量要求也高,在现实中难以满足。然而,针对目前的监督学习麻将AI系统所需要数据质量的要求较高,在现实中难以具有通用性,所适应的局面也相对局限。
技术实现思路
本申请实施例提供了一种数据处理的方法以及相关装置,用于实现最终经过数据处理得到的目标出牌路径可以适用于不同的对战局面中,具有很强的通用性,并且从效益值上来决定目标出牌路径,对于玩家的手牌数据的质量要求并不是很严格。第一方面,本申请实施例提供了一种数据处理的方法,包括:<br>获取第一玩家的第一手牌数据;基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作;当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值;基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。本申请实施例第二方面提供一种数据处理的装置,包括:获取单元,获取第一玩家的第一手牌数据;第一确定单元,用于基于所述获取单元获取到的所述第一手牌数据确定所述第一玩家的至少一个出牌动作;第二确定单元,用于在所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值;第三确定单元,用于基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,所述决策节点包括玩家决策状态节点,所述第二确定单元,包括;第一确定模块,用于当所述至少一个出牌动作与所述玩家决策状态节点重合时,确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一出牌动作、第二出牌动作以及第三出牌动作;计算模块,用于计算所述第一出牌动作的第一分值、所述第二出牌动作的第二分值以及所述第三出牌动作的第三分值;所述第一确定模块,用于确定所述第一分值为所述第一状态值、所述第二分值为所述第二状态值以及所述第三分值为所述第三状态值。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,所述第三确定单元,包括:第二确定模块,用于确定所述第一状态值、第二状态值以及所述第三状态值中的最大状态值;所述第二确定模块,用于将所述最大状态值所对应的出牌动作确定为所述目标出牌路径。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,所述决策节点包括规则决策节点,所述第二确定单元,包括:第三确定模块,用于在所述至少一个出牌动作与所述规则决策节点重合时,确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第四出牌动作、第五出牌动作以及第六出牌动作;第二计算模块,用于计算所述第四出牌动作的第四分值、所述第五出牌动作的第五分值以及所述第六出牌动作的第六分值;所述第三确定模块,用于将所述第四出牌动作与所述第四分值确定为所述第一状态值、将所述第五出牌动作与所述第五分值确定为所述第二状态值以及将所述第六出牌动作与所述第六分值确定为所述第三状态值。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,所述第三确定单元,包括:第四确定模块,用于根据预设麻将规则确定所述第四出牌动作、所述第五出牌动作以及所述第六出牌动作中的最高优先级动作;所述第四确定模块,用于将所述最高优先级动作所对应的出牌动作确定为所述目标出牌路径。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,所述数据处理的装置还包括第一处理单元;所述第一处理单元,用于在将所述最大状态值所对应的出牌动作确定为所述目标出牌路径之后,根据预设训练模型对所述第一手牌数据进行训练,以得到第一训练结果,所述第一训练结果用于标识所述第一玩家、所述第二玩家、所述第三玩家以及所述第四玩家的效益值;根据所述第一训练结果对所述第一状态值、所述第二状态值以及所述第三状态值进行更新。在一种可能的设计中,在本申请实施例的第二方面的一种实现方式中,还包括第二处理单元,所述第二处理单元,用于在将所述最高优先级动作所对应的出牌动作确定为所述目标出牌路径之后,根据预设训练模型对所述第一手牌数据进行训练,以得到第二训练结果,所述第二训练结果用于标识所述第一玩家、所述第二玩家、所述第三玩家以及所述第四玩家的效益值;当将所述第二训练结果沿着所述目标出牌路径回传至所述规则决策节点时,根据所述第二训练结果对所述第一状态值、所述第二状态值以及所述第三状态值进行更新。本申请实施例第三方面提供了一种计算机设备,包括:存储器、收发器、处理器以及总线系统;其中,存储器用于存储程序;处理器用于执行存储器中的程序,包括如下步骤:获取第一玩家的第一手牌数据;基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作;当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值;基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径;总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。本申请实施例第四方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当本文档来自技高网...

【技术保护点】
1.一种数据处理的方法,其特征在于,包括:/n获取第一玩家的第一手牌数据;/n基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作;/n当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值;/n基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。/n

【技术特征摘要】
1.一种数据处理的方法,其特征在于,包括:
获取第一玩家的第一手牌数据;
基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作;
当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值;
基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。


2.根据权利要求1所述的方法,其特征在于,所述决策节点包括玩家决策状态节点,当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,包括:
当所述至少一个出牌动作与所述玩家决策状态节点重合时,确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一出牌动作、第二出牌动作以及第三出牌动作;
计算所述第一出牌动作的第一分值、所述第二出牌动作的第二分值以及所述第三出牌动作的第三分值;
确定所述第一分值为所述第一状态值、所述第二分值为所述第二状态值以及所述第三分值为所述第三状态值。


3.根据权利要求2所述的方法,其特征在于,基于所述第一状态值、第二状态以及所述第三状态值确定目标出牌路径,包括:
确定所述第一状态值、第二状态值以及所述第三状态值中的最大状态值;
将所述最大状态值所对应的出牌动作确定为所述目标出牌路径。


4.根据权利要求1所述的方法,其特征在于,所述决策节点包括规则决策节点,当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时,确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值,包括:
当所述至少一个出牌动作与所述规则决策节点重合时,确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第四出牌动作、第五出牌动作以及第六出牌动作;
...

【专利技术属性】
技术研发人员:吕有为钟涛毛建博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1