一种数据处理的方法以及相关装置制造方法及图纸

技术编号：22784194 阅读：18 留言：0更新日期：2019-12-11 04:24

本申请实施例公开了一种数据处理的方法以及相关装置，用于实现最终经过数据处理得到的目标出牌路径可以适用于不同的对战局面中，具有很强的通用性，并且从效益值上来决定目标出牌路径，对于玩家的手牌数据的质量要求并不是很严格。本申请实施例提供的数据处理的方法包括：获取第一玩家的第一手牌数据；基于第一手牌数据确定第一玩家的至少一个出牌动作；当至少一个出牌动作与预设麻将博弈树中的决策节点重合时，确定第二玩家、第三玩家以及第四玩家在分别接收第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值；基于第一状态值、第二状态值以及第三状态值确定目标出牌路径。

A method of data processing and related devices

The embodiment of the application discloses a data processing method and related devices, which are used to realize the target licensing path finally obtained through data processing, which can be applied to different war situations, has strong universality, and determines the target licensing path from the benefit value, and the quality requirements for the player's licensing data are not very strict. The data processing method provided by the embodiment of the application includes: obtaining the first hand data of the first player; determining at least one card issuing action of the first player based on the first hand data; determining that the second player, the third player and the fourth player receive at least one card issuing action of the first player respectively when at least one card issuing action coincides with the decision node in the preset mahjong game tree The first state value, the second state value and the third state value after the card corresponding to the card action; based on the first state value, the second state value and the third state value, determine the target licensing path.

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理的方法以及相关装置
本申请实施例涉及计算机
，具体涉及一种数据处理的方法以及相关装置。
技术介绍
麻将，是一种广为流行的益智牌类游戏，它属于非完美信息的博弈。一般麻将用具由一百多张牌和若干骰子组成，传统的麻将游戏是四位玩家在桌面上当面进行，一局游戏先后由洗牌、码牌、开牌和行牌等构成。随着计算机和互联网技术的发展，麻将游戏也有了新的玩法。基于互联网的麻将游戏，由游戏运营商的服务器和不计其数的玩家个人电脑构成。玩家通过互联网连接到游戏的服务器，输入自己唯一的用户名、密码，即可参与麻将游戏。基于互联网的麻将游戏，玩家不必因找不到玩伴，凑不成一桌开局而烦恼，也不必花时间关注洗牌、码牌、计分等环节，这些都会由电脑系统准确无误地完成，玩家只需集中注意力在行牌阶段即可。目前，基于互联网的麻将游戏通常需要由多个玩家参与到一个对局中来进行游玩，而目前存在的监督学习麻将AI系统通常需要大量的在各种不同局面下的人类对战数据来学习人类的对战，并且针对这些数据的质量要求也高，在现实中难以满足。然而，针对目前的监督学习麻将AI系统所需要数据质量的要求较高，在现实中难以具有通用性，所适应的局面也相对局限。
技术实现思路
本申请实施例提供了一种数据处理的方法以及相关装置，用于实现最终经过数据处理得到的目标出牌路径可以适用于不同的对战局面中，具有很强的通用性，并且从效益值上来决定目标出牌路径，对于玩家的手牌数据的质量要求并不是很严格。第一方面，本申请实施例提供了一种数据处理的方法，包括：<...

【技术保护点】
1.一种数据处理的方法，其特征在于，包括：/n获取第一玩家的第一手牌数据；/n基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作；/n当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时，确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值，所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值；/n基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。/n

【技术特征摘要】
1.一种数据处理的方法，其特征在于，包括：
获取第一玩家的第一手牌数据；
基于所述第一手牌数据确定所述第一玩家的至少一个出牌动作；
当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时，确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值，所述第一状态值、第二状态值以及第三状态值均用于表示所述第一玩家在执行所述至少一个出牌动作后得到的效益值；
基于所述第一状态值、第二状态值以及所述第三状态值确定目标出牌路径。

2.根据权利要求1所述的方法，其特征在于，所述决策节点包括玩家决策状态节点，当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时，确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值，包括：
当所述至少一个出牌动作与所述玩家决策状态节点重合时，确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一出牌动作、第二出牌动作以及第三出牌动作；
计算所述第一出牌动作的第一分值、所述第二出牌动作的第二分值以及所述第三出牌动作的第三分值；
确定所述第一分值为所述第一状态值、所述第二分值为所述第二状态值以及所述第三分值为所述第三状态值。

3.根据权利要求2所述的方法，其特征在于，基于所述第一状态值、第二状态以及所述第三状态值确定目标出牌路径，包括：
确定所述第一状态值、第二状态值以及所述第三状态值中的最大状态值；
将所述最大状态值所对应的出牌动作确定为所述目标出牌路径。

4.根据权利要求1所述的方法，其特征在于，所述决策节点包括规则决策节点，当所述至少一个出牌动作与预设麻将博弈树中的决策节点重合时，确定第二玩家、第三玩家以及第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第一状态值、第二状态值以及第三状态值，包括：
当所述至少一个出牌动作与所述规则决策节点重合时，确定所述第二玩家、所述第三玩家、所述第四玩家在分别接收所述第一玩家的至少一个出牌动作所对应的牌后的第四出牌动作、第五出牌动作以及第六出牌动作；
...

【专利技术属性】
技术研发人员：吕有为，钟涛，毛建博，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人