一种字牌游戏数据处理方法、系统及存储介质技术方案

技术编号:27579747 阅读:14 留言:0更新日期:2021-03-09 22:31
本发明专利技术提供一种字牌游戏数据处理方法、系统及存储介质,其方法包括:录入历史牌局数据,将历史牌局数据转换为二维数组形式,得到历史牌局数组;通过预设分类决策将历史牌局数组转换为训练特征数据;通过预设分类决策将待决策牌面特征数据转换为决策牌面特征数据;基于深度学习神经网络对训练特征数据进行训练,得到决策模型;根据决策模型对待决策牌面特征数据进行决策运算,输出决策。本发明专利技术能够从大量真人玩家历史牌局的数据中自动学习字牌游戏的出牌规则,无需将人类出牌的复杂逻辑判断编写为代码,也避免了各种逻辑漏洞和思维固化。也避免了各种逻辑漏洞和思维固化。也避免了各种逻辑漏洞和思维固化。

【技术实现步骤摘要】
一种字牌游戏数据处理方法、系统及存储介质


[0001]本专利技术主要涉及游戏数据处理
,具体涉及一种字牌游戏数据处理方法、系统及存储介质。

技术介绍

[0002]字牌是一种古老的传统纸牌游戏,尤其流行于桂柳地区,也称为桂林字牌。它是一种非完全信息博弈游戏,即参与游戏的任何一方无法获知游戏局面的全部信息,只能依据自身掌握的信息进行游戏决策。在联机网络游戏中,参与游戏的有可能不是真人玩家,而是一个能够依据牌面信息进行自动游戏决策的AI系统。如何构建可与真人玩家互动并且游戏体验良好的AI系统是一个非常富有挑战的问题。
[0003]目前游戏AI系统的常见实现方式包括有限状态机方法、行为决策树方法、启发式搜索方法等。但以上这些方法用于字牌游戏AI系统设计均存在不足,或要求AI系统预先考虑所有的牌面状态组合导致计算不可行,或要进行大量的搜索计算,或是决策函数很难设计且容易存在逻辑遗漏。

技术实现思路

[0004]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种字牌游戏数据处理方法、系统及存储介质。
[0005]本专利技术解决上述技术问题的技术方案如下:一种字牌游戏数据处理方法,包括:
[0006]录入历史牌局数据和待决策牌面数据;
[0007]将所述历史牌局数据转换为二维数组形式,得到历史牌局数组,通过预设分类决策将所述历史牌局数组转换为训练特征数据;
[0008]基于深度学习神经网络对所述训练特征数据进行训练,得到决策模型;
[0009]将所述决策牌面数据转换为二维数组形式,得到待决策牌面数组,通过预设分类决策将所述待决策牌面数组转换为决策牌面特征数据;
[0010]根据所述决策模型对所述待决策牌面特征数据进行决策运算,输出决策。
[0011]本专利技术解决上述技术问题的另一技术方案如下:一种字牌游戏数据处理系统,包括:
[0012]数据录入子系统,用于录入历史牌局数据和待决策牌面数据;
[0013]数据转换子系统,用于将所述历史牌局数据转换为二维数组形式,得到历史牌局数组,通过预设分类决策将所述历史牌局数组转换为训练特征数据;
[0014]数据训练子系统,用于基于深度学习神经网络对所述训练特征数据进行训练,得到决策模型;
[0015]所述数据转换子系统,还用于将所述决策牌面数据转换为二维数组形式,得到待决策牌面数组,通过预设分类决策将所述待决策牌面数组转换为决策牌面特征数据;
[0016]数据决策子系统,用于根据所述决策模型对所述待决策牌面特征数据进行决策运
算,输出决策。
[0017]本专利技术解决上述技术问题的另一技术方案如下:一种字牌游戏数据处理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的字牌游戏数据处理方法。
[0018]本专利技术解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的字牌游戏数据处理方法。
[0019]本专利技术的有益效果是:本专利技术能够将历史牌局数据和待决策牌面数据,将其转换成能供深度学习神经网络训练的特征数据,基于深度学习神经网络得到能够输出字牌动作方案的决策模型;本专利技术能够从大量真人玩家历史牌局的数据中自动学习字牌游戏的出牌规则,无需将人类出牌的复杂逻辑判断编写为代码,也避免了各种逻辑漏洞和思维固化。
附图说明
[0020]图1为本专利技术实施例提供的字牌游戏数据处理方法的示意性流程图;
[0021]图2为本专利技术实施例提供的字牌游戏数据处理系统的连接示意图;
[0022]图3为本专利技术实施例提供的采集牌局数据的示意性流程图;
[0023]图4为本专利技术实施例提供的决策输入特征数据转换的示意性流程图;
[0024]图5为本专利技术实施例提供的决策输出特征数据转换的示意性流程图;
[0025]图6为本专利技术实施例提供的训练出牌动作模型的示意性流程图。
具体实施方式
[0026]以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0027]图1为本专利技术实施例提供的字牌游戏数据处理方法的方法示意图。
[0028]如图1所示,基于深度学习神经网络的字牌游戏数据处理方法,包括:
[0029]录入历史牌局数据和待决策牌面数据;
[0030]将所述历史牌局数据转换为二维数组形式,得到历史牌局数组,通过预设分类决策将所述历史牌局数组转换为训练特征数据;
[0031]基于深度学习神经网络对所述训练特征数据进行训练,得到决策模型;
[0032]将所述决策牌面数据转换为二维数组形式,得到待决策牌面数组,通过预设分类决策将所述待决策牌面数组转换为决策牌面特征数据;
[0033]根据所述决策模型对所述待决策牌面特征数据进行决策运算,输出决策。
[0034]具体地,在深度学习神经网络的训练中需要用到大量的历史牌局数据,可能达到几千万甚至过亿个的牌局数据。为此,在记录完整牌局信息的前提下,需尽量减少存储的数据量。
[0035]下面结合附图3对采集牌局数据流程进行说明:
[0036]开始采集;
[0037]产生下一张动作牌;
[0038]记录下所有八十张牌的状态字节组成的数组;
[0039]将数组元素按时间先后顺序进行拼接;
[0040]判断是否胡牌,若是,采集结束,若否继续采集下一张动作牌;
[0041]从而得到历史牌局数据。
[0042]一次完整的字牌游戏过程,从庄家首次摸牌开始,到某一方胡牌(或者无人胡牌而牌已摸完)结束。
[0043]本专利技术以动作牌发生动作为时间截面,记录每张牌在该时刻的状态数据;在将所有动作牌的按照时间先后顺序依次记录之后,即可还原出游戏各方在游戏进行中的任何一个时刻,各自掌握的决策信息和决策结果。
[0044]每个时间截面的数据采集方法:记录每张牌(总共八十张牌)的状态,包括该张牌在谁手中(尚未发牌在牌堆中、在庄家处、在庄家的上家处、在庄家的下家处),该张牌是否当前发生动作,当前的动作是什么(无动作、摸牌、出牌、吃牌、碰牌、扫牌、开舵、胡牌)。用一个包含80个元素的数组可记录下所有八十张牌的全部状态数据,如把数组记为A=[a1,a2,

,a
80
],则每个数组元素的含义如表一所示:
[0045]表一:
[0046]a1牌“一”状态的字节数据a2牌“一”状态的字节数据a3牌“一”状态的字节数据a4牌“一”状态的字节数据a5牌“二”状态的字节数据a6牌“二”状态的字节数据a7牌“二”状态的字节数据a8牌“二”状态的字节数据a9牌“三”状态的字节数据a
10
牌“三”状态的字节数据a
11
牌“三”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字牌游戏数据处理方法,其特征在于,包括:录入历史牌局数据和待决策牌面数据;将所述历史牌局数据转换为二维数组形式,得到历史牌局数组,通过预设分类决策将所述历史牌局数组转换为训练特征数据;基于深度学习神经网络对所述训练特征数据进行训练,得到决策模型;将所述决策牌面数据转换为二维数组形式,得到待决策牌面数组,通过预设分类决策将所述待决策牌面数组转换为决策牌面特征数据;根据所述决策模型对所述待决策牌面特征数据进行决策运算,输出决策。2.根据权利要求1所述的字牌游戏数据处理方法,其特征在于,所述将所述历史牌局数据转换为二维数组形式的过程包括:所述历史牌局数据中包括相同时间截面的牌面数据,对应每一张字牌的牌面数据得到第i个元素a
i
,其中,i=1,2,

,80,每个元素a
i
为一个数组单元,其值为一个八位的单字节无符号整数,其中,第一位至第七位表示相同时间截面的牌面动作及其对应的牌面状态信息,第八位表示扩展信息;通过所述80个元素a
i
构建相同时间截面的数组,所述数组记为A=[a1,a2,

,a
80
];将所述历史牌局数据的多个时间截面数组按行进行二维拼接,得到历史牌局数组。3.根据权利要求2所述的字牌游戏数据处理方法,其特征在于,所述通过预设分类决策将所述历史牌局数组转换为训练特征数据的过程包括:从所述历史牌局数组中的牌面状态信息读取出以当前玩家为视角的多个牌面Xi,并根据设置的第一分类决策建立各个牌面Xi与第一分类决策的第一二维矩阵;从所述历史牌局数组中的牌面状态信息读取出以当前玩家的上家和当前玩家的下家为视角的多个牌面Yi,并根据设置的第二分类决策建立各个牌面Yi与第二分类决策的第二二维矩阵;根据所述第一分类决策和所述第二分类决策将第一二维矩阵和第二二维矩阵进行拼接,得到用于训练深度学习神经网络输入的总决策二维矩阵;从所述历史牌局数组中确定动作牌,根据所述动作牌的动作类型转换为用于训练深度学习神经网络输出的动作牌类型特征数据;将所述总决策二维矩阵和所述动作牌类型特征数据作为所述训练特征数据。4.根据权利要求3所述的字牌游戏数据处理方法,其特征在于,所述根据设置的第一分类决策建立各个牌面Xi与第一分类决策的第一二维矩阵的过程包括:通过各个牌面Xi对应的牌面状态信息与第一分类决策中的各个决策进行匹配,将匹配成功的牌面状态信息对应的牌面标记为1,将匹配失败的牌面状态信息对应的牌面标记为0,根据标记信息得到0和1的第一二维矩阵;根据设置的第二分类决策建立各个牌面Yi与第二分类决策的第二二维矩阵的过程包括:通过各个牌面Xi对应的牌面状态信息与第二分类决策中的各个决策进行匹配,将匹配成功的牌面状态信息对应的牌面标记为1,将匹配失败的牌面状态信息对应的牌面标记为0,根据标记信息得到0和1的第二二维矩阵。5.根据权利要求4所述的字牌游戏数据处理方法,其特征在于,所述第一分类决策包括
是否为当前玩家的手...

【专利技术属性】
技术研发人员:邱慧宁黄剑杨潇钟柱亮张玉珑谢明源莫隐强黄祥瑞
申请(专利权)人:桂林力港网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1