游戏角色的行为控制方法、装置和电子设备制造方法及图纸

技术编号：38377746 阅读：19 留言：0更新日期：2023-08-05 17:37

本发明专利技术提供了一种游戏角色的行为控制方法、装置和电子设备；其中，该方法包括：获取目标游戏的当前状态数据；将当前状态数据输入至预先训练完成的机器学习模型中，得到第一输出结果；其中，第一输出结果中包括：多个预设行为操作对应的概率；获取机器学习模型的指定数量的历史输出结果；将第一输出结果和历史输出结果输入至预先训练完成的条件随机场模型中，得到目标行为操作。该方式中，将机器学习模型和条件随机场模型相结合，机器学习模型和条件随机场模型均能建立状态和行为操作之间的关系，条件随机场模型还能建立行为操作之间的时序关系，可以使游戏AI的智能化程度较高；同时模型结构简单且易收敛，具有较强的应用性。具有较强的应用性。具有较强的应用性。

全部详细技术资料下载

【技术实现步骤摘要】
游戏角色的行为控制方法、装置和电子设备

[0001]本专利技术涉及游戏
，尤其是涉及一种游戏角色的行为控制方法、装置和电子设备。

技术介绍

[0002]游戏AI(Artificial Intelligence，人工智能)也称为虚拟玩家，通过机器学习技术训练游戏AI模型，通过游戏AI模型控制游戏角色，使得该游戏角色的行为与真实玩家控制的游戏角色行为相似。游戏角色的前后行为通常具有关联性，因而，使用时序模型训练游戏AI模型，可以使游戏AI模型控制的游戏角色智能表现更佳。
[0003]相关技术中，RNN(Recurrent Neural Network，循环神经网络)和LSTM(Long Short
‑
Term Memory，长短期记忆网络)模型可以在一定程度上建立输入数据和输出数据之间的关系，但难以建立输出数据的时序连续性，影响模型运行时的智能化程度；LSTM和CRF(Conditional Random Field，条件随机场)损失函数可以建立输入数据和输出数据、以及输出数据之间的时序关系，但模型复杂度高，难以有效收敛，导致模型的应用性较差。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种游戏角色的行为控制方法、装置和电子设备，以使游戏AI的智能化程度较高，同时使模型结构简单且易收敛，具有较强的应用性。
[0005]第一方面，本专利技术实施例提供了一种游戏角色的行为控制方法，方法包括：获取目标游戏的当前状态数据；将当前状态数据输入至预先训练完成的...

【技术保护点】

【技术特征摘要】
1.一种游戏角色的行为控制方法，其特征在于，所述方法包括：获取目标游戏的当前状态数据；将所述当前状态数据输入至预先训练完成的机器学习模型中，得到第一输出结果；其中，所述第一输出结果中包括：多个预设行为操作对应的概率；获取所述机器学习模型的指定数量的历史输出结果；其中，所述历史输出结果基于所述目标游戏的历史状态数据得到；将所述第一输出结果和所述历史输出结果输入至预先训练完成的条件随机场模型中，得到目标行为操作；其中，所述目标行为操作包含在所述多个预设行为操作中，所述目标行为操作用于控制目标游戏角色的行为。2.根据权利要求1所述的方法，其特征在于，所述当前状态数据包括：所述目标游戏角色的位置数据、生命值数据、物理攻击强度数据、法术攻击强度数据、物理防御力数据、法术防御力数据中的一种或多种。3.根据权利要求1所述的方法，其特征在于，所述机器学习模型通过下述方式训练得到：获取第一训练数据；其中，所述第一训练数据包括：所述目标游戏中指定游戏角色的多个游戏帧中的状态数据，以及所述状态数据对应的所述指定游戏角色的行为操作；将所述第一训练数据中的状态数据输入至所述机器学习模型的初始模型中，得到第二输出结果；将所述第一训练数据中的行为操作作为标签信息，基于所述第二输出结果和所述标签信息对所述初始模型的模型参数进行训练，直至所述初始模型收敛，得到训练完成的所述机器学习模型。4.根据权利要求1所述的方法，其特征在于，将所述第一输出结果和所述历史输出结果输入至预先训练完成的条件随机场模型中，得到目标行为操作的步骤，包括：将所述第一输出结果输入至预设的数据队列中；其中，所述数据队列具有指定长度，所述数据队列中保存有至少一个历史输出结果，所述数据队列中的数据按照输入先后顺序排列，如果输入至所述数据队列中的数据超出所述指定长度，最先输入至所述数据队列中的数据被删除；如果所述数据队列中的数据达到所述指定长度，将所述数据队列中的数据输入至预先训练完成的条件随机场模型中，输出目标行为操作。5.根据权利要求4所述的方法，其特征在于，如果所述数据队列中的数据达到所述指定长度，将所述数据队列中的数据输入至预先训练完成的条件随机场模型中，输出目标行为操作的步骤，包括：如果所述数据队列中的数据达到所述指定长度，将所述数据队列中的数据输入至预先训练完成的条件随机场模型中，输出所述数据队列中每个历史输出结果对应的行为操作标签，以及所述第一输出结果对应的行为操作标签；将所述第一输出结果对应的行为操作标签指示的行为操作，确定为目标行为操作。6.根据权利要求4所述的方法，其特征在于，所述方法还包括：如果所述数据队列中的数据没有达到所述指定长度，将所述...

【专利技术属性】
技术研发人员：蔡康，
申请(专利权)人：网易杭州网络有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人