本申请提供了一种数据处理方法、装置、设备及存储介质、程序产品,该方法包括:确定目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定目标候选行为的参考行为决策参数,若根据虚拟对象的历史行为序列确定目标候选行为满足衰减调整条件,则对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;根据多个候选行为中的各个候选行为的目标行为决策参数,确定各个候选行为的决策概率;根据虚拟对象的目标历史行为以及各个候选行为的决策概率,确定虚拟对象的目标执行行为。采用本申请,可确定出更加符合虚拟对象的特性和行为习惯的行为。特性和行为习惯的行为。特性和行为习惯的行为。
【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质、程序产品
[0001]本申请涉及计算机
,尤其涉及数据处理方法、数据处理装置、计算机设备及计算机可读存储介质、计算机程序产品。
技术介绍
[0002]非玩家角色(non
‑
player character,NPC)在电子游戏中是十分重要的部分,其不受真实玩家控制,而是由人工智能(artificial intelligence,AI)程序控制,可以模拟真实世界中的对象执行各种行为。目前对NPC行为的AI决策方式是通过对不同行为对应的数值进行加权评分,评分最高的行为作为AI决策的NPC执行行为。然而,通过这种AI决策方式确定出的NPC执行行为难以融合不同虚拟对象所具有的特性,导致NPC行为表现缺少灵活性。
技术实现思路
[0003]本申请实施例提供一种数据处理方法、装置、设备及存储介质、程序产品,可以确定出更加符合虚拟对象的特性和行为习惯的行为,这样有助于虚拟对象实现更加多样化、更加生动、以及更加自然的行为表现。
[0004]一方面,本申请实施例提供一种数据处理方法,该方法包括:针对目标候选行为,确定目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定目标候选行为的参考行为决策参数,若根据虚拟对象的历史行为序列确定目标候选行为满足衰减调整条件,则对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,目标候选行为为虚拟对象的多个候选行为中的任意一个,修正参数与虚拟对象的特性相关联;根据多个候选行为中的各个候选行为的目标行为决策参数,确定各个候选行为的决策概率;根据虚拟对象的目标历史行为以及各个候选行为的决策概率,从多个候选行为中确定虚拟对象的目标执行行为。
[0005]一方面,本申请实施例提供一种数据处理装置,该装置包括:
[0006]获取单元,用于获取虚拟对象的多个候选行为;
[0007]处理单元,用于针对目标候选行为,确定目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定目标候选行为的参考行为决策参数,若根据虚拟对象的历史行为序列确定目标候选行为满足衰减调整条件,则对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,目标候选行为为虚拟对象的多个候选行为中的任意一个,修正参数与虚拟对象的特性相关联;根据多个候选行为中的各个候选行为的目标行为决策参数,确定各个候选行为的决策概率;根据虚拟对象的目标历史行为以及各个候选行为的决策概率,从多个候选行为中确定虚拟对象的目标执行行为。
[0008]在一些实施例中,获取单元,还用于获取目标行为分量的初始行为决策参数,目标
行为分量为目标候选行为包括的多个行为分量中的任意一个;获取目标行为分量对应的区间参数和阈值参数,阈值参数用于指示目标行为分量的行为决策参数的变化折点;处理单元,还用于根据区间参数以及阈值参数将初始行为决策参数调整到基准范围内,得到目标行为分量的基础行为决策参数。
[0009]在一些实施例中,获取单元,还用于获取虚拟对象的历史行为序列,历史行为序列包括虚拟对象的M个已执行行为,M个已执行行为连续,且按照执行顺序从后往先的顺序排列,M个已执行行为中排在首位的已执行行为是虚拟对象最近一次执行的行为,M为正整数;处理单元,还用于若历史行为序列中存在目标候选行为,且目标候选行为排在前N位,则确定目标候选行为满足衰减调整条件;N是根据M和设定参数确定的,且N为小于M的正整数。
[0010]在一些实施例中,处理单元,还用于确定历史行为序列中目标候选行为的数量;若数量大于或等于第一阈值,则利用第一衰减参数对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;若数量小于第一阈值,则根据第一衰减参数确定第二衰减参数,并利用第二衰减参数对参考行为决策参数进行衰减调整,得到目标候选行为的目标行为决策参数;其中,第一衰减参数小于第二衰减参数。
[0011]在一些实施例中,处理单元,还用于若虚拟对象的目标历史行为包含于多个候选行为中,则从各个候选行为的决策概率中确定目标历史行为的目标决策概率;目标历史行为是虚拟对象最近一次执行的行为;若根据目标决策概率确定目标历史行为满足惯性触发条件,则将目标历史行为确定为虚拟对象的目标执行行为;若根据目标决策概率确定目标历史行为不满足所述惯性触发条件,则按照行为选取策略从多个候选行为中确定虚拟对象的目标执行行为。
[0012]在一些实施例中,处理单元,还用于若目标决策概率大于或等于第二阈值,则确定目标历史行为满足所述惯性触发条件;或者,若目标决策概率大于或等于第三阈值且小于第二阈值,则计算目标决策概率和第四阈值的乘积,若乘积大于各个候选行为的决策概率,则确定目标历史行为满足所述惯性触发条件;其中,第三阈值小于第二阈值,第二阈值小于第四阈值,第三阈值为第一程度选取的概率值,第二阈值为第二程度选取的概率值,第一程度小于第二程度。
[0013]在一些实施例中,处理单元,还用于根据各个候选行为的决策概率,从多个候选行为中确定决策概率小于第五阈值的第一候选行为;根据多个候选行为中除第一候选行为之外的各个第二候选行为的决策概率,从各个第二候选行为中随机确定虚拟对象的目标执行行为。
[0014]相应地,本申请实施例还提供了一种计算机设备,包括:处理器、通信接口和存储器,上述处理器、上述通信接口和上述存储器相互连接,其中,上述存储器存储有可执行程序代码,上述处理器用于调用所述可执行程序代码,实现本申请实施例中的方法。
[0015]相应地,本申请实施例还提供了一种计算机可读存储介质,该计算机读存储介质中存储有计算机程序,该计算机程序被处理器执行时,实现本申请实施例中的方法。
[0016]相应地,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机指令,该计算机程序或计算机指令被处理器执行时实现本申请实施例中的方法。
[0017]相应地,本申请实施例提供了一种计算机程序,该计算机程序包括计算机指令,该
计算机指令存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取计算机指令,处理器执行计算机指令,使得计算机设备执行本申请实施例中的方法。
[0018]通过实施本申请实施例,一方面,通过利用与虚拟对象的特性相关联的修正参数,对各个候选行为的基础行为决策参数进行修正处理,这样可以使得基于修正后的行为决策参数确定出的目标执行行为更加符合虚拟对象的特性。另一方面,在根据虚拟对象的历史行为序列确定候选行为满足衰减调整条件的情况下,对参考行为决策参数进行衰减调整,可以使得基于衰减调整得到的目标行为决策参数确定出的目标执行行为,能够一定程度地体现虚拟对象执行重复行为时产生的倦怠感,从而有利于增强虚拟对象的行为表现的真实性。除此之外,根据虚拟对象的目标历本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:针对目标候选行为,确定所述目标候选行为包括的各个行为分量的基础行为决策参数,利用修正参数对各个所述基础行为决策参数进行修正处理,并根据各个修正后的基础行为决策参数确定所述目标候选行为的参考行为决策参数,若根据所述虚拟对象的历史行为序列确定所述目标候选行为满足衰减调整条件,则对所述参考行为决策参数进行衰减调整,得到所述目标候选行为的目标行为决策参数;其中,所述目标候选行为为虚拟对象的多个候选行为中的任意一个,所述修正参数与所述虚拟对象的特性相关联;根据所述多个候选行为中的各个候选行为的目标行为决策参数,确定所述各个候选行为的决策概率;根据所述虚拟对象的目标历史行为以及所述各个候选行为的决策概率,从所述多个候选行为中确定所述虚拟对象的目标执行行为。2.如权利要求1所述的方法,其特征在于,所述确定所述目标候选行为包括的各个行为分量的基础行为决策参数,包括:针对目标行为分量,获取所述目标行为分量的初始行为决策参数,所述目标行为分量为所述目标候选行为包括的多个行为分量中的任意一个;获取所述目标行为分量对应的区间参数和阈值参数,所述阈值参数用于指示所述目标行为分量的行为决策参数的变化折点;根据所述区间参数以及所述阈值参数将所述初始行为决策参数调整到基准范围内,得到所述目标行为分量的基础行为决策参数。3.如权利要求1所述的方法,其特征在于,所述方法还包括:获取所述虚拟对象的历史行为序列,所述历史行为序列包括所述虚拟对象的M个已执行行为,所述M个已执行行为连续,且按照执行顺序从后往先的顺序排列,所述M个已执行行为中排在首位的已执行行为是所述虚拟对象最近一次执行的行为,M为正整数;若所述历史行为序列中存在所述目标候选行为,且所述目标候选行为排在前N位,则确定所述目标候选行为满足衰减调整条件;N是根据M和设定参数确定的,且N为小于M的正整数。4.如权利要求3所述的方法,其特征在于,所述对所述参考行为决策参数进行衰减调整,得到所述目标候选行为的目标行为决策参数,包括:确定所述历史行为序列中所述目标候选行为的数量;若所述数量大于或等于第一阈值,则利用第一衰减参数对所述参考行为决策参数进行衰减调整,得到所述目标候选行为的目标行为决策参数;若所述数量小于所述第一阈值,则根据所述第一衰减参数确定第二衰减参数,并利用所述第二衰减参数对所述参考行为决策参数进行衰减调整,得到所述目标候选行为的目标行为决策参数;其中,所述第一衰减参数小于所述第二衰减参数。5.如权利要求1
‑
4任一项所述的方法,其特征在于,所述根据所述虚拟对象的目标历史行为以及所述各个候选行为的决策概率,从所述多个候选行为中确定所述虚拟对象的目标执行行为,包括:若所述虚拟对象的目标历史行为包含于所述多个候选行为中,则从所述各个候选行为的决策概率中确定所述目标历史行为的目标决策概率;所述目标历史行为是所述虚拟对象
最近一次执行的...
【专利技术属性】
技术研发人员:周文瑾,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。