System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理领域,具体涉及一种自动推进剧情和对话的数据处理方法、系统及设备。
技术介绍
1、虚拟情景剧由于提供了用户参与角色互动的功能,可以广泛应用于社交活动演练、儿童安全教育和演员培训等领域。
2、在自然语言处理过程中,常常涉及利用历史数据进行模型训练,大语言模型通过对海量数据的学习,能够模拟人类的语言能力,具备理解和生成自然语言的能力,可以用于各种文本生成任务,如机器翻译、自动摘要、对话系统和角色扮演等。
3、在基于大语言模型的剧情应用中,用户与机器虚拟角色进行的多轮对话可以被视为一系列的数据输入和输出。随着对话轮数的增加,处理这些数据变得更具挑战性,因为需要维护对话的连贯性和相关性。然而,当数据处理不当或模型无法理解对话的上下文时,可能会生成与主题无关的对话,这会导致用户的兴趣和参与度下降。
技术实现思路
1、为了解决现有技术中的上述问题,本专利技术提出了一种自动推进剧情和对话的数据处理方法、系统及设备,提高了用户的参与意愿。
2、本专利技术的第一方面,提出一种自动推进剧情和对话的数据处理方法,所述方法包括:
3、根据历史数据,判断是否需要切换剧情;
4、若需要切换剧情,则对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白;
5、若不需要切换剧情,则对所述历史数据进行处理判断是否应该由用户发言,并根据判断结果获取用户的发言或者生成新一轮的虚拟角色发言或旁白;
6、更新所
7、其中,所述历史数据包括:历史剧情和历史对话。
8、优选地,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
9、将所述历史数据输入到第一剧情引擎模型,生成新一轮的所述剧情内容;
10、将角色认知数据、所述剧情内容和历史数据输入到第一认知模型,输出更新后的所述角色认知数据;
11、将更新后的所述角色认知数据、所述剧情内容和历史数据输入到第一对话引擎模型,生成所述虚拟角色发言或所述旁白;
12、其中,所述角色认知数据包括:所述虚拟角色对自身的认知和对其他每一个角色的认知。
13、优选地,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
14、将所述历史数据和控制项目输入到第二剧情引擎模型,生成新一轮的所述剧情内容;
15、将角色认知数据、所述剧情内容和所述历史数据输入到第一认知模型,输出更新后的所述角色认知数据;
16、将更新后的所述角色认知数据、所述剧情内容和所述历史数据输入到第一对话引擎模型,生成所述虚拟角色发言或所述旁白;
17、其中,
18、所述控制项目由运营人员在后台设定,包括:与历史剧情的连贯性、受上一轮对话影响程度和有趣度。
19、优选地,“对所述历史数据进行处理判断是否应该由用户发言,并根据判断结果获取用户的发言或者生成新一轮的虚拟角色发言或旁白”的步骤包括:
20、将所述历史数据输入发言次序判断模型,判断是否应该由用户发言;
21、若是,则获取用户的发言;
22、否则,对所述历史数据进行处理生成新一轮的虚拟角色发言或旁白;
23、所述发言次序判断模型采用大语言模型,并已经过训练。
24、优选地,“对所述历史数据进行处理生成新一轮的虚拟角色发言或旁白”的步骤包括:
25、将角色认知数据和所述历史数据输入到第二认知模型,输出更新后的所述角色认知数据;
26、将更新后的所述角色认知数据和所述历史数据输入到第二对话引擎模型,生成所述虚拟角色发言或所述旁白。
27、优选地,“根据历史数据,判断是否需要切换剧情”的步骤包括:
28、将所述历史数据输入至剧情切换判断模型,分别输出在0轮、1轮、2轮、3轮和3轮以上对话之后进行剧情切换的概率;
29、若0轮切换的概率大于等于预设概率,或1轮、2轮、3轮和3轮以上切换的概率均小于0轮切换的概率,则判断为需要切换剧情;否则,判断为不需要切换剧情;
30、所述剧情切换判断模型采用大语言模型,且已经过训练,训练方法包括:
31、构建第一训练集,所述第一训练集包括:预设的第一数量的训练样本以及对应的切换概率标签;每个训练样本包括:一个剧情片段和相应的对话;所述切换概率标签包括:所述剧情片段分别在0轮、1轮、2轮、3轮和3轮以上对话之后进行切换的概率真实值;
32、从第一训练集中选取训练样本输入到所述剧情切换判断模型,得到输出结果;所述输出结果包括:所述剧情片段分别在0轮、1轮、2轮、3轮和3轮以上对话之后进行切换的概率预测值;
33、根据所述输出结果与所述切换概率标签计算第一损失函数,并调整模型参数;
34、重复执行,直到所述第一损失函数不再减小。
35、优选地,所述第一剧情引擎模型采用大语言模型,且已经过训练,训练方法包括:
36、构建第二训练集,所述第二训练集包括:预设的第二数量的训练样本;每个训练样本包括:一个剧情片段和相应的对话,以及与该剧情片段对应的下一个剧情片段;
37、基于所述第二训练集对所述第一剧情引擎模型进行训练。
38、优选地,所述第二剧情引擎模型采用大语言模型,且已经过训练,训练方法包括:
39、构建第三训练集,所述第三训练集包括:预设的第三数量的训练样本;每个训练样本包括:一个剧情片段和相应的对话、控制项目标签,以及与该剧情片段对应的下一个剧情片段;
40、基于所述第三训练集对所述第二剧情引擎模型进行训练;
41、其中,
42、所述控制项目标签包括:所述与历史剧情的连贯性、所述受上一轮对话影响程度和所述有趣度。
43、本专利技术的第二方面,提出一种自动推进剧情和对话的数据处理系统,所述系统包括:
44、判断模块,用于将历史数据输入到剧情切换判断模型,判断是否需要切换剧情;
45、第一生成模块,用于在需要切换剧情的情况下,对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白;
46、第二生成模块,用于在不需要切换剧情的情况下,对所述历史数据进行处理判断是否应该由用户发言,并根据判断结果获取用户的发言或者生成新一轮的虚拟角色发言或旁白;
47、控制模块,用于更新所述历史数据,控制所述判断模块以及所述第一生成模块/所述第二生成模块重复执行;
48、其中,所述历史数据包括:历史剧情和历史对话。
49、本专利技术的第三方面,提出一种计算机可读存储设备,存储有能够被处理器加载并执行如上面所述方法的计算机程序。
50、本专利技术具有如本文档来自技高网...
【技术保护点】
1.一种自动推进剧情和对话的数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
3.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
4.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理判断是否应该由用户发言,并根据判断结果获取用户的发言或者生成新一轮的虚拟角色发言或旁白”的步骤包括:
5.根据权利要求4所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理生成新一轮的虚拟角色发言或旁白”的步骤包括:
6.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“根据历史数据,判断是否需要切换剧情”的步骤包括:
7.根据权利要求2所述的自动推进剧情和对话的数据处理方法,其特征在于,所述第一剧情引擎模型
8.根据权利要求3所述的自动推进剧情和对话的数据处理方法,其特征在于,所述第二剧情引擎模型采用大语言模型,且已经过训练,训练方法包括:
9.一种自动推进剧情和对话的数据处理系统,其特征在于,所述系统包括:
10.一种计算机可读存储设备,其特征在于,存储有能够被处理器加载并执行如权利要求1-8中任一项所述方法的计算机程序。
...【技术特征摘要】
1.一种自动推进剧情和对话的数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
3.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理生成新一轮的剧情内容以及虚拟角色发言或旁白”的步骤包括:
4.根据权利要求1所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史数据进行处理判断是否应该由用户发言,并根据判断结果获取用户的发言或者生成新一轮的虚拟角色发言或旁白”的步骤包括:
5.根据权利要求4所述的自动推进剧情和对话的数据处理方法,其特征在于,“对所述历史...
【专利技术属性】
技术研发人员:张正锋,郑达奇,吕正东,
申请(专利权)人:杭州数令集科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。