System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于链式推理,具体涉及基于强化反馈的链式推理方法、系统、设备及介质。
技术介绍
1、随着人工智的飞速发展,多模态数据(如文本和图像)处理已成为智能系统的重要研究方向。在许多应用中,如科学问答、知识图谱构建等,需要模型能够同时处理来自多种模态的信息,并通过链式推理生成逻辑连贯的推理步骤。然而,由于多模态数据的复杂性和信息的不对称性,现有模型在推理过程中往往难以有效整合多模态信息,也因此未能生成高质量的推理链。
2、目前,处理多模态链式推理的常用方法主要依赖于预训练的深度学习模型,通过直接生成推理步骤来推导最终的答案。这些方法虽然在一定程度上能够解决多模态信息的融合问题,但仍存在以下明显不足:首先,现有模型往往缺乏对推理过程的精细监督,容易在推理链中生成逻辑不连贯或错误的步骤;其次,模型缺乏有效的纠错机制,导致一旦出现推理错误,后续步骤难以纠正,最终影响整体推理的准确性和可靠性。此外,多模态特征之间的关联性在现有模型中未得到充分利用,这进一步限制了模型在复杂任务中的表现。
技术实现思路
1、本专利技术针对现有融合多模态信息的链式推理模型的准确性和可靠性不佳的不足,提供一种基于强化反馈的链式推理方法,提升链式推理模型在处理多模态信息时的准确性和可靠性。本专利技术同时提供一种基于强化反馈的系统、计算机设备及计算机可读存储介质。
2、为实现上述目的,本专利技术采用如下技术方案:基于教师模型强化反馈的链式推理方法,所述基于教师模型强化反馈的链式推理方法包括:<
...【技术保护点】
1.基于教师模型强化反馈的链式推理方法,其特征在于:所述基于教师模型强化反馈的链式推理方法包括:
2.根据权利要求1所述的基于教师模型强化反馈的链式推理方法,其特征在于:定义算法目标为:当给定样本问题q、对应的多模态信息c={ctext,cimage}和答案选项集合o={o1,o2,…,oK},生成链式推理步骤r={r1,r2,…,rP},并最终选择答案选项集合中的最优答案作为模型输出,ctext表示文本模态信息,cimage表示图像模态信息。
3.根据权利要求2所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤S2中,将样本问题的文本ctext输入预训练的文本编码器,提取该文本的特征表示Ftext={ftext1,ftext2,…,ftextM};
4.根据权利要求3所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤S3包括:
5.根据权利要求4所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤S32中,定义奖励函数为每个步骤的累计评分:
6.根据权利要求5所述的基于教师模型强化反馈的链式推理方
7.根据权利要求6所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤S4包括:
8.基于教师模型强化反馈的链式推理系统,其特征在于:所述基于教师模型强化反馈的链式推理系统包括:
9.计算机设备,包括处理器和存储介质,存储介质中存储有计算机程序,其特征在于:计算机程序被处理器执行时实现权利要求1至7中任一所述的基于教师模型强化反馈的链式推理方法。
10.计算机可读存储介质,其特征在于:其上存储有计算机程序,当计算机程序被执行时,实现权利要求1至7中任一所述的基于教师模型强化反馈的链式推理方法。
...【技术特征摘要】
1.基于教师模型强化反馈的链式推理方法,其特征在于:所述基于教师模型强化反馈的链式推理方法包括:
2.根据权利要求1所述的基于教师模型强化反馈的链式推理方法,其特征在于:定义算法目标为:当给定样本问题q、对应的多模态信息c={ctext,cimage}和答案选项集合o={o1,o2,…,ok},生成链式推理步骤r={r1,r2,…,rp},并最终选择答案选项集合中的最优答案作为模型输出,ctext表示文本模态信息,cimage表示图像模态信息。
3.根据权利要求2所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤s2中,将样本问题的文本ctext输入预训练的文本编码器,提取该文本的特征表示ftext={ftext1,ftext2,…,ftextm};
4.根据权利要求3所述的基于教师模型强化反馈的链式推理方法,其特征在于:步骤s3包括:
5...
【专利技术属性】
技术研发人员:张彩,杨涛,赵洲,韩嘉佳,孙翔,张瑞敏,李思雯,金涛,童凯,严伟才,陈建梅,徐珂,
申请(专利权)人:国网浙江省电力有限公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。