文本答案的推理方法、装置及存储介质制造方法及图纸

技术编号：38392579 阅读：9 留言：0更新日期：2023-08-05 17:45

本申请提供一种文本答案的推理方法、装置及存储介质，所述方法包括：输入第一文本到语言模型，获取所述语言模型输出的多个候选答案；所述第一文本为待识别的文本；以每一候选答案作为条件确定每一候选答案对应的验证分数；所述验证分数表示候选答案的置信度；输出最高验证分数对应的候选答案作为所述第一文本的推理答案。本申请提供的文本答案的推理方法、装置及存储介质，将语言模型生成的答案替换原始条件后，再次输入到语言模型中，从而验证答案。通过这种自我验证的方法，提高了语言模型输出结果的鲁棒性和准确性。模型输出结果的鲁棒性和准确性。模型输出结果的鲁棒性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本答案的推理方法、装置及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种文本答案的推理方法、装置及存储介质。

技术介绍

[0002]最近，随着思维链(Chain
‑
of
‑
thoughts，CoT)的推动，大型语言模型(Large language mode，LLM)，例如生成预训练转换器
‑
3(Generative Pre
‑
trained Transformer 3，GPT
‑
3)，在算术、常识和逻辑推理等自然语言处理任务中显示出强大的推理能力。简单来说，CoT可以让LLM模拟人类思考的过程，帮助大型语言模型生成一个推理路径，将复杂的推理问题分解为多个简单的步骤，而不仅仅只是一个最终答案，从而增强模型的推理能力。
[0003]虽然CoT可以使大型模型解决复杂的推理任务，但它对单个错误高度敏感，并且容易受到错误累积的影响。CoT中需要多步骤提示和多令牌预测，这在使用自回归机制处理复杂推理任务时可能缺乏鲁棒性。如果出现一个微小的错误，它会改变整个语句的含义偏差，导致错误答案。这在使用CoT解决多步骤精确推理时尤其有问题。

技术实现思路

[0004]本申请实施例提供一种文本答案的推理方法、装置及存储介质，用以解决相关技术在推理文本答案时鲁棒性低的技术问题。
[0005]第一方面，本专利技术提供一种文本答案的推理方法，包括：
[0006]输入第一文本到语言模型，获取所述语言模型输出...

【技术保护点】

【技术特征摘要】
1.一种文本答案的推理方法，其特征在于，包括：输入第一文本到语言模型，获取所述语言模型输出的多个候选答案；所述第一文本为待识别的文本；以每一候选答案作为条件确定每一候选答案对应的验证分数；所述验证分数表示候选答案的置信度；输出最高验证分数对应的候选答案作为所述第一文本的推理答案。2.根据权利要求1所述的文本答案的推理方法，其特征在于，所述以每一候选答案作为条件确定每一候选答案对应的验证分数，包括：以目标候选答案作为条件替换第一文本包括的第一条件集合中的一个目标条件，确定至少一个第二条件集合；所述目标候选答案为候选答案中的其中一个答案；基于每一第二条件集合，生成一个第二文本；所述第二文本包括的问题为所述目标条件对应的问题；输入一个第二文本到所述语言模型，获取所述语言模型输出的一个第二答案；基于所述第二答案确定所述目标候选答案对应的验证分数。3.根据权利要求2所述的文本答案的推理方法，其特征在于，所述基于所述第二答案确定所述目标候选答案对应的验证分数，包括：判断每一第二答案是否与对应的目标条件相同；在第二答案与对应的目标条件相同的情况下，所述目标候选答案对应的验证分数加一个单位；在第二答案与对应的目标条件不同的情况下，所述目标候选答案对应的验证分数不变。4.根据权利要求3所述的文本答案的推理方法，其特征在于，重复判断P次每一第二答案是否与对应的目标条件相同，P为大于1的正整数。5.根据权利要求2所述的文本答案的推理方法，其特征在于，所述基于每一第二条件集...

【专利技术属性】
技术研发人员：何世柱，赵军，刘康，翁诣轩，朱敏郡，夏飞，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人