一种数据的处理方法、装置及电子设备制造方法及图纸

技术编号：43293694 阅读：18 留言：0更新日期：2024-11-12 16:12

本说明书实施例公开了一种数据的处理方法、装置及电子设备。所述方法包括：接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；将所述目标知识内容输入大型语言模型，得到已学习到所述目标知识内容中的文件和描述信息之间的关联关系的大型语言模型；将所述问题输入已学习到所述关联关系的大型语言模型中，并将所述大型语言模型针对所述问题的输出，作为所述问题对应的答案。

全部详细技术资料下载

【技术实现步骤摘要】

本文件属于计算机，具体涉及一种数据的处理方法、装置及电子设备。

技术介绍

1、随着各类大型语言模型(large language model，llm)的问世，不难发现，在尊重用户隐私的条件下，大型语言模型已经逐步给各行各业带来非常多新的变革，可以实现以前难以想象的工作。但是在体验过这些大型语言模型之后也不难发现，我们离真正的通用人工智能(general artificial intelligence，agi)还有很长远的路要走。

2、现在的大型语言模型的一个重要问题是大型语言模型的“幻觉”现象很严重，这个问题主要体现在大型语言模型会根据用户的提问捏造出一些虚假的回答，比如用户在询问大型语言模型某张图像中的纸币是哪个国家发行的货币时，大型语言模型可能会通过猜测的方式生成一个答案，并且通过非常肯定地回复方式将该答案提供给用户。为此，需要提供一种更优的数据的处理方案，以避免大型语言模型的“幻觉”现象。

技术实现思路

1、本说明书实施例提供一种数据的处理方法、装置及电子设备，以提供一种用于避免大型语言模型的“幻觉”现象的数据的处理方案。

2、第一方面，本说明书实施例提供了一种数据的处理方法，该方法包括：接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；将所述目标知识内容输

3、第二方面，本说明书实施例提供了一种数据的处理装置，包括：问题接收模块，用于接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；知识检索模块，用于从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；模型学习模块，用于将所述目标知识内容输入大型语言模型，得到已学习到所述目标知识内容中的文件和描述信息之间的关联关系的大型语言模型；模型回答模块，用于将所述问题输入已学习到所述关联关系的大型语言模型中，并将所述大型语言模型针对所述问题的输出，作为所述问题语句对应的答案。

4、第三方面，本说明书实施例提供了一种电子设备，该电子设备包括：处理器，以及被安排成存储计算机可执行指令的存储器，在所述可执行指令被执行时，能够使得所述处理器：接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；将所述目标知识内容输入大型语言模型，得到已学习到所述目标知识内容中的文件和描述信息之间的关联关系的大型语言模型；将所述问题输入已学习到所述关联关系的大型语言模型中，并将所述大型语言模型针对所述问题的输出，作为所述问题对应的答案。

5、第四方面，本说明书实施例提供一种存储介质，用于存储计算机程序，所述计算机程序能够被处理器执行以实现以下流程：接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；将所述目标知识内容输入大型语言模型，得到已学习到所述目标知识内容中的文件和描述信息之间的关联关系的大型语言模型；将所述问题输入已学习到所述关联关系的大型语言模型中，并将所述大型语言模型针对所述问题的输出，作为所述问题对应的答案。

6、第五方面，本说明书实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下流程：接收用户输入的包含非文本模态的目标文件和文本模态的问题语句的问题，所述问题语句为针对所述目标文件提问的语句；从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，所述知识内容包含非文本模态的文件和对所述文件进行描述的文本模态的描述信息；将所述目标知识内容输入大型语言模型，得到已学习到所述目标知识内容中的文件和描述信息之间的关联关系的大型语言模型；将所述问题输入已学习到所述关联关系的大型语言模型中，并将所述大型语言模型针对所述问题的输出，作为所述问题对应的答案。

本文档来自技高网...

【技术保护点】

1.一种数据的处理方法，包括：

2.根据权利要求1所述的方法，所述从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，包含：

3.根据权利要求2所述的方法，所述基于所述问题语句，在所述知识库中进行第一检索，得到与所述问题匹配的第一检索结果，包括：

4.根据权利要求2所述的方法，所述知识内容中包含文件对应的向量，所述基于所述目标文件，在所述知识库中进行第二检索，得到与所述问题匹配的第二检索结果，包括：

5.根据权利要求4所述的方法，所述基于所述目标向量，在所述知识库中各条所述知识内容对应的向量中进行第二检索，并将与所述目标向量匹配的向量对应的知识内容，作为所述第二检索结果，包括：

6.根据权利要求3所述的方法，所述根据所述第一检索结果和所述第二检索结果，确定与所述问题匹配的目标知识内容，包括：

7.根据权利要求6所述的方法，所述在所述第一检索结果和所述第二检索结果中不包含相同的知识内容的情况下，从所述第一检索结果中，确定第一知识内容，从所述第二检索结果中，确定第二知识内容，包括：

9.一种数据的处理装置，包括：

10.一种电子设备，包括：

...

【技术特征摘要】

1.一种数据的处理方法，包括：

2.根据权利要求1所述的方法，所述从包含多条知识内容的知识库中，检索出与所述问题匹配的目标知识内容，包含：

3.根据权利要求2所述的方法，所述基于所述问题语句，在所述知识库中进行第一检索，得到与所述问题匹配的第一检索结果，包括：

5.根据权利要求4所述的方法，所述基于所述目标向量，在所述知识库中各条所述知识内容对应的向量中进行第二检索，并将与所述目标向量匹配的向量对应的知识内容，作为所述第二检索结果，包括：...

【专利技术属性】
技术研发人员：唐董琦，李若愚，
申请(专利权)人：蚂蚁区块链科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人