一种准确低成本的大语言模型使用方法及系统技术方案

技术编号：38555575 阅读：8 留言：0更新日期：2023-08-22 20:59

本发明专利技术属于AI应答系统的文本自动生成技术领域，具体涉及一种准确低成本的大语言模型使用方法及系统。方法包括步骤：S1、创建对话框；S2、在对话框中输入当前问题；S3、使用成本最低的大语言模型，在对话框输出当前问题答案；S4、判断当前问题答案是否合格，若合格则将当前问题答案作为当前问题的最终答案，并返回步骤S2，若不合格则执行步骤S5；S5、使用下一使用成本更高的大语言模型，在对话框输出当前问题答案，并返回步骤S4；步骤S4中，还基于当前问题和当前问题的最终答案对已输出过当前问题答案的大语言模型进行训练，以供下一次输入问题时使用。本发明专利技术可在兼顾准确度和使用成本的基础上回答用户所提出的问题。基础上回答用户所提出的问题。基础上回答用户所提出的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种准确低成本的大语言模型使用方法及系统

[0001]本专利技术属于AI应答系统的文本自动生成
，具体涉及一种准确低成本的大语言模型使用方法及系统。

技术介绍

[0002]大语言(GPT，Generative Pre
‑
trained Transformer)是指由OpenAI开发的一类基于Transformer架构的大型语言模型。这些模型经过大规模的无监督预训练，从大量的文本数据中学习语言的结构、语义和上下文信息。
[0003]大语言模型具有强大的语言理解和生成能力，可以应用于多个自然语言处理任务，如文本生成、机器翻译、对话系统、问答系统和摘要生成等。这些模型不仅可以生成连贯的文本，还能根据上下文进行推理和回答问题。
[0004]GPT模型是一种基于自回归的生成模型，其工作原理是通过在预训练阶段学习文本序列的概率分布，在生成文本时根据上文生成下一个词或字符。这种模型具有很高的灵活性和创造力，可以生成与输入上下文相一致的自然语言文本。
[0005]目前，OpenAI已经推出了多个版本的大语言模型，如GPT
‑
2、GPT
‑
3等。这些模型在自然语言处理领域取得了显著的成果，并在各种应用场景中展示了强大的生成和理解能力。大语言模型的发展对于自然语言处理和人工智能领域具有重要意义，为各种文本相关任务提供了强大的工具和技术支持。
[0006]目前除了上述的GPT
‑
2和GPT
‑
3，还存在多个大语言...

【技术保护点】

【技术特征摘要】
1.一种准确低成本的大语言模型使用方法，其特征在于，包括步骤：S1、创建对话框；S2、在对话框中输入当前问题；S3、使用成本最低的大语言模型，在对话框输出当前问题答案；S4、判断当前问题答案是否合格，若合格则将当前问题答案作为当前问题的最终答案，并返回步骤S2，若不合格则执行步骤S5；S5、使用下一使用成本更高的大语言模型，在对话框输出当前问题答案，并返回步骤S4；步骤S4中，在输出当前问题的最终答案后，若存在已输出过当前问题答案的大语言模型，则基于当前问题和当前问题的最终答案对已输出过当前问题答案的大语言模型进行训练，以供下一次输入问题时使用。2.根据权利要求1所述的一种准确低成本的大语言模型使用方法，其特征在于，步骤S2中还包括：在对话框中输入与问题相关的本地数据库；步骤S2与步骤S3之间还包括步骤：A、基于当前问题、本地数据库匹配得到初始问题答案；B、判断初始问题答案是否合格，若合格则将初始问题答案作为当前问题的最终答案，并返回步骤S2，若不合格则执行步骤S3。3.根据权利要求2所述的一种准确低成本的大语言模型使用方法，其特征在于，所有大语言模型均基于对话框中所有内容输出当前问题答案。4.根据权利要求3所述的一种准确低成本的大语言模型使用方法，其特征在于，大语言模型基于对话框中所有内容输出当前问题答案之前，对对话框中的内容进行压缩处理，且在压缩处理过程中不对未输出最终答案的问题进行压缩，也不在执行本地数据库输入的对话轮次中对该本地数据库进行压缩处理。5.根据权利要求4所述的一种准确低成本的大语言模型使用方法，其特征在于，对对话框中的内容进行压缩处理包括步骤：基于内容的对话轮次以及当前已完成的总对话轮次计算得到不同轮次的内容的压缩率；基于计算得到的多个压缩率对不同轮次的内容进行压缩处理。6.根据权利要求5所述的一种准确低成本的大语言模型使用...

【专利技术属性】
技术研发人员：汤猛帆，周万江，张旭中，
申请(专利权)人：中科基石湖州信息科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人