当前位置: 首页 > 专利查询>杨子言专利>正文

一种大语言模型的交互方法和系统技术方案

技术编号:39777359 阅读:22 留言:0更新日期:2023-12-22 02:23
本发明专利技术提供一种大语言模型的交互方法和系统,在用户本地或云端通过容器为大语言模型的生成内容或者为大语言模型运行调试生成的代码提供一个隔离

【技术实现步骤摘要】
一种大语言模型的交互方法和系统


[0001]本专利技术涉及大语言模型
,特别涉及一种大语言模型的交互方法和系统


技术介绍

[0002]语言模型是一种机器学习技术,用于研究自然语言数据的概率分布,并利用这些分布来完成语言相关的任务,如文本分类

自然语言的理解

机器翻译等

语言模型可以利用词序列,句子结构和短语的上下文信息来确定句子的概率,从而计算出句子的可能性

[0003]生成式人工智能是指基于算法

模型

规则生成文本

图片

声音

视频

代码等内容的技术,为知识和创造性工作者开启了一扇解决当今最重要挑战的新大门

其中的模型主要就是大语言模型

[0004]大语言模型能力涌现,可以生成意想不到的
AIGC
人工智能生成内容,可能是大语言模型生成的代码,或者多模态模型生成的内容

但如何安全使用
AIGC
人工智能的生成内容值得我们关注

[0005]Openai
推出
code interpreter
产品,目前还在
alpha
测试阶段,实现通过文字化请求交互进行数据分析

核心功能是
Openai
页面提供了一个大模型生成的代码执行工具,实现用户对上传文件处理

据称用户可以上传自己的数据文件,大语言模型生成的
python
代码通过
jupyter
在沙盒中运行,进行数据分析

[0006]沙盒
(
英语:
sandbox
,又译为沙箱
)
,计算机术语,在计算机安全领域中是一种安全机制,为运行中的程序提供的隔离环境

通常是作为一些来源不可信

具破坏力或无法判定程序意图的程序提供实验之用

沙盒通常严格控制其中的程序所能访问的资源,比如,沙盒可以提供用后即回收的磁盘及内存空间

在沙盒中,网络访问

对真实系统的访问

对输入设备的读取通常被禁止或是严格限制

[0007]虽然
code interpreter
产品通过沙盒技术,在将大语言模型连接到编程语言解释器时能正确地隔离执行环境,从而能在一个安全的环境中执行代码,使得
AI
生成的代码不会对真实世界产生意外的副作用

但由于沙盒技术本身的特点,通常用于对危害软件调试,通常使用虚拟机技术,即基于硬件级虚拟化技术,对用户而言,不可避免地带来如下限制:
[0008](
页面访问是
codeInterpreter
的设计
)
[0009]2、
不能联网;
[0010](
页面因素
)
[0011](
单一
ide
的限制
)
[0012]5、
有限的上传和存储空间;
[0013]6、
沙盒环境操作结束后,所有资源重置回收,数据持久化困难;
codeInterpreter
目前会话临时中断都有可能导致沙盒环境回收,数据重置;

技术实现思路

[0014]本专利技术要解决的技术问题,在于提供一种大语言模型的交互方法和系统,既能在
将大语言模型连接到编程语言解释器时提供一个隔离

独立的环境,供大语言模型生成的代码进行运行,又能克服因沙盒带来的上述缺陷,从而能让用户实现更多的使用场景

[0015]第一方面,本专利技术提供了一种大语言模型的交互方法,在用户本地或云端通过容器技术提供一个隔离

独立的容器环境,供大语言模型运行根据用户的请求生成的代码,且所述容器环境包含集成开发环境和依赖库

[0016]第二方面,本专利技术提供了一种大语言模型的交互系统,在用户本地或云端通过容器技术提供一个隔离

独立的容器环境,供大语言模型运行根据用户的请求生成的代码,且所述容器环境包含集成开发环境和依赖库

[0017]第三方面,本专利技术提供了一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法

[0018]第四方面,本专利技术提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法

[0019]本专利技术实施例中提供的一个或多个技术方案,是将容器技术代替沙盒技术供大语言模型运行根据用户的请求生成的代码,由于容器是一种跨本地和云中的不同环境打包和运行
Windows

Linux
应用程序的技术,相较于沙盒严苛的环境,容器提供是一个轻型

系统级虚拟化隔离环境

因此至少具有如下技术效果或优点:
[0020]1、
结合大语言模型

容器技术
、IDE
,实现新的代码生成和调试方案;
[0021]2、
容器提供系统层级虚拟化

轻型隔离环境,降低安全隐患;再配合安全模块,降低
aigc
内容调试风险;
[0022]3、
容器管理模块中设置容器镜像库,可存储不同的容器镜像,包含预装不同
IDE、
依赖库的标准模板容器,或者用户构建发布的发布的软件工具镜像,可以随用户需求,提供不同
IDE
,以满足个性化

复杂的开发调试场景;
[0023]4、
内容可持久化存储:通过交互保存交互历史,对话历史和数据处理结果;通过代码管理模块保存代码;通过镜像库保存镜像;
[0024]5、
可通过交互模块为用户提供一种或多种大语言模型以供选择,用户可以自行选择大语言模型;
[0025]6、
容器本身能力和虚拟化技术,可统一环境,支持跨平台使用;
[0026]7、
容器本身能力和虚拟化技术,可支持本地或云端使用,可以是本地容器或云上容器;
[0027]8、
基于容器,通过镜像分发能力,一方面可快速部署为用户便捷提供服务;另一方面,为用户提供发布和部署能力,为产品构建开发社区

软件

工具商店生态提供可能

[0028]上述说明仅是本专利技术技术方案的概述,为了能够本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种大语言模型的交互方法,其特征在于:在用户本地或云端通过容器为大语言模型的生成内容或者为大语言模型运行调试生成的代码提供一个隔离

完整的用户环境,且所述用户环境包含
IDE
集成开发环境

依赖库和数据挂载模块
。2.
根据权利要求1所述的一种大语言模型的交互方法,其特征在于:包括:
S1、
通过交互模块提供至少一种大语言模型给用户选择;
S2、
选择容器镜像,通过容器管理模块根据选择的容器镜像从镜像库内拉取相应的镜像,启动容器;
S3、
所述数据挂载模块将存储模块中的数据集挂载到容器的读写模块;
S4、
大语言模型通过提示词与用户进行交互,并生成结果;或者大语言模型从代码管理模块中获取相关代码到容器中,再通过提示词与用户进行交互,并生成结果;
S5、
调试执行,生成调试结果,直到满足用户需求,得到最终结果;
S6、
将所述最终结果按用户需求提供给用户
。3.
根据权利要求2所述的一种大语言模型的交互方法,其特征在于:包括:所述
S2
中的选择容器镜像包括下述任一种方式:
(21)
交互模块提供配置页面供用户自行选择容器镜像;
(22)
大语言模型通过与用户交互来分析用户需求,为用户自动选择容器镜像;所述
S5
中的调试执行包括下述任一种方式:
(51)
大语言模型通过提示词与用户交互,调试生成结果;
(52)
通过
IDE
与用户交互
,
调试生成结果;所述
S6
具体包括下述任一种方式:
(61)
所述用户需求若是数据处理需求,则提供方式为:交互过程中,大语言模型生成

执行

返回结果到交互模块;或者为:将处理后的数据集从容器目录中传出;
(62)
所述用户需求若是生成代码工程,则提供方式为:将生成的代码工程上传到代码管理模块的代码仓库中;
(63)
所述用户需求若是软件工具发布需求:则提供方式为:将调试完成的容器构建为新的镜像,上传到容器管理模块中的镜像库
。4.
根据权利要求2所述的一种大语言模型的交互方法,其特征...

【专利技术属性】
技术研发人员:杨子言
申请(专利权)人:杨子言
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1