System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及应用开发,具体的说是一种基于大语言模型的应用程序生成方法及装置。
技术介绍
1、低代码开发平台是一种基于图形化界面和模板化设计的软件开发工具,它可以通过拖拽组件和配置参数等方式快速构建应用程序,大大缩短了开发周期,降低了开发成本,提高了开发效率。
2、目前市场上存在多款低代码平台,这些平台都提供了可视化的设计工具和模板化的设计方式,可以快速构建企业应用程序。同时,这些平台还提供了丰富的组件库,方便用户进行应用程序的部署和维护。
3、但现在低代码平台仍存在以下缺点:
4、1、用户需要一定的学习成本熟悉低代码平台的操作。
5、2、面对较为复杂的用户需求,用户需要自行对表单进行设计和一步步的绘制,此步骤较为耗时不够简便。
6、大语言模型是指使用大量文本数据训练的深度学习模型,可以很好理解自然语言文本的含义。大语言模型微调是指在预训练模型的基础上,通过在特定任务上进行有监督的训练,来优化模型的性能,微调方法可以使模型更好地适应具体领域的任务需求。
技术实现思路
1、本专利技术针对目前技术发展的需求和不足之处,提供一种基于大语言模型的应用程序生成方法及装置,用于解决用户对于低代码平台需要重新学习和对于复杂设计过程步骤繁琐的问题,有效的节省使用者的人力成本。
2、第一方面,本专利技术的一种基于大语言模型的应用程序生成方法,解决上述技术问题采用的技术方案如下:
3、一种基于大语言模型的应用程序生成方
4、s1、定义表单生成规范和组件生成规范;
5、s2、利用符合规范的微调数据集对大语言模型进行微调,从而得到具有结构设计能力的结构设计模型和具有表单设计能力的表单设计模型;
6、s3、利用结构设计模型和表单设计模型对用户的系统功能需求描述进行语义分析,并将需求描述转换为符合生成规范的数据结构;
7、s4、利用低代码生成器将符合生成规范的数据转换为真实表单和组件,从而生成可使用的应用程序。
8、可选的,执行步骤s1,
9、定义的表单生成规范为一种json数据结构,包含name和description字段,其中,name字段含义为表单名称,description字段含义为表单功能描述;
10、定义的组件生成规范为一种json数据结构,包含name和type字段,其中,name字段含义为组件名称,type字段含义为组件类型;type的值属于input、number、textarea、checkbox、fileupload、select中的一种,其中,input含义为单行文本,number含义为数字选择器、textarea含义为多行文本,checkbox含义为复选框,fileupload含义为文件上传器,select的含义为下拉选择框。
11、进一步可选的,执行步骤s2,利用符合规范的微调数据集对大语言模型进行微调,这一过程涉及微调数据集、模型训练器、模型评测器三部分,其中:
12、s2.1、微调数据集f={d,t}包括结构设计模型微调数据集d={d1,d2,d3...dn}和表单设计模型微调数据集t={t1,t2,t3...tn},dn和tn为单条微调数据,大语言模型经过结构设计模型微调数据集d微调训练后得到结构设计模型,经过表单设计模型微调数据集t微调后得到表单设计模型;微调数据集中的微调数据由系统需求描述文本和标注标签组成,需求描述文本为真实的系统设计需求文本,标注标签为需求描述所对应的应用程序的真实设计结果,其中结构设计模型微调数据集d的标注标签需符合表单生成规范;
13、s2.2、模型训练器用于利用微调数据集更新模型结构,使模型具备系统设计能力,训练过程为:
14、s2.1.1、准备候选提示词集p={p1,p2,p3...pk},候选提示词集p的标注标签需符合组件生成规范,设微调数据的需求描述文本为xn,预训练模型原始权重为w;
15、s2.1.2、轮询候选提示词集p,并将pn经过encode转换成的tokens和xn经过embedding后转换成的向量进行拼接,作为模型训练的输入;
16、s2.1.3、每轮训练只更新pn的tokens,直到训练loss收敛不再下降;
17、s2.1.4、初始化两个低秩矩阵b和a;
18、s2.1.5、通过微调数据集训练更新模型权重,具体为冻结预训练模型的原始权重w,只对低秩矩阵b和a的权重进行更新,则每轮训练模型权重更新值δw = ba;
19、s2.1.6、训练完成后模型权重变更为:
20、w` = w + δw;
21、s2.3、模型测评器用于对训练完成的模型进行测评,通过比对模型的设计结果和真实标注,对模型设计能力进行评估,单个样本的测评得分scoren计算公式如下:
22、 公式(a),
23、 公式(b),
24、 公式(c),
25、其中,代表生成正确的组件,代表生成错误的组件,代表标注数据里有但模型实际未生成的组件;
26、最终模型的测评得分s计算公式如下:
27、 公式(d),
28、训练完成后需通过模型测评器对训练完成的模型进行评测,根据需求设定完成阈值t,当测评得分s大于阈值t时即可完成训练,否则补充微调数据集继续进行训练。
29、进一步可选的,所涉及步骤s3具体包括如下操作:
30、s3.1、采集用户系统功能需求i;
31、s3.2、将用户系统功能需求i传入结构设计模型,结构设计模型凭借自身的语义理解能力根据用户系统功能需求i生成由至少一个表单名称组成的表单列表m,输出格式需符合表单生成规范;
32、s3.3、将表单列表m和用户系统功能需求i一起输入表单设计模型,表单设计模型分别输出每个表单的设计结果t=[t1,t2,...,tn],其中,tn表示每个表单的设计结果;
33、s3.4、表单列表m和每个表单的设计结果t为系统设计模块的最终输出,将表单列表m和每个表单的设计结果t汇总输入低代码生成器。
34、可选的,执行步骤s4,利用低代码生成器将符合生成规范的数据转换为真实表单和组件,从而生成可使用的应用程序,具体包括:
35、将符合表单生成规范数据转变为实际的应用程序表单列表;
36、将符合组件生成规范数据转换成每个表单的实际组件,其中,组件具体转换规则如下:type值为input转换为单行文本组件,type值为select转换为下拉框选择器组件,type值为textarea转换为多行文本组件,type值为checkbox转换为复选框组件,type值为fileupload转换为文件上传器组件,type值本文档来自技高网...
【技术保护点】
1.一种基于大语言模型的应用程序生成方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤S1,
3.根据权利要求2所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤S2,利用符合规范的微调数据集对大语言模型进行微调,这一过程涉及微调数据集、模型训练器、模型评测器三部分,其中:
4.根据权利要求3所述的一种基于大语言模型的应用程序生成方法,其特征在于,所述步骤S3具体包括如下操作:
5.根据权利要求1所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤S4,利用低代码生成器将符合生成规范的数据转换为真实表单和组件,从而生成可使用的应用程序,具体包括:
6.一种基于大语言模型的应用程序生成装置,其特征在于,其包括:
7.根据权利要求6所述的一种基于大语言模型的应用程序生成装置,其特征在于,所述规范定义模块定义的表单生成规范为一种json数据结构,包含name和description字段,其中,name字段含义为表单名称,de
8.根据权利要求7所述的一种基于大语言模型的应用程序生成装置,其特征在于,所述模型训练模块包括微调数据集、模型训练器、模型评测器三部分,其中:
9.根据权利要求8所述的一种基于大语言模型的应用程序生成装置,其特征在于,所述系统设计模块通过如下操作将需求描述转换为符合生成规范的数据结构:
10.根据权利要求7所述的一种基于大语言模型的应用程序生成装置,其特征在于,所述系统生成模块生成可使用的应用程序的具体步骤如下:
...【技术特征摘要】
1.一种基于大语言模型的应用程序生成方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤s1,
3.根据权利要求2所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤s2,利用符合规范的微调数据集对大语言模型进行微调,这一过程涉及微调数据集、模型训练器、模型评测器三部分,其中:
4.根据权利要求3所述的一种基于大语言模型的应用程序生成方法,其特征在于,所述步骤s3具体包括如下操作:
5.根据权利要求1所述的一种基于大语言模型的应用程序生成方法,其特征在于,执行步骤s4,利用低代码生成器将符合生成规范的数据转换为真实表单和组件,从而生成可使用的应用程序,具体包括:
6.一种基于大语言模型的应用程序生成装置...
【专利技术属性】
技术研发人员:殷昭,张连超,陈晏鹏,单文政,郭芙蓉,
申请(专利权)人:浪潮软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。