System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于信息,具体是一种基于大模型的电力审计sql语句生成方法。
技术介绍
1、电力审计是指对电力公司的电费收入、电价政策、成本费用、核算管理往来以及是否存在弄虚作假等行为进行审计,它是电力行业内部管理和监督的重要环节,旨在确保电力公司的运营合规、高效,并维护电力市场的公平竞争。大模型是指一种由包含数百亿以上参数的深度神经网络构建的人工智能模型,拥有数十亿甚至数千亿个参数,能够处理更加复杂的任务和数据,其应用领域广泛且深入,涵盖了自然语言处理、计算机视觉、生物信息学、自动驾驶、金融等多个关键领域。
2、传统电力审计过程中,需要人工编写sql语句来查询和分析电力数据,这不仅耗时耗力,且准确率较低;随着大数据和人工智能技术的发展,也存在着用大模型生成sql语句的方法出现,但是存在直接对文本数据生成sql语句,使得一些格式不规范的文本数据生成错误的sql语句,导致电力审计工作的效率较低;因此,对于电力审计sql语句生成方法仍需进一步的改进。
技术实现思路
1、本申请旨在至少解决现有技术中存在的技术问题之一;为此,本申请提出了一种基于大模型的电力审计sql语句生成方法,用于解决现有技术直接将文本数据生成sql语句,使得一些格式不规范的文本数据生成错误的sql语句,导致电力审计工作的效率较低的技术问题。
2、为实现上述目的,本申请的第一方面提供了一种基于大模型的电力审计sql语句生成方法,包括:
3、s0:获取输入数据;所述输入数据包括语音数据或文本数据
4、s1:对语音数据通过身份识别模型得到身份标签,所述身份识别模型通过人工智能模型进行构建;判断身份标签是否为工作人员;是,进入s2;否,生成没有权限提示信号,结束操作;
5、s2:根据输入数据计算数据规范性系数;判断数据规范性系数是否大于规范系数阈值;是,进入s3;否,生成数据不规范提示信号,并提醒重新输入数据,进入s0;
6、s3:将输入数据输入至sql生成模型中得到sql语句;所述sql生成模型通过rag技术结合大模型获得。
7、本申请通过上述步骤中的根据输入数据计算数据规范性系数,在生成sql语句之前对输入数据进行规范化验证,从而减少了因不规范信息导致错误sql语句的生成,提升了sql语句生成的效率以及用户的使用体验。
8、进一步的,所述身份识别模型通过人工智能模型进行构建,包括:
9、获取历史声纹信息及其对应的身份标签;
10、将历史声纹信息按照身份标签划分为训练数据、验证数据以及测试数据;对训练数据、验证数据以及测试数据进行声纹预处理得到训练集、验证集以及测试集;
11、选择人工智能模型作为基础模型;
12、通过训练集训练基础模型,并在验证集上调整学习率和超参数得到预训练模型;
13、通过对预训练模型在测试集上进行验证,最终得到输入声纹信息,输出为身份标签的身份识别模型。
14、进一步的,所述根据输入数据计算数据规范性系数,包括:
15、获取输入数据;
16、根据输入数据生成语法正确度等级yzd、表达清晰度等级bqd和领域相关度等级lxd;
17、通过公式sgx=α1×yzd+α2×bqd+α3×lxd计算数据规范性系数;其中,α1、α2和α3为权重系数,α1、α2和α3∈(0,1)。
18、进一步的,所述根据输入数据生成语法正确度等级yzd、表达清晰度等级bqd和领域相关度等级lxd,包括以下步骤:
19、步骤一:获取输入数据;判断输入数据是否为语音数据;是,进入步骤二;否,进入步骤三;
20、步骤二:将语音数据中的内容信息转化为文本数据;
21、步骤三:通过文本程度模型得到语法正确度等级yzd、表达清晰度等级bqd和领域相关度等级lxd;所述文本程度模型通过基于transformer的模型进行构建。
22、进一步的,所述文本程度模型通过基于transformer的模型进行构建,包括:
23、获取若干历史文本数据及其对应的语法正确度等级、表达清晰度等级和领域相关度等级;
24、将若干历史文本数据及其对应的语法正确度等级、表达清晰度等级和领域相关度等级划分为训练数据、验证数据以及测试数据;对训练数据、验证数据以及测试数据进行文本预处理得到训练集、验证集以及测试集;
25、选择基于transformer的模型作为基础模型;
26、通过训练集训练基础模型,并在验证集上调整学习率和超参数得到预训练模型;
27、通过对预训练模型在测试集上进行验证,最终得到输入文本数据,输出为语法正确度等级、表达清晰度等级和领域相关度等级的文本程度模型。
28、进一步的,所述规范系数阈值通过历史sql语句获得,包括:
29、获取若干历史sql语句为正确标签对应的数据规范性系数sgxi;
30、选择min(sgxi)作为规范系数阈值gxy。
31、进一步的,所述sql生成模型通过rag技术结合大模型获得,包括:
32、获取电力审计领域的历史文本数据及其对应的sql语句;
33、将历史文本数据及其对应的sql语句划分为训练数据、验证数据以及测试数据;对训练数据、验证数据以及测试数据进行数据预处理得到训练集、验证集以及测试集;
34、选择大模型作为基础模型,将电力审计领域的相关数据整理成结构化的知识库;将基础模型和知识库结合得到rag模型;
35、通过训练集训练rag模型,并在验证集上调整学习率和超参数得到预训练模型;
36、通过对预训练模型在测试集上进行验证,最终得到输入文本数据,输出为sql语句的sql生成模型。
37、与现有技术相比,本申请的有益效果是:通过对输入数据进行识别与验证;根据输入数据计算数据规范性系数;当数据规范性系数大于规范系数阈值时,将输入数据输入至sql生成模型中得到sql语句;否则,生成提示信号,并重新输入数据,通过多元化数据进行交互,在生成sql语句之前对输入数据进行规范化验证,减少了不规范信息的语句生成次数,同时对大模型在电力审计领域进行微调,提升了sql语句的生成准确度。
本文档来自技高网...【技术保护点】
1.一种基于大模型的电力审计SQL语句生成方法,其特征在于,包括:
2.根据权利要求1所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述身份识别模型通过人工智能模型进行构建,包括:
3.根据权利要求1所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述根据输入数据计算数据规范性系数,包括:
4.根据权利要求3所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述根据输入数据生成语法正确度等级YZD、表达清晰度等级BQD和领域相关度等级LXD,包括以下步骤:
5.根据权利要求4所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述文本程度模型通过基于Transformer的模型进行构建,包括:
6.根据权利要求1所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述规范系数阈值通过历史SQL语句获得,包括:
7.根据权利要求1所述的一种基于大模型的电力审计SQL语句生成方法,其特征在于,所述SQL生成模型通过RAG技术结合大模型获得,包括:
>...【技术特征摘要】
1.一种基于大模型的电力审计sql语句生成方法,其特征在于,包括:
2.根据权利要求1所述的一种基于大模型的电力审计sql语句生成方法,其特征在于,所述身份识别模型通过人工智能模型进行构建,包括:
3.根据权利要求1所述的一种基于大模型的电力审计sql语句生成方法,其特征在于,所述根据输入数据计算数据规范性系数,包括:
4.根据权利要求3所述的一种基于大模型的电力审计sql语句生成方法,其特征在于,所述根据输入数据生成语法正确度等级yzd、表达清晰度等级...
【专利技术属性】
技术研发人员:刘尧,曹培祥,汪子林,鲍卿,时亮,朱建华,侯凤,胡韫,吕衍,张洁,张辉,
申请(专利权)人:国网安徽省电力有限公司综合服务中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。