System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 集成少样本提示和多项选择机制的大模型SQL生成方法技术_技高网

集成少样本提示和多项选择机制的大模型SQL生成方法技术

技术编号:43631549 阅读:2 留言:0更新日期:2024-12-11 15:12
本申请涉及一种集成少样本提示和多项选择机制的大模型SQL生成方法。所述方法包括:分析用户输入的查询文本,确定查询文本对应的数据库模式信息;根据查询文本和查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本;将查询文本、查询文本对应的数据库模式信息以及相似样本输入至预训练的语句生成模型,得到候选SQL语句;根据候选SQL语句的执行结果,从候选SQL语句中选择出目标SQL语句。采用本方法能够分析用户输入的自然语言,准确获取相应的数据库模式,并结合用户输入对应的相似样本,生成若干候选SQL语句,基于各候选SQL语句的执行结果,从候选SQL语句中准确筛选出与用户输入相匹配的目标SQL语句,提高基于自然语言问题生成SQL语句的准确性。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种集成少样本提示和多项选择机制的大模型sql生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、自然语言处理可以通过解析和理解用户的自然语言查询,识别用户的意图,提取关键信息,并利用相关工具或系统将用户的自然语言问题转换为结构化的sql命令。利用自然语言处理实现自然语言问题与sql语句之间的转换能够帮助用户基于自然语言准确快速地生成相应的sql语句,无需用户专门学习复杂的sql语法,提高sql语句的生成效率。

2、传统技术主要采用预先定义的模板或规则集进行自然语言问题与sql语句之间的转换,然而,传统技术受限于模板或规则集的全面程度,模板或规则集与自然语言问题的复杂程度不适配时,基于传统技术生成的sql语句无法准确执行用户意图,不利于提高基于自然语言问题生成sql语句的准确性。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高基于自然语言问题生成sql语句的准确性的集成少样本提示和多项选择机制的大模型sql生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种集成少样本提示和多项选择机制的大模型sql生成方法,包括:

3、分析用户输入的查询文本,确定所述查询文本对应的数据库模式信息;

4、根据所述查询文本和所述查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本;所述相似样本包括样本查询文本、所述样本查询文本对应的数据库模式信息和样本sql语句;

5、将所述查询文本、所述查询文本对应的数据库模式信息以及所述相似样本输入至预训练的语句生成模型,得到候选sql语句;

6、根据所述候选sql语句的执行结果,从所述候选sql语句中选择出目标sql语句。

7、在其中一个实施例中,所述分析用户输入的查询文本,确定所述查询文本对应的数据库模式信息,包括:

8、根据所述查询文本确定所述查询文本对应的数据表信息;

9、根据所述数据表信息确定所述查询文本对应的列信息;

10、根据所述查询文本对应的数据表信息和所述查询文本对应的列信息,确定所述查询文本对应的数据库模式信息。

11、在其中一个实施例中,所述根据所述数据表信息确定所述查询文本对应的列信息,包括:

12、将所述数据表信息对应的列信息作为候选列信息;

13、根据所述候选列信息与所述查询文本之间的相关程度,对所述候选列信息进行排序,得到排序结果;

14、从所述排序结果中选择出所述查询文本对应的列信息。

15、在其中一个实施例中,所述根据所述查询文本和所述查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本,包括:

16、根据所述查询文本和所述查询文本对应的数据库模式信息,生成文本对;

17、根据所述文本对与所述预设样本库中各样本之间的相似程度,从所述预设样本库中筛选出所述相似样本。

18、在其中一个实施例中,所述将所述查询文本、所述查询文本对应的数据库模式信息以及所述相似样本输入至预训练的语句生成模型,得到候选sql语句,包括:

19、获取所述数据库模式信息中数据表信息的第一排列顺序和所述数据库模式信息中列信息的第二排列顺序;

20、按照所述第一排列顺序对所述数据库模式信息中的数据表信息进行排序,按照所述第二排列顺序对所述数据库模式信息中的列信息进行排序,得到候选数据库模式信息;

21、获取所述相似样本的第三排列顺序,按照所述第三排列顺序对所述相似样本进行排序,得到候选样本;

22、根据所述查询文本、所述候选数据库模式信息和所述候选样本,生成提示词;

23、将所述提示词输入至所述预训练的语句生成模型,得到所述候选sql语句。

24、在其中一个实施例中,所述根据所述候选sql语句的执行结果,从所述候选sql语句中选择出目标sql语句,包括:

25、根据所述候选sql语句的执行结果,将所述候选sql语句划分为至少一个语句集合;所述语句集合包括至少一个候选sql语句;

26、根据所述语句集合中候选sql语句的数量,从所述语句集合筛选出目标语句集合;

27、将所述目标语句集合中的候选sql语句作为所述目标sql语句。

28、第二方面,本申请还提供了一种集成少样本提示和多项选择机制的大模型sql生成装置,包括:

29、分析模块,用于分析用户输入的查询文本,确定所述查询文本对应的数据库模式信息;

30、筛选模块,用于根据所述查询文本和所述查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本;所述相似样本包括样本查询文本、所述样本查询文本对应的数据库模式信息和样本sql语句;

31、生成模块,用于将所述查询文本、所述查询文本对应的数据库模式信息以及所述相似样本输入至预训练的语句生成模型,得到候选sql语句;

32、选择模块,用于根据所述候选sql语句的执行结果,从所述候选sql语句中选择出目标sql语句。

33、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

34、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

35、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

36、上述集成少样本提示和多项选择机制的大模型sql生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过分析用户输入的查询文本,确定查询文本对应的数据库模式信息,从而准确从用户输入的查询文本获取相应的数据库模式,便于后续sql语句的生成;根据查询文本和查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本,从而结合查询文本和查询文本对应的数据库模式信息,获取准确的相似样本,便于利用相似样本提示后续sql语句的生成;相似样本包括样本查询文本、样本查询文本对应的数据库模式信息和样本sql语句;将查询文本、查询文本对应的数据库模式信息以及相似样本输入至预训练的语句生成模型,得到候选sql语句,从而利用语句生成模型准确生成相应的候选sql语句;根据候选sql语句的执行结果,从候选sql语句中选择出目标sql语句,从而基于执行结果筛选出准确的目标sql语句,能够分析用户输入的自然语言,准确获取相应的数据库模式,并结合用户输入对应的相似样本,生成若干候选sql语句,从而基于各候选sql语句的执行结果,从候选sql语句中准确筛选出与用户输入相匹配的目标sql语句,进而提高基于自然语本文档来自技高网...

【技术保护点】

1.一种集成少样本提示和多项选择机制的大模型SQL生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分析用户输入的查询文本,确定所述查询文本对应的数据库模式信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述数据表信息确定所述查询文本对应的列信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述查询文本和所述查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本,包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述查询文本、所述查询文本对应的数据库模式信息以及所述相似样本输入至预训练的语句生成模型,得到候选SQL语句,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述候选SQL语句的执行结果,从所述候选SQL语句中选择出目标SQL语句,包括:

7.一种集成少样本提示和多项选择机制的大模型SQL生成装置,其特征在于,所述装置包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种集成少样本提示和多项选择机制的大模型sql生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述分析用户输入的查询文本,确定所述查询文本对应的数据库模式信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述数据表信息确定所述查询文本对应的列信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述查询文本和所述查询文本对应的数据库模式信息,在预设样本库中筛选出相似样本,包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述查询文本、所述查询文本对应的数据库模式信息以及所述相似样本输入至预训练的语句生成模型,得到候选sql语句,包括:

6.根据权...

【专利技术属性】
技术研发人员:曹尚林全郴余煜塬江佳佳冯勤宇张焕明李汉巨罗兴鹏黄冠张健军
申请(专利权)人:南方电网人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1