NL2SQL建模的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35897751 阅读：15 留言：0更新日期：2022-12-10 10:32

本发明专利技术涉及一种NL2SQL建模的方法、装置、电子设备及存储介质，NL2SQL建模的方法包括步骤：S1、数据处理，对数据处理后生成海量无标注样本，采用UDA技术实现标注训练样本数据集；S2、NL

全部详细技术资料下载

【技术实现步骤摘要】
NL2SQL建模的方法、装置、电子设备及存储介质

[0001]本专利技术涉及自然语言处理语义解析领域，具体而言，涉及一种基于无监督域适应技术和蝙蝠算法优化的NL2SQL(Natural Language to Structured Query Language，自然语言转化为结构化查询语言)建模的方法、装置、电子设备及存储介质。

技术介绍

[0002]伴随5G和人工智能技术的不断发展，电信/移动通信运营商作为现代综合信息服务提供商，在云改数转的引领下，其各产品线的智能客服也快速的更新。针对智能客服的自然语言(Natural Language，NL)数据来说，运营人员可能不是数据领域的技术人员，通过NL对数据库进行访问查询，能够很好的提高智能客服的运营效率，目前这也成为人工智能和智能客服领域相结合的热点研究之一。目前大数据的建模技术多聚焦于机器学习和深度学习等技术，使用的门槛较高，不适合非专业运营人员的使用。
[0003]面向智能客服的NL生成SQL(Natural Language to Structured Query Language，NL
‑2‑
SQL，自然语言转化为结构化查询语言)数据建模技术能让非专业运营人员通过语音与数据库进行交互，降低数据库查询的门槛，大大提高运营的效率。
[0004]在深度学习技术的深入研究下，基于监督学习模型的NL
‑
to
‑
SQL(NL2SQL)数据建模技术在NLP领域取得很大的成功，但是监督学习需要依赖大量的人...

【技术保护点】

【技术特征摘要】
1.一种NL2SQL建模的方法，所述NL2SQL建模方法基于无监督域适应(UDA)技术和蝙蝠算法优化实现，所述方法包括如下步骤：S1、数据处理，所述数据为产品运营数据，对所述数据处理后，生成海量无标注样本，进而通过预设查询SQL范式样板，采用UDA技术实现标注训练样本数据集；S2、NL
‑
to
‑
SQL模型训练，对获取的自然语言样本进行样本数据训练，生成结构化查询语言模型，所述模型包括权重层和激活层，采用TernaryBERT模型对所述权重层和激活层进行量化；S3、模型压缩及生成模块，为弥补由于TernaryBERT模型在包括智能客服业务咨询的任务上由于量化过度导致效果不足，采用预训练知识蒸馏方式对所述模型进一步压缩处理，同时，为防止蒸馏结构网络权重的陷入局部最优值，采用蝙蝠算法进行参数训练和智能搜索，找到最优的蒸馏网络结构；S4、对话管理，经TernaryBERT模型训练和PKD模型压缩后，进行预处理，再将所述模型融合预设的SQL范式，关联和生成完整的数据库查询SQL，进而和智能客服界面进行交互，实现对话管理应用。2.如权利要求1所述的方法，其中，S1步骤中所述产品运营数据包括来电名片和挂机短信，对所述数据处理方式包括进行分词、去除停用词、替换英文标点、构建问答数据集、构建句向量索引数据库，进而生成的海量无标注样本。3.如权利要求1所述的方法，其中，S2步骤中所述NL
‑
to
‑
SQL模型训练采用TernaryBERT模型，该模型对权重层量化和激活层量化，其中，所述权重层包含线性层与Embedding层，所述线性层与Embedding层参数占所述TernaryBERT模型总参数的绝大部分，因而所述TernaryBERT模型对所述线性层与Embedding层进行较为彻底的量化；其中，在所述激活层的量化中，采用8bit的对称与非对称方法进行量化。4.如权利要求3所述的方法，其中，在所述激活层量化中，实际的推理过程中，矩阵乘法由32bit的浮点数运算变为int8的整形运算，达到加速的目标；该模型实现仅占BERT模型的6.7％的参数情况下达到和全精度模型相当的性能。5.如权利要求1所述的方法，其中，S3步骤中所述预训练知识蒸馏采用PKD
‑
Last和PKD
‑
Skip两种策略从“teacher”模型的隐含层中抽取隐藏知识，彻底消除“student”模型模仿“teacher”模型的输出，其中，所述PKD
‑
Last策略是使用“teacher”模型的最后k层中蕴含的知识；所...

【专利技术属性】
技术研发人员：周晓辉，王华超，
申请(专利权)人：号百信息服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人