【技术实现步骤摘要】
NL2SQL建模的方法、装置、电子设备及存储介质
[0001]本专利技术涉及自然语言处理语义解析领域,具体而言,涉及一种基于无监督域适应技术和蝙蝠算法优化的NL2SQL(Natural Language to Structured Query Language,自然语言转化为结构化查询语言)建模的方法、装置、电子设备及存储介质。
技术介绍
[0002]伴随5G和人工智能技术的不断发展,电信/移动通信运营商作为现代综合信息服务提供商,在云改数转的引领下,其各产品线的智能客服也快速的更新。针对智能客服的自然语言(Natural Language,NL)数据来说,运营人员可能不是数据领域的技术人员,通过NL对数据库进行访问查询,能够很好的提高智能客服的运营效率,目前这也成为人工智能和智能客服领域相结合的热点研究之一。目前大数据的建模技术多聚焦于机器学习和深度学习等技术,使用的门槛较高,不适合非专业运营人员的使用。
[0003]面向智能客服的NL生成SQL(Natural Language to Structured Query Language,NL
‑2‑
SQL,自然语言转化为结构化查询语言)数据建模技术能让非专业运营人员通过语音与数据库进行交互,降低数据库查询的门槛,大大提高运营的效率。
[0004]在深度学习技术的深入研究下,基于监督学习模型的NL
‑
to
‑
SQL(NL2SQL)数据建模技术在NLP领域取得很大的成功,但是监督学习需要依赖大量的人 ...
【技术保护点】
【技术特征摘要】
1.一种NL2SQL建模的方法,所述NL2SQL建模方法基于无监督域适应(UDA)技术和蝙蝠算法优化实现,所述方法包括如下步骤:S1、数据处理,所述数据为产品运营数据,对所述数据处理后,生成海量无标注样本,进而通过预设查询SQL范式样板,采用UDA技术实现标注训练样本数据集;S2、NL
‑
to
‑
SQL模型训练,对获取的自然语言样本进行样本数据训练,生成结构化查询语言模型,所述模型包括权重层和激活层,采用TernaryBERT模型对所述权重层和激活层进行量化;S3、模型压缩及生成模块,为弥补由于TernaryBERT模型在包括智能客服业务咨询的任务上由于量化过度导致效果不足,采用预训练知识蒸馏方式对所述模型进一步压缩处理,同时,为防止蒸馏结构网络权重的陷入局部最优值,采用蝙蝠算法进行参数训练和智能搜索,找到最优的蒸馏网络结构;S4、对话管理,经TernaryBERT模型训练和PKD模型压缩后,进行预处理,再将所述模型融合预设的SQL范式,关联和生成完整的数据库查询SQL,进而和智能客服界面进行交互,实现对话管理应用。2.如权利要求1所述的方法,其中,S1步骤中所述产品运营数据包括来电名片和挂机短信,对所述数据处理方式包括进行分词、去除停用词、替换英文标点、构建问答数据集、构建句向量索引数据库,进而生成的海量无标注样本。3.如权利要求1所述的方法,其中,S2步骤中所述NL
‑
to
‑
SQL模型训练采用TernaryBERT模型,该模型对权重层量化和激活层量化,其中,所述权重层包含线性层与Embedding层,所述线性层与Embedding层参数占所述TernaryBERT模型总参数的绝大部分,因而所述TernaryBERT模型对所述线性层与Embedding层进行较为彻底的量化;其中,在所述激活层的量化中,采用8bit的对称与非对称方法进行量化。4.如权利要求3所述的方法,其中,在所述激活层量化中,实际的推理过程中,矩阵乘法由32bit的浮点数运算变为int8的整形运算,达到加速的目标;该模型实现仅占BERT模型的6.7%的参数情况下达到和全精度模型相当的性能。5.如权利要求1所述的方法,其中,S3步骤中所述预训练知识蒸馏采用PKD
‑
Last和PKD
‑
Skip两种策略从“teacher”模型的隐含层中抽取隐藏知识,彻底消除“student”模型模仿“teacher”模型的输出,其中,所述PKD
‑
Last策略是使用“teacher”模型的最后k层中蕴含的知识;所...
【专利技术属性】
技术研发人员:周晓辉,王华超,
申请(专利权)人:号百信息服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。