当前位置: 首页 > 专利查询>高炼专利>正文

一种将自然语言转化为程序代码的方法及系统技术方案

技术编号：27253341 阅读：43 留言：0更新日期：2021-02-04 12:31

本发明专利技术提出了一种将自然语言转化为程序代码的方法及系统，涉及深度学习领域。一种将自然语言转化为程序代码的方法包括：对输入的源语言进行预处理，提取源语言中与目标代码直接有关的关键信息；根据深度学习模型提取源语言的特征向量，并将源语言解析成语法树；在预构资源库中为源语言检索出可能匹配的若干个资源；对检索到的中间表示作出可能的转换变为相互关联的模板。其创新性地视自然语言转化为程序代码的过程为机器学习与信息检索的不确定性问题。此外本发明专利技术还提出一种将自然语言转化为程序代码系统，包括：预处理模块、分析模块、检索模块、转换模块、连接模块以及转化模块。块。块。

全部详细技术资料下载

【技术实现步骤摘要】
一种将自然语言转化为程序代码的方法及系统

[0001]本专利技术涉及深度学习领域，具体而言，涉及一种将自然语言转化为程序代码的方法及系统。

技术介绍

[0002]计算机语言在计算机领域内应用范围广泛，但是，随着计算机语言的高速发展，其种类越来越多，并且计算机语言的复杂度也较高，掌握并达到精通的程度比较困难。
[0003]在越来越多的计算机应用中要求相关产品的产出既要高效又要周期短。对这些应用的实现，要求应用设计者和实施者具有较高的计算机语言水平。而在现实环境中这往往意味着需要付出更多的成本用于编码和设计培训的投入，并且导致规模性的实施相对困难。
[0004]计算机语言的使用风格与自然语言差别巨大，计算机语言表述信息比自然语言更加精确，但是复杂度也相对更高。对计算机语言从掌握到精通往往需要较高的成本投入，并且实现周期过长。

技术实现思路

[0005]本专利技术的目的在于提供一种将自然语言转化为程序代码的方法，其能够创新性地视自然语言转化为程序代码的过程为机器学习与信息检索的不确定性问题，定义了这一问题中的评价标准，以使得其能够采用其他问题中常见的衡量指标进行评估。
[0006]本专利技术的另一目的在于提供一种将自然语言转化为程序代码系统，其能够运行一种将自然语言转化为程序代码的方法。
[0007]本专利技术的实施例是这样实现的：
[0008]第一方面，本申请实施例提供一种将自然语言转化为程序代码的方法，其包括对输入的源语言进行预处理，提取源语言中与目标代码直接有关...

【技术保护点】

【技术特征摘要】
1.一种将自然语言转化为程序代码的方法，其特征在于，包括：对输入的源语言进行预处理，提取源语言中与目标代码直接有关的关键信息；根据深度学习模型提取源语言的特征向量，并将源语言解析成语法树；在预构资源库中为源语言检索出可能匹配的若干个资源；对检索到的中间表示作出可能的转换变为相互关联的模板；将正确的一套模板的空槽填入对应的代码块与变量，得到当前句子对应的一套相关联的代码块，并与其他句子的代码块以同样方式连接，形成目标代码的整体的图状数据结构；将图状数据结构转化为最终的目标代码。2.如权利要求1所述的一种将自然语言转化为程序代码的方法，其特征在于，在所述对输入的源语言进行预处理，提取源语言中与目标代码直接有关的关键信息之后包括：将源语言进行分割后，依次处理每个单元，并将源语言处理成适合深度学习模型处理的标准形式。3.如权利要求1所述的一种将自然语言转化为程序代码的方法，其特征在于，所述根据深度学习模型提取源语言的特征向量，并将源语言解析成语法树包括：使用训练好的深度学习模型处理源语言，根据源语言语法上的构成关系将其分解并组织成更易于处理的树状结构，并提取句子、子句、词组、单词的语义特征向量。4.如权利要求1所述的一种将自然语言转化为程序代码的方法，其特征在于，所述在预构资源库中为源语言检索出可能匹配的若干个资源包括：迭代处理语法树，并在预构资源库中检索可能与当前树节点对应的源语言成分匹配的源语言模式；源语言模式被映射成代码模板或变量模板与目标语言有关的表示。5.如权利要求4所述的一种将自然语言转化为程序代码的方法，其特征在于，还包括：源语言模式被映射成一阶谓词逻辑表示、lambda表达式表示或程序代码数据结构的表示独立于源语言与目标语言的中间表示。6.如权利要求1所述的一种将自然语言转化为程序代码的方法，其特征在于，所述对检索到...

【专利技术属性】
技术研发人员：高炼，
申请(专利权)人：高炼，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人