The invention discloses a prediction next sentence model automatic construction technology based on the Bert model, including test map data acquisition and natural language reasoning model construction training and prediction. The test map data acquisition part can connect the map database and automatically obtain data with specified relationship in all apps related to a certain field. The invention relates to the field of natural language processing technology \u3002 By applying the natural language reasoning technology in deep learning to the app testing field, the node pairs with the next sentence relationship in the graph database are automatically obtained, and the training data needed to convert the prediction into the next sentence model is automatically processed. The prediction next sentence model based on Bert is used to realize the automatic reasoning and assist the completion It can automatically construct the map and improve the working efficiency. Compared with other natural language reasoning models, the prediction accuracy of the next sentence model based on Bert is higher.
【技术实现步骤摘要】
一种基于BERT模型的预测下一句模型自动构建技术
本专利技术涉及自然语言处理
,具体为一种基于BERT模型的预测下一句模型自动构建技术。
技术介绍
在当前时期,以深度学习为主的自然语言处理技术已经广泛应用于各个场景,用于辅助人类理解、处理自然语言与文本,典型应用场景包括文本分类、对话系统、问答系统、文本翻译和自然语言推理,自然语言推理作为自然语言理解的一个重要组成部分,在整个自然语言理解中扮演着重要的角色,自然语言推理主要是判断两个句子或者两个词之间的语义关系,为了保证模型能够集中在语义理解上,该任务最终退化为一个分类任务,简单来说,文本蕴含关系描述的是两个文本之间的推理关系,其中一个文本作为前提,另一个文本作为假设,如果根据前提P能够推理得出假设H,那么就说P蕴含H,记做P→H。在APP测试领域,同样存在这种文本蕴含关系,当执行到测试某一节点时,在整个界面上有众多待测试节点,测试人员需要选择下一个需要测试节点,当前节点与下一个节点间即存在文本蕴含关系,当测试新的APP时,首先需要匹配新的APP节点与已有图谱中某个节点是否相似,如果没有找到,则需要使用图谱数据中的这种文本蕴含关系,需要针对上一操作节点和当前界面的候选节点,加载预测下一句模型实现自然语言推理,从而找到当前可能的待测试节点,辅助完成新APP自动测试。目前在NLP领域其他场景,也同样使用了自然语言推理技术,挖掘文本之间存在的文本蕴含关系,例如在进行文本推理时,判断两句话之前是否具有因果关系或者并列关系,传统方法基于循环神经网络结合At ...
【技术保护点】
1.一种基于BERT模型的预测下一句模型自动构建技术,其特征在于:包括测试图谱数据获取和自然语言推理模型构建训练、预测,所述测试图谱数据获取部分能够连接图数据库,自动获取某个领域有关的所有APP中具有指定关系的数据;/n所述自然语言推理模型构建训练、预测部分的处理方法具体包括以下步骤:/nS1、首先根据处理得到的训练数据;/nS2、再进行相关预处理,转换为BERT模型所需格式,在bert-base-chinese模型基础上进行fine-tune训练得到领域相关的预测下一句模型并保存模型参数;/nS3、编写模型预测函数实现加载训练好的模型参数进行关系预测,作为推理模块供图谱路径生成模块调用。/n
【技术特征摘要】
1.一种基于BERT模型的预测下一句模型自动构建技术,其特征在于:包括测试图谱数据获取和自然语言推理模型构建训练、预测,所述测试图谱数据获取部分能够连接图数据库,自动获取某个领域有关的所有APP中具有指定关系的数据;
所述自然语言推理模型构建训练、预测部分的处理方法具体包括以下步骤:
S1、首先根据处理得到的训练数据;
S2、再进行相关预处理,转换为BERT模型所需格式,在bert-base-chinese模型基础上进行fine-tune训练得到领域相关的预测下一句模型并保存模型参数;
S3、编写模型预测函数实现加载训练好的模型参数进行关系预测,作为推理模块供图谱路径生成模块调用。
2.根据权利要求1所述的一种基于BERT模型的预测下一句模型自动构建技术,其特征在于:所述步骤S2在基于BERT的预测下一句模型中,输入句子A和B被拼接到一起,两句子之间以句子分隔符[SEP]隔开,并且在拼接完毕的句子头部再引入一个分类标识符[CLS]。
3.根据权利要求2所述的一种基于BERT模型的预测下一句模型自动构建技术,其特征在于:所述步骤S2中使整个模型的输入变成如下格式:[CLS]A[SEP]B,模型会先将句子分...
【专利技术属性】
技术研发人员:刘轶,
申请(专利权)人:南京璇玑信息技术有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。