一种基于NLP算法的预警处理方法及系统技术方案

技术编号:27146991 阅读:28 留言:0更新日期:2021-01-27 22:05
本申请实施例公开了一种基于NLP算法的预警处理方法和系统。本申请方法包括:获取报错信息;收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。通过训练模型计算提高了系统报错问题描述数据的准确度。描述数据的准确度。描述数据的准确度。

【技术实现步骤摘要】
一种基于NLP算法的预警处理方法及系统


[0001]本申请实施例涉及人工智能领域,尤其涉及一种基于NLP算法的预警方法及系统。

技术介绍

[0002]随着互联网信息社会的不断发展,互联网的技术要求也就越来越高。目前很多互联网公司后端有很多复杂的系统,例如手机软件后端、万维网后端以及大数据系统等,这些后端程序是否运行良好都会配有各种预警服务来监控,预警服务器发现后端程序报错就会发送信息给相关的运维人员或者软件工程师。然后运维人员和工程师通过跟踪报错信息与源代码人工判断出问题原因,再进行系统修复。
[0003]在现有技术中,工程师接收到报错信息后一般是查看报错信息提供的程序运行日志、程序代码报错行号以及完整的调用顺序,工程师再根据经验查看代码,模拟用户输入来复现问题,由于工程师是根据个人经验查看代码并且结果也是模拟用户输入得到的,容易出现得到的系统报错问题描述不准确的情况。

技术实现思路

[0004]本申请实施例提供了一种基于NLP算法的预警处理方法及系统,用于提高系统报错问题描述数据的准确度。
[0005]本申请实施例第一方面提供了基于NLP算法的处理方法,包括:
[0006]获取报错信息;
[0007]收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;
[0008]将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;
[0009]输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;
[0010]输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。
[0011]可选的,所述将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码,包括:
[0012]对于所述报错信息的相关程序源代码中的扩展源代码执行宏替换操作;
[0013]启动编译器通过汇编语言将源代码编译成可执行二进制代码。
[0014]可选的,在输入所述编码后的代码数据到预设NLP算法模型中进行深度学习之前,所述方法还包括:
[0015]训练预设NLP算法模型,所述预设NLP算法模型用于采用code2vec神经网络的部分读取代码向量。
[0016]可选的,所述输入所述编码后的代码数据到预设NLP算法模型中进行深度学习,包括:
[0017]获取一种新方法;
[0018]通过所述code2vec神经网络将所述新方法的下上文路径样本输入到预设NLP算法模型中进行深度学习。
[0019]可选的,所述输出进行深度学习并且解码代码数据后的自然语言,包括:
[0020]将进行深度学习后的代码进行解码;
[0021]输出解码后的自然语言。
[0022]可选的,所述方法还包括:
[0023]结合静态程序和动态程序分析所述报错信息中源代码运行发生的代码功能以及代码各种类型的数据。
[0024]本申请实施例第二方面提供了基于NLP算法的预警处理系统,包括:
[0025]获取单元,用于获取报错信息;
[0026]收集单元,用于收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;
[0027]编码单元,用于将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;
[0028]输入单元,用于输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;
[0029]输出单元,用于输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。
[0030]可选的,所述编码单元包括:
[0031]执行模块,用于对于所述报错信息的相关程序源代码中的扩展源代码执行宏替换操作;
[0032]启动模块,用于启动编译器通过汇编语言将源代码编译成可执行二进制代码。
[0033]可选的,在所述输入单元之前,所述系统还包括:
[0034]训练单元,用于训练预设NLP算法模型,所述预设NLP算法模型用于采用code2vec神经网络的部分读取代码向量。
[0035]可选的,所述输入单元包括:
[0036]获取模块,用于获取一种新方法;
[0037]输入模块,用于通过所述code2vec神经网络将所述新方法的下上文路径样本输入到预设NLP算法模型中进行深度学习。
[0038]可选的,所述输出单元包括:
[0039]解码模块,用于将进行深度学习后的代码进行解码;
[0040]输出模块,用于输出解码后的自然语言。
[0041]可选的,所述系统还包括:
[0042]结合静态程序和动态程序分析所述报错信息中源代码运行发生的代码功能以及代码各种类型的数据。
[0043]本申请实施例第三方面提供了基于NLP算法的处理系统,包括:
[0044]处理器、存储器、输入输出单元、总线;
[0045]所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
[0046]所述处理器具体执行如下操作:
[0047]获取报错信息;
[0048]收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;
[0049]将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;
[0050]输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;
[0051]输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。
[0052]可选的,所述处理器还用于执行第一方面中的任意可选方案的操作。
[0053]本申请实施例第四方面提供了基于NLP算法的处理的计算机可读存储介质,包括:
[0054]所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行前述基于NLP算法的处理方法。
[0055]从以上技术方案可以看出,本申请实施例具有以下优点:在本申请中,系统获取到报错信息后收集报错信息的相关程序源代码,将源代码数据进行编码成可执行二进制代码,将编码后的代码数据输入到预设NLP算法模型中进行深度学习,最后输出进行深度学习并且解码代码数据后的自然语言,这样通过模型计算提高了系统报错问题描述数据的准确度。
附图说明
[0056]图1为本申请实施例中基于NLP算法的处理方法的一个实施例流程示意图;
[0057]图2为本申请实施例中基于NLP算法的处理方法的另一个实施例流程示意图;
[0058]图3为本申请实施例中基于NLP算法的处理系统的一个实施例结构示意图;
[0059]图4为本申请实施例中基于NLP算法的处理系统的另一个实施例结构示意图;
[0060]图5为本申请实施例中基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP算法的预警处理方法,其特征在于,包括:获取报错信息;收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。2.根据权利要求1所述的方法,其特征在于,所述将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码,包括:对于所述报错信息的相关程序源代码中的扩展源代码执行宏替换操作;启动编译器通过汇编语言将源代码编译成可执行二进制代码。3.根据权利要求1所述的方法,其特征在于,在输入所述编码后的代码数据到预设NLP算法模型中进行深度学习之前,所述方法还包括:训练预设NLP算法模型,所述预设NLP算法模型用于采用code2vec神经网络的部分读取代码向量。4.根据权利要求3所述的方法,其特征在于,所述输入所述编码后的代码数据到预设NLP算法模型中进行深度学习,包括:获取一种新方法;通过所述code2vec神经网络将所述新方法的下上文路径样本输入到预设NLP算法模型中进行深度学习。5.根据权利要求1所述的方法,其特征在于,所述输出进行深度学习并且解码代码数据后的自然语言,包括:将进行深度学习后的代码进行解码;输出解码后的自然语言。6.根...

【专利技术属性】
技术研发人员:姜坤
申请(专利权)人:加和北京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1