一种文件处理方法、设备及计算机可读存储介质技术

技术编号:36735961 阅读:23 留言:0更新日期:2023-03-04 10:07
本申请实施例公开了一种文件处理方法,该方法包括:获取针对第一语言的第一语法文件和针对第二语言的第二语法文件;和/或,获取针对第一语言的第一词法文件和针对第二语言的第二词法文件;在确定第一语言和第二语言具备语言兼容条件的情况下,基于第一词法文件和第二词法文件,确定目标词法文件;和/或,在确定第一语言和第二语言具备语言兼容条件的情况下,基于第一语法文件和第二语法文件,确定目标语法文件;基于目标词法文件和/或目标语法文件,对待处理文件进行处理。本申请实施例同时还公开了一种文件处理设备及计算机可读存储介质。开了一种文件处理设备及计算机可读存储介质。开了一种文件处理设备及计算机可读存储介质。

【技术实现步骤摘要】
一种文件处理方法、设备及计算机可读存储介质


[0001]本申请涉及文件处理领域的文件处理技术,尤其涉及一种文件处理方法、设备及计算机可读存储介质。

技术介绍

[0002]随着互联网的飞速发展,黑客利用全球广域网(World Wide Web,Web)漏洞远程注入恶意代码,从而控制服务端或窃取服务端信息;对全球广域网中未知语言的代码进行处理来确定未知语言的代码是否为恶意代码,是一种防御黑客控制服务端或窃取服务端信息的有效手段。目前,对未知语言的代码进行处理时,需要采用多种语言中每种语言的语法文件和词法文件对未知语言的代码进行尝试处理,以确定未知语言的代码的含义,以便后续根据未知语言的代码的含义确定未知语言的代码是否为恶意代码;但是,对未知语言的代码进行处理时需要采用多种语言的语法文件和词法文件依次进行尝试处理,导致对未知语言的代码的处理效率低。

技术实现思路

[0003]为解决上述技术问题,本申请实施例提供一种文件处理方法、设备及计算机可读存储介质,解决了对待处理文件处理的效率低的问题,提高了对待处理文件的处理效率。
[0004]一种文件处理方法,所述方法包括:
[0005]获取针对第一语言的第一语法文件和针对第二语言的第二语法文件;和/或,
[0006]获取针对所述第一语言的第一词法文件和针对所述第二语言的第二词法文件;
[0007]在确定所述第一语言和所述第二语言具备语言兼容条件的情况下,基于所述第一词法文件和所述第二词法文件,确定目标词法文件;其中,所述目标词法文件包括融合所述第一语言的词法和所述第二语言的词法的文件;和/或,
[0008]在确定所述第一语言和所述第二语言具备语言兼容条件的情况下,基于所述第一语法文件和所述第二语法文件,确定目标语法文件;其中,所述目标语法文件包括融合所述第一语言的语法和所述第二语言的语法的文件;
[0009]基于所述目标词法文件和/或所述目标语法文件,对待处理文件进行处理。
[0010]上述方案中,所述基于所述第一词法文件和所述第二词法文件,确定目标词法文件,包括:
[0011]获取所述第一词法文件中的第一字词,并获取所述第二词法文件中的第二字词;
[0012]确定所述第一字词的第一字词信息和所述第二字词的第二字词信息;
[0013]基于所述第一字词、所述第二字词、所述第一字词信息和所述第二字词信息,确定所述目标词法文件。
[0014]上述方案中,所述确定所述第一字词的第一字词信息和所述第二字词的第二字词信息,包括:
[0015]从所述第一词法文件中确定所述第一字词的第一正则表达式,并从所述第二词法
文件中确定所述第二字词的第二正则表达式;
[0016]相应的,所述基于所述第一字词、所述第二字词、所述第一字词信息和所述第二字词信息,确定所述目标词法文件,包括:
[0017]基于所述第一字词、所述第二字词、所述第一正则表达式和所述第二正则表达式,确定所述目标词法文件。
[0018]上述方案中,所述基于所述第一字词、第二字词、第一正则表达式和所述第二正则表达式,确定所述目标词法文件,包括:
[0019]确定所述第一正则表达式和所述第二正则表达式的匹配度;
[0020]在所述匹配度为目标阈值的情况下,设置所述第一字词的第一词法类型和所述第二字词的第二词法类型为相同词法类型,且基于所述第一字词、所述第二字词和所述第一正则表达式确定所述目标词法文件;
[0021]在所述匹配度大于零且小于所述目标阈值以及所述第一词法类型和所述第二词法类型相同,或,所述匹配度为零的情况下,基于所述第一字词、所述第二字词、所述第一正则表达式和所述第二正则表达式,确定所述目标词法文件。
[0022]上述方案中,所述方法还包括:
[0023]在所述匹配度大于零且小于所述目标阈值以及所述第一词法类型和所述第二词法类型不同的情况下,获取所述第一字词之间的第一关联关系和所述第二字词之间的第二关联关系,并基于所述第一字词、所述第二字词、所述第一关联关系、所述第二关联关系、所述第一正则表达式和所述第二正则表达式,确定所述目标词法文件。
[0024]上述方案中,所述方法还包括:
[0025]在所述匹配度大于零且小于所述目标阈值以及所述第一词法类型和所述第二词法类型不同的情况下,基于所述第一字词和所述第一正则表达式确定第一词法路径,并基于所述第二字词和所述第二正则表达式确定第二词法路径;其中,所述目标词法文件包括第一词法路径和所述第二词法路径。
[0026]上述方案中,所述基于所述第一语法文件和所述第二语法文件,确定目标语法文件,包括:
[0027]获取所述第一语法文件中的第一语句,并获取所述第二语法文件中的第二语句;
[0028]基于所述第一语句和所述第二语句,确定所述目标语法文件。
[0029]上述方案中,所述基于所述第一语句和所述第二语句,确定所述目标语法文件,包括:
[0030]获取所述第一语句的第一语法规约式,并获取所述第二语句的第二语法规约式;
[0031]确定所述第一语法规约式对应的句式之间的第一句式关联关系,并确定所述第二语法规约式对应的句式之间的第二句式关联关系;
[0032]基于所述第一句式关联关系和第二句式关联关系,将所述第一语句和所述第二语句进行组合以及将所述第二语法规约式和所述第一语法规约式组合,得到所述目标语法文件。
[0033]上述方案中,所述基于所述第一句式关联关系和第二句式关联关系,将所述第一语句和所述第二语句进行组合以及将所述第二语法规约式和所述第一语法规约式组合,得到所述目标语法文件,包括:
[0034]基于所述第一句式关联关系和第二句式关联关系,将所述第一语句和所述第二语句进行组合以及将所述第二语法规约式和所述第一语法规约式组合,得到备选语法文件;
[0035]在所述备选语法文件中存在语法错误的情况下,对所述备选语法文件进行矫正得到所述目标语法文件;
[0036]在所述备选语法文件中不存在语法错误的情况下,确定所述目标语法文件为所述备选语法文件。
[0037]上述方案中,所述在所述备选语法文件中存在语法错误的情况下,对所述备选语法文件进行矫正得到所述目标语法文件,包括:
[0038]对所述备选语法文件中的第三语法规约式进行调整,得到所述目标语法文件;或
[0039]在所述备选语法文件存在错误的情况下,删除所述备选语法文件中存在错误的内容,得到所述目标语法文件;
[0040]在所述备选语法文件存在错误的情况下,增加所述备选语法文件中的第三语法规约式的长度,得到所述目标语法文件;
[0041]在所述备选语法文件存在错误的情况下,获取所述第三语法规约式之间的语法关联关系,并基于所述语法关联关系、所述第三语法规约式确定所述目标语法文件。
[0042]上述方案中,所述获取针对所述第一语言的第一词法文件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,其特征在于,所述方法包括:获取针对第一语言的第一语法文件和针对第二语言的第二语法文件;和/或,获取针对所述第一语言的第一词法文件和针对所述第二语言的第二词法文件;在确定所述第一语言和所述第二语言具备语言兼容条件的情况下,基于所述第一词法文件和所述第二词法文件,确定目标词法文件;其中,所述目标词法文件包括融合所述第一语言的词法和所述第二语言的词法的文件;和/或,在确定所述第一语言和所述第二语言具备语言兼容条件的情况下,基于所述第一语法文件和所述第二语法文件,确定目标语法文件;其中,所述目标语法文件包括融合所述第一语言的语法和所述第二语言的语法的文件;基于所述目标词法文件和/或所述目标语法文件,对待处理文件进行处理。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一词法文件和所述第二词法文件,确定目标词法文件,包括:获取所述第一词法文件中的第一字词,并获取所述第二词法文件中的第二字词;确定所述第一字词的第一字词信息和所述第二字词的第二字词信息;基于所述第一字词、所述第二字词、所述第一字词信息和所述第二字词信息,确定所述目标词法文件。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一语法文件和所述第二语法文件,确定目标语法文件,包括:获取所述第一语法文件中的第一语句,并获取所述第二语法文件中的第二语句;基于所述第一语句和所述第二语句,确定所述目标语法文件。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一语句和所述第二语句,确定所述目标语法文件,包括:获取所述第一语句的第一语法规约式,并获取所述第二语句的第二语法规约式;确定所述第一语法规约式对应的句式之间的第一句式关联关系,并确定所述第二语法规约式对应的句式之间的第二句式关联关系;基于所述第一句式关联关系和第二句式关联关系,将所述第一语句和所述第二语句进行组合以及将所述第二语法规约式和所述第一语法规约式组合,得到所述目标语法文件。5.根据权利要求1所述的方法,其特征在于,所述获取针对所述第一语言的第一词法文件和针对所述第二语言的第二词法文件,包括:在所述第一语言和所述第二语言具备语言兼容条件的情况下,获取所述第一词法文件和所述第二词法文件;相应的,所述方法还包括:在所述第一语言和所述第二语言不具备语言兼容条件的情况下,生成告警信息并输出,其中,所述告警信息用于提示所述第一语言和所述第二语言无法兼容。6.根据权利要求1或5所述的方法,所述在确定所述第一语言和所述第二语言具备语言兼容条件的情况下,基于所述第一词法文件和所述第二词法文件,确定目标词法文件之前,还包括:基于所述第一语法文件中的第一文法结构确定所述第一语言的复杂度,基于所述第二语法文件中的第二文法结构确定所述第二语言的复杂度;
基于所述第一语法文件中的标识符和所述第二语法文件中的标识符的相似度,确定所述第一语法文件和所述第二语法文件的语言相似度...

【专利技术属性】
技术研发人员:兰家旺杨荣海范炜轩
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1