一种邮件附件病毒识别方法、系统、设备及可存储介质技术方案

技术编号:37670619 阅读:10 留言:0更新日期:2023-05-26 04:32
本发明专利技术公开了一种邮件附件病毒识别方法、系统、设备及可存储介质,通过先对邮件文件进行判断,判断是否包括邮件附件文件头,若是,则将邮件文本内容和邮件附件进行提取,否则提取邮件文本内容,然后再对邮件附件进行文件头特征提取,依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,不仅能够加快邮件附件病毒识别的效率,还能够提高邮件附件病毒识别的准确率,此外,通过对邮件附件进行邮件附件文本内容提取和拆解存储,能够有效保存风险邮件附件样本,便于管理者取样。便于管理者取样。便于管理者取样。

【技术实现步骤摘要】
一种邮件附件病毒识别方法、系统、设备及可存储介质


[0001]本专利技术涉及邮件附件病毒识别
,尤其涉及一种邮件附件病毒识别方法、系统、设备及可存储介质。

技术介绍

[0002]在人们的日常工作中邮件是大家沟通必不可少的,正因为如此,邮件承载的攻击也非常多,通过邮件可以传递恶意的信息,诱导用户进行一些操作,也可以传递恶意的网络链接,获取用户名密码等,还有一种就是传递恶意程序,通常这类是以附件形式存在的,因此,对于邮件附件进行病毒识别是十分重要的,现有的邮件附件识别方法是对邮件进行解析,获取邮件附件,使用反病毒软件对附件进行识别,从而实现邮件附件病毒识别的效果,然而,现有技术是基于特征码进行识别,识别准确性比较低。

技术实现思路

[0003]有鉴于此,本专利技术提出一种邮件附件病毒识别方法、系统、设备及可存储介质,可以解决现有技术所存在的识别准确性比较低的缺陷。
[0004]本专利技术的技术方案是这样实现的:
[0005]一种邮件附件病毒识别方法,具体包括:
[0006]获取邮件文件;
[0007]对邮件文件进行判断,判断是否包括邮件附件文件头,若是,则将邮件文本内容和邮件附件进行提取,否则提取邮件文本内容;
[0008]提取邮件附件的文件头特征;
[0009]依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,若是,则对邮件附件进行邮件附件文本内容提取和拆解存储,从而实现邮件附件病毒的识别。
[0010]作为所述邮件附件病毒识别方法的进一步可选方案,所述邮件附件的文件头特征包括纯文本格式、文档格式、语音视频格式、图片格式、应用程序格式和其他格式。
[0011]作为所述邮件附件病毒识别方法的进一步可选方案,所述依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,具体包括:
[0012]对邮件附件的文件头特征进行识别,识别出邮件附件的文件头特征是否属于纯文本格式、文档格式、语音视频格式、图片格式和应用程序格式中的任意一种,若是,则判断该邮件附件为正常邮件附件,否则判断该邮件附件为风险邮件附件。
[0013]作为所述邮件附件病毒识别方法的进一步可选方案,所述对邮件附件进行邮件附件文本内容提取,具体包括:
[0014]将邮件附件转换为纯文本;
[0015]基于自然语言处理技术识别纯文本中的人名、商品、企业、地址、集装箱、报关单和联系电话。
[0016]作为所述邮件附件病毒识别方法的进一步可选方案,所述对邮件附件进行拆解存
储,具体包括:
[0017]获取文件存储规则和文件存储位置;
[0018]依据所述文件存储规则对邮件附件进行拆解;
[0019]依据所述文件存储位置对拆解后的邮件附件进行存储。
[0020]一种邮件附件病毒识别系统,包括:
[0021]第一获取模块,用于获取邮件文件;
[0022]判断模块,用于对邮件文件进行判断,判断是否包括邮件附件文件头;
[0023]第一提取模块,用于将邮件文本内容和邮件附件进行提取或者将邮件文本内容进行提取;
[0024]第二提取模块,用于提取邮件附件的文件头特征;
[0025]识别模块,用于依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件;
[0026]第三提取模块,用于对邮件附件进行邮件附件文本内容进行提取;
[0027]拆解存储模块,用于对邮件附件进行邮件附件文本内容进行拆解存储。
[0028]作为所述邮件附件病毒识别系统的进一步可选方案,所述识别模块包括:
[0029]文件头特征识别模块,用于对邮件附件的文件头特征进行识别,识别出邮件附件的文件头特征是否属于纯文本格式、文档格式、语音视频格式、图片格式和应用程序格式中的任意一种;
[0030]判断模块,用于依据文件头特征识别判断邮件附件是否为风险邮件附件。
[0031]作为所述邮件附件病毒识别系统的进一步可选方案,所述第三提取模块包括转换模块和处理模块,所述拆解存储模块包括第二获取模块、拆解模块和存储模块,其中:
[0032]转换模块,用于将邮件附件转换为纯文本;
[0033]处理模块,用于基于自然语言处理技术识别纯文本中的人名、商品、企业、地址、集装箱、报关单和联系电话;
[0034]第二获取模块,用于获取文件存储规则和文件存储位置;
[0035]拆解模块,用于依据所述文件存储规则对邮件附件进行拆解;
[0036]存储模块,用于依据所述文件存储位置对拆解后的邮件附件进行存储。
[0037]一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一种邮件附件病毒识别方法的步骤。
[0038]一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种邮件附件病毒识别方法的步骤。
[0039]本专利技术的有益效果是:通过先对邮件文件进行判断,判断是否包括邮件附件文件头,若是,则将邮件文本内容和邮件附件进行提取,否则提取邮件文本内容,然后再对邮件附件进行文件头特征提取,依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,不仅能够加快邮件附件病毒识别的效率,还能够提高邮件附件病毒识别的准确率,此外,通过对邮件附件进行邮件附件文本内容提取和拆解存储,能够有效保存风险邮件附件样本,便于管理者取样。
附图说明
[0040]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本专利技术一种邮件附件病毒识别方法的流程示意图;
[0042]图2为本专利技术一种邮件附件病毒识别系统的组成示意图。
具体实施方式
[0043]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0044]参考图1

2,一种邮件附件病毒识别方法,具体包括:
[0045]获取邮件文件;
[0046]对邮件文件进行判断,判断是否包括邮件附件文件头,若是,则将邮件文本内容和邮件附件进行提取,否则提取邮件文本内容;
[0047]提取邮件附件的文件头特征;
[0048]依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,若是,则对邮件附件进行邮件附件文本内容提取和拆解存储,从而实现邮件附件病毒的识别。
[0049本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种邮件附件病毒识别方法,其特征在于,具体包括:获取邮件文件;对邮件文件进行判断,判断是否包括邮件附件文件头,若是,则将邮件文本内容和邮件附件进行提取,否则提取邮件文本内容;提取邮件附件的文件头特征;依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,若是,则对邮件附件进行邮件附件文本内容提取和拆解存储,从而实现邮件附件病毒的识别。2.根据权利要求1所述的一种邮件附件病毒识别方法,其特征在于,所述邮件附件的文件头特征包括纯文本格式、文档格式、语音视频格式、图片格式、应用程序格式和其他格式。3.根据权利要求2所述的一种邮件附件病毒识别方法,其特征在于,所述依据文件头特征对邮件附件进行格式识别,识别邮件附件是否风险邮件附件,具体包括:对邮件附件的文件头特征进行识别,识别出邮件附件的文件头特征是否属于纯文本格式、文档格式、语音视频格式、图片格式和应用程序格式中的任意一种,若是,则判断该邮件附件为正常邮件附件,否则判断该邮件附件为风险邮件附件。4.根据权利要求3所述的一种邮件附件病毒识别方法,其特征在于,所述对邮件附件进行邮件附件文本内容提取,具体包括:将邮件附件转换为纯文本;基于自然语言处理技术识别纯文本中的人名、商品、企业、地址、集装箱、报关单和联系电话。5.根据权利要求4所述的一种邮件附件病毒识别方法,其特征在于,所述对邮件附件进行拆解存储,具体包括:获取文件存储规则和文件存储位置;依据所述文件存储规则对邮件附件进行拆解;依据所述文件存储位置对拆解后的邮件附件进行存储。6.一种邮件附件病毒识别系统,其特征在于,包括:第一获取模块,用于获取邮件文件;判断模块,用于对邮件文件进行判断,判断是否包括邮件附件文件头;第一提取模块,用于将邮件文本内容和邮件...

【专利技术属性】
技术研发人员:邹潜亨钟伟彬
申请(专利权)人:广州尚融网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1