垃圾邮件处理方法及系统技术方案

技术编号:9671198 阅读:168 留言:0更新日期:2014-02-14 18:07
一种垃圾邮件处理方法,包括如下步骤:接收被拦截的邮件;判断所述邮件的数据量是否大于阈值;如果是,以单文件的形式单独存储所述邮件;如果否,将所述邮件添加在预定文件中进行集中存储。上述垃圾邮件处理方法,通过判断邮件的数据量与阈值的关系,将邮件分为两种存储方式:邮件的数据量大于阈值的,以单文件的形式单独存储邮件;邮件的数据量不大于阈值的,将邮件添加在预定文件中进行集中存储。将邮件添加在预定文件中进行集中存储,减少了文件的数量,可以减少磁盘输入输出操作的次数,减少了邮件存储耗时。此外,还提供一种垃圾邮件处理系统。

【技术实现步骤摘要】
垃圾邮件处理方法及系统
本专利技术涉及计算机技术,特别是涉及一种垃圾邮件处理方法及系统。
技术介绍
电子邮件(E-mail,又称电子函件、电邮或邮件)是指通过互联网进行书写、发送和接收信件,目的是达成发信人和收信人之间的信息交互。随着计算机的普及,电子邮件的使用也越来越广泛。然而,电子邮件也出现了被滥用的情况,即部分用户使用电子邮件大量发送广告等垃圾邮件,使得很多收到垃圾邮件的用户不得不花很多时间清理。对此,部分邮件服务商提供了自动过滤垃圾邮件的服务,将系统自动识别为垃圾邮件的邮件单独放置到垃圾箱或是直接删除等。直接删除的方式容易导致系统错误识别为垃圾邮件的有用邮件的丢失。放置到垃圾箱中的方式由于可以被恢复,因而被广泛使用。随着垃圾邮件数量的增加,邮件存储耗费的时间越来越长,也会导致读取供用户确认是否是垃圾邮件、恢复为正常邮件的速度越来越慢。对此,部分邮件服务提供商将高概率为垃圾邮件的电子邮件直接删除而不再存储,相对概率低一点的垃圾邮件则存储下来以备用户恢复,这样可以减少存储空间的浪费和对存储、读取邮件速度的影响。然而,这种方式还是难免会造成极个别的有用邮件被当作垃圾邮件删除。
技术实现思路
基于此,有必要针对传统的垃圾邮件处理耗时越来越长的问题,提供一种垃圾邮件处理方法。一种垃圾邮件处理方法,包括:接收被拦截的邮件;判断所述邮件的数据量是否大于阈值;如果是,以单文件的形式单独存储所述邮件;如果否,将所述邮件添加在预定文件中进行集中存储。此外,还有必要针对大量邮件存储耗时越来越长的问题,提供一种垃圾邮件处理系统。一种垃圾邮件处理系统,包括:接收模块,用于接收被拦截的邮件;判断模块,用于判断所述邮件的数据量是否大于阈值;第一存储模块,如果所述邮件大于阈值,以单文件的形式单独存储所述邮件;第二存储模块,如果所述邮件不大于阈值,将所述邮件添加在预定文件中进行集中存储。上述垃圾邮件处理方法及系统,通过判断邮件的数据量与阈值的关系,将邮件分为两种存储方式:邮件的数据量大于阈值的,以单文件的形式单独存储邮件;邮件的数据量不大于阈值的,将邮件添加在预定文件中进行集中存储。将邮件添加在预定文件中进行集中存储,减少了文件的数量,可以减少磁盘输入输出操作的次数,减少了邮件存储耗时。附图说明图1为第一实施方式的垃圾邮件处理方法的流程图;图2为第二实施方式的垃圾邮件处理方法的流程图;图3为第三实施方式的垃圾邮件处理方法的流程图;图4为第四实施方式的垃圾邮件处理方法的流程图;图5为第五实施方式的垃圾邮件处理方法的流程图;图6为第一实施方式的邮件处理系统的模块图;图7为第二实施方式的邮件处理系统的模块图;图8为第三实施方式的邮件处理系统的模块图。具体实施方式由于传统的垃圾邮件处理方法中,邮件存储的方式通常存储路径固定,每个邮件作为一个单独的文件,这样某一文件夹下文件数较多,对于正常邮件和垃圾邮件非常多的用户,同一文件夹下的文件也会非常多,从而影响存取的效率。并且,较多的邮件会导致较多的文件存储操作,导致磁盘效率低,进一步影响了存取的效率。如图1所示,一实施例中的垃圾邮件处理方法,包括如下步骤:步骤S100,接收被拦截的邮件。邮件在被反垃圾邮件系统拦截时,调用垃圾邮件处理方法提供的存储接口(SaveMail)进行被拦截邮件的临时存储,即通过上述存储接口(SaveMail)接收被反垃圾邮件系统拦截的邮件。拦截邮件的规则可以根据需要进行设定,例如根据邮件地址、关键词等拦截可能为垃圾邮件的邮件。步骤S110,判断邮件的数据量是否大于阈值。邮件的大小是指邮件数据的大小,阈值是指预设的邮件的数据量临界值,例如512KB、1MB等。通过对邮件的数据量和阈值进行比较,判断收到的邮件的数据量是否大于阈值,如果大于则进入步骤S120,如果不大于,则进入步骤S130。步骤S120,以单文件的形式单独存储邮件。本步骤中,把邮件的数据量大于预设阈值的每个邮件(以下简称大邮件)都以单个文件的形式单独分别存储,即每个邮件单独对应一个文件。因为收到的邮件的邮件的数据量相对较大,所以每个邮件都以单一文件的形式分别存储,便于管理。步骤S130,将邮件添加在预定文件中进行集中存储。预定文件是指预先设定的用来集中存储大小小于阈值的邮件(以下简称小邮件)的文件。例如,收到的邮件M1经判断小于512KB,则将邮件M1添加到某一预定文件F1中,随后如果收到邮件M2经判断小于512KB时,可以再将邮件M2添加到该预定文件F1中。这样实现了将邮件M1和邮件M2集中存储在预定文件F1中。也就是说,集中存储是将多个邮件集中存储到一个文件中,当然,预定文件的数量也可以不止一个,只要预定文件的数量大于邮件的数量即可达到集中存储的目的。预定文件可以是Hash桶文件(哈希桶文件)、打包文件或是压缩文件等。在进行添加存储操作时,可以用O_APPEND的方式(以追加的方式打开文件,每次写之前,都将标志位移动到文件的末端)在预定文件末位添加此次添加的邮件的大小及邮件的内容数据,当然也可以只在预定文件末位添加邮件内容数据,并记录邮件的起始和结束标记。上述垃圾邮件处理方法,通过判断邮件的数据量与阈值的关系,将邮件分为两种存储方式:邮件的数据量大于阈值的,以单文件的形式单独存储邮件;邮件的数据量不大于阈值的,将邮件添加在预定文件中进行集中存储。将邮件添加在预定文件中进行集中存储,减少了文件的数量,可以减少磁盘输入输出操作的次数,减少了邮件存储耗时。如图2及图3所示,在其中一个实施例中,还包括以邮件的标识码进行映射获得路径的步骤(S102、S112或S114)。步骤S102在步骤S110之前,不管是大邮件还是小邮件,映射路径的方法相同;步骤S112或S114在步骤S110之后,可以根据大邮件和小邮件制定不同的映射路径的方法。每个邮件在接收时都会有一个标识码所标识,邮件的标识码通常是唯一的(又可以称为唯一索引为消息id,MessageID),并且通常邮件的标识码中包括了邮件的投递时间信息,格式为size_t类型,在存储、读取、删除邮件时都会根据邮件的标识码对邮件进行操作。存储路径可以通过以邮件的标识码进行映射获得,先把标识码通过一个Hash函数计算,转换得到文件存储路径,所述路径包括储存邮件文件的各级文件夹名称。在以单文件的形式单独存储邮件的步骤S120中,获得路径后,将邮件以单文件的形式单独存储在所述路径下,并且可以以邮件的标识码作为文件名存储文件,保证了存储邮件的唯一性;在将邮件添加在预定文件中进行集中存储的步骤S130中,将邮件添加在上述路径下的预定文件中。由于采用了映射的方法,可以通过映射规则的设定,使得不同的邮件映射得到的路径不同,从而使得邮件的存储位置充分散列,即在同一文件夹下不会有过多的邮件,提高存取的速度。在有些具体的应用中,标识码包含有日期信息,上述以邮件的标识码进行映射获得存储所述邮件的路径的步骤S102、S112或S114中,可以将日期信息作为路径的一部分。例如,收到的邮件携带的标识码为mx82t1332829582trzqgfrcg,其中1332829582为日期信息可以转化为对应的日期20120327。当然,在其他实施例中,标识码中可以直接包含不需要转化的日期信息。假设标识本文档来自技高网...

【技术保护点】
一种垃圾邮件处理方法,其特征在于,包括:接收被拦截的邮件;判断所述邮件的数据量是否大于阈值;如果是,以单文件的形式单独存储所述邮件;如果否,将所述邮件添加在预定文件中进行集中存储。

【技术特征摘要】
1.一种垃圾邮件处理方法,其特征在于,包括:接收被拦截的邮件;判断所述邮件的数据量是否大于阈值;如果是,以单文件的形式单独存储所述邮件;如果否,将所述邮件添加在预定文件中进行集中存储;所述将所述邮件添加在预定文件中进行集中存储的方式为,将所述邮件的内容数据及所述邮件的大小添加在所述预定文件末位进行集中存储;或者将所述邮件的内容数据添加在所述预定文件末位进行集中存储,并记录所述邮件的起始和结束标记;以所述邮件的标识码进行映射获得路径的步骤,所述以单文件的形式单独存储所述邮件的步骤中,将所述邮件以单文件的形式单独存储在所述路径下;所述将所述邮件添加在预定文件中进行集中存储的步骤中,将所述邮件添加在所述路径下的预定文件中;当用于存储所述邮件的文件夹中存储的文件或文件夹数量达到限定数量时,更换存储路径。2.根据权利要求1所述的垃圾邮件处理方法,其特征在于,所述标识码包含日期信息,所述以所述邮件的标识码进行映射获得存储所述邮件的路径的步骤中将所述日期信息作为所述路径的一部分。3.根据权利要求2所述的垃圾邮件处理方法,其特征在于,所述标识码还包含非日期信息,所述以所述邮件的标识码进行映射获得存储所述邮件的路径的步骤中将所述非日期信息中的部分或全部作为所述路径的一部分。4.根据权利要求1至3中任意一项所述的垃圾邮件处理方法,其特征在于,如果判断邮件大于阈值,还包括在指向文件中与所述邮件的标识码对应的标识位设置标识所述邮件以单文件的形式单独存储的步骤;如果判断邮件不大于阈值,还包括在所述指向文件中与所述邮件的标识码对应的标识位设置标识所述邮件以集中存储的形式存储、在所述指向文件中...

【专利技术属性】
技术研发人员:黄铁鸣文琛金烈胜
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1