一种对图像型垃圾邮件进行过滤的方法及装置制造方法及图纸

技术编号：12199218 阅读：120 留言：0更新日期：2015-10-14 11:28

本发明专利技术公开了一种对图像型垃圾邮件进行过滤的方法及装置，通过WAF模型对邮件图像中识别出的关键词进行关键词重构，并基于重构后的关键词对邮件进行判断和过滤，从而解决现有技术中基于图像过滤垃圾邮件准确率低的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及通信
，尤其设及一种对图像型垃圾邮件进行过滤的方法及装置。
技术介绍
目前，基于文本规则的垃圾邮件过滤技术已经取得了成功的应用。在图像领域，研究者们提出了各种基于数字图像处理技术的方案进行图像过滤，并取得了一定效果。其中，主要有：基于图像近似特征的过滤技术、基于图像文本区域的过滤技术W及基于图像本身特征的过滤技术，虽然上述方法能够达到一定效果，但是其原理都是从分析图像浅层特征出发，容易误断一些含公文扫描图像W及包含文本信息的宣传图像的正常公务邮件。
技术实现思路
鉴于上述的分析，本专利技术旨在提供一种对图像型垃圾邮件进行过滤的方法及装置，用W解决现有技术中基于图像过滤垃圾邮件准确率低的问题。为解决上述问题，本专利技术主要是通过W下技术方案实现的：本专利技术一方面提供了一种对图像型垃圾邮件进行过滤的方法，该方法包括：通过WAF模型对邮件图像中识别出的关键词进行关键词重构；基于重构后的关键词对邮件进行判断，当确定所述邮件是垃圾邮件后，对所述邮件进行过滤。优选地，所述通过WAF模型对邮件图像中识别出的关键词进行关键词重构的步骤具体包括：通过WAF模型计算没有被识别的字与其相邻的已识别的字构成预设的关键词的亲密度之和，当亲密度之和的值超过预设的阔值时，则确定没有被识别的字与其相邻的已识别的字构成关键词。优选地，通过WAF模型计算没有被识别的字与其相邻的已识别的字构成预设的关键词的亲密度之和的步骤具体包括：通过WAF模型计算关键字之间的亲密度；根据关键字之间的亲密度计算没有被识别的字与其相...

【技术保护点】
一种对图像型垃圾邮件进行过滤的方法，其特征在于，包括：通过WAF模型对邮件图像中识别出的关键词进行关键词重构；基于重构后的关键词对邮件进行判断，当确定所述邮件是垃圾邮件后，对所述邮件进行过滤。

【技术特征摘要】

【专利技术属性】
技术研发人员：严寒冰，李思远，刘亚姝，张洪刚，徐彬，张帅，徐原，高胜，胡俊，
申请(专利权)人：国家计算机网络与信息安全管理中心，北京邮电大学，北京建筑大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人