电子信息比较系统和方法以及反垃圾邮件系统技术方案

技术编号:3498413 阅读:231 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种电子文本比较方法,包括以下步骤:(a)将第一电子文本段和第二电子文本段分别按照相同的转换规则转换为第一矩阵和第二矩阵,所述第一矩阵和第二矩阵具有相同的尺寸;(b)依次比较第一矩阵和第二矩阵的相同位置的元素并根据比较结果使用指定比较函数计算相似系数;(c)根据相似系数判断所述第一电子文本和第二电子文本是否相似,若所述相似系数大于指定阈值则表示第一电子数据段与第二电子数据段相似。本发明专利技术还公开了一种对应的电子文本比较系统及反垃圾邮件系统。本发明专利技术通过比较电子文本的转移矩阵来计算电子文本的相似性,不但能够识别出内容完全一致的电子文本,还能够判断插入了一定随机字符的电子文本的相似性。

【技术实现步骤摘要】

【技术保护点】
一种电子文本比较方法,其特征在于,包括以下步骤:    (a)将第一电子文本段和第二电子文本段分别按照相同的转换规则转换为第一矩阵和第二矩阵,所述第一矩阵和第二矩阵具有相同的尺寸;    (b)依次比较所述第一矩阵和第二矩阵的相同位置的元素并根据比较结果使用指定比较函数计算相似系数;    (c)根据所述相似系数判断所述第一电子文本和第二电子文本是否相似,若所述相似系数大于指定阈值则表示第一电子数据段与第二电子数据段相似。

【技术特征摘要】

【专利技术属性】
技术研发人员:王晖
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1