用于检测并补救误导超链接的方法和系统技术方案

技术编号:3485449 阅读:155 留言:0更新日期:2012-04-11 18:40
一种用于验证超链接的合法性并确定用户被引导到的网站的域名是否合法的方法。在一个实施例中,本方法识别超链接、超链接内的URL以及URL内的域名。然后给所识别的域名分配页面等级参数。如果该页面等级参数在阈值以下,则本方法比较所识别的域名与公知或高页面等级域名的列表。然后将相似性参数分配给所识别的域名,以指示该域名是否是误导的。如果该链接是误导的,本方法可以实施某些可配置的补救行动,比如警告用户或废除超链接。

【技术实现步骤摘要】

本专利技术涉及防止计算机犯罪的方法。更具体地,本专利技术涉及检测由误导超链接(misleading hyperlink)引起的安全威胁。技术背景超过十亿人基于常规使用英特网。在英特网上可用的大多数普遍使用的 应用是电子邮件和即时通讯。因为给很多接收者发送消息的低花费使得很多 商业实体广泛地使用这些应用。很多英特网用户不是计算机专家(computer savvy ),并且对在他们的个 人计算机上所存储的个人和机密信息的弱点了解很少。这些用户对于欺诈高 手来说是有吸引力的牺牲者。使得电子邮件和即时消息对于商业和消费者具者可以廉价地设计并发送消息至大量消费者。这些条件导致了已知为"网上 诱骗"的英特网诈骗的蔓延。"网上诱骗"是指设计用于操纵人们泄露他们的机密信息的英特网上犯 罪行为的术语。网上诱骗,"钓鱼"的有意错误拼写,指的是欺诈高手试图诱 使无疑心的消费者泄露他们的个人信息,比如用于访问在线账户的信用卡号 或密码。"诱骗者"可以设计并发送故意被做成像来自依赖英特网办理业务的 商业实体的电子邮件或消息的电子邮件或即时消息。欺骗性的电子邮件或消 息被设计得看来好像是来自诸如通常使用的网站或大银行的大量消费者所熟 悉的合法源头。诱骗者一般会要求接收者通过提供诸如银行账户号、信用卡 号、社会保险号、用户ID或接收者的在线账户密码的机密且私人的信息来答 复该电子邮件或消息。更老练的诱骗者精明地设计电子邮件或消息以引诱接收者实际上想在英 特网上泄露个人信息。例如,诱骗者的消息可能包含将接收者引到已经专门 创建用于实现诱骗诈骗的网站的可选超链接。经常,诱骗者的电子邮件消息 可能提供警告接收者的信息,以引诱接收者选择超链接以便解决问题。例如,诱骗者的消息可能警告接收者有"可疑行为",比如试图使用接收者的在线账 户而没有合适的密码,并且可能要求接收者使用所提供的超链接来访问网站 并登录账户或者另外提供个人信息以验证或改变密码。讽刺的是,很多诱骗 诈骗通过虛伪地警告接收者有关接收者的在线账户的安全威胁来操作,以便 获取接收者的个人信息。在电子邮件消息中提供给接收者的超链接可能通过看来要将接收者? 1到 与接收者的在线账户有关的网站来引诱接收者选择该超链接。但是,以电子 文档形式被提供给无疑心的接收者的超链接可能被做的能看出发送者所期望的。例如,消息内的显示名称或文本可能^皮显示为"www.yahoo.com",以看 起来是作为到熟悉的网站的实际超链接,但是,该文本可能实际包括了嵌入 的链接,该嵌入的链接将把用户的浏览器引导到由诱骗者建立的用于实施诈 骗的不同网站。通过选择该超链接而把接收者^I到的网站可能非常类似于与 超链接看起来要提供给接收者的目的地对应的熟悉且可信的网站。粗心的接 收者可能不了解超链接如何操作,或者可能甚至不知道可以操纵超链接以将 接收者引到与文本中看似的网站不同的网站。到达假冒网站的接收者将被要 求验证密码或账户号,或者输入被诱骗者捕获并滥用的敏感个人信息。网上诱骗的一个特别精明的方法是在电子邮件消息或即时消息中警告接 收者他们的在线账户有问题。例如,电子邮件可能被设计得看来已经通过银 行、信用卡公司或接收者可能与之从事业务的其他类似实体来发送给接收者, 并警告接收者他们的账户有"可疑行为"。选择超链接以尽力防止欺骗或身份 盗用的接收者实际被引导到由诱骗者创建的用于实施诈骗的假冒网站,并试 图使用该网站来验证账户状况。对于无疑心的接收者来说该网站通常看来是 银行、信用卡公司或维护接收者在线账户的业务的实际网站,并且该假冒网 站被设计用于接收并记录接收者的个人信息,比如账号、密码或可能被诱骗 者滥用的其他个人信息。因此,需要一种检测诸如电子邮件消息和即时消息的电子文档中所包含 的误导超链接的方法。同样,需要警告或保护电子文档的接收者免遭利用通 过电子邮件或即时通讯发送到接收者的误导超链接的诱骗诈骗。
技术实现思路
本专利技术提供了 一种用于验证超链接的可靠性并用于确定超链接内的域名是否有可能涉及诱骗犯罪的方法。在本专利技术的一个实施例中,该方法包括步骤识别(identify)电子文档内的超链接;识别超链接的URL;识别URL 内的域名;给域名分配页面等级参数;确定被分配给域名的页面等级参数是 否大于页面等级阈值;以及分析所识别的域名与公知或高页面等级域名的列 表的相似性。本专利技术的一个实施例包括步骤相对于公知或高页面等级的网 站的域名,分析该域名关于被设计用于使域名对于接收者看起来是合法的域 名的替换的字符、插入或省略的复数、冗余字符或其他字符插入、替换或省 略。该方法还可以包括给域名分配相似性参数,其中该相似性参数反映该 域名被设计得看起来与公知域名的列表中的一个域名的相似的程度。该方法 还可以包括分析该相似性参数和页面等级参数,然后使用算法来确定该超 链接是否是误导的。该方法还可以可选择地包括步骤在包含了误导超链接 的文档被打开之前通知接收者有误导超链接。该方法还可以自动废除文档中 所检测的误导超链接,以防止接收者使用该超链接。附图说明 图1是表示用于识;图。图2是图示用于确定电子文档内所包含的超链接是误导的可能性的超链 接分类的象限图。图3是能够接收并打开诸如电子邮件消息的电子文档并执行确保URL链 接的合法性的方法的计算机系统的示意图。具体实施方式本专利技术提供了 一种用于验证电子文档内所包含的超链接的合法性并用于 确定超链接内所包含的网站的域名是否可能是为欺骗目的而创建的方法。一 般出现在电子文档内的超链接很容易与周围文本区分。通常在电子文档中使 用高度可见字体颜色或字体大小并通过给超链接加下划线来显示超链接。电 子文档中出现的超链接一般具有几个组成部分。本专利技术中感兴趣的主要超链 接组成部分是链接标签和编码链接目的地的统一资源定位(URL)。虽然可以直接将URL复制到电子文档中,但是不显示嵌入超链接的 URL。链接标签是电子文档在计算机监视器上显示给用户的字符串。链接标签可以包括任意期望的字符串,或者可以是用户可以选择的用以访问链接目 的地的图形,比如照片、标志图案或图标。链接目的地被编码为统一资源定位(URL),有时也被称为统一资源识别符(URI)。虽然URI和URL在意思 上稍有差异,但是在这些术语之间的普通使用没有差异,并且下面的公开将 涉及URL。 URL识别英特网上的可用网络资源,比如网站。URL提供当接 收者选择超链接时网页浏览器将访问的网络资源的地址。URL还提供了用于 取回资源的协议。对网上诱骗的问题起重要作用的因素是,编码链接目的地 的URL通常隐藏在HTML代码中,并且没有向电子文档的接收者示出通过 选择超链接而将访问的网站的URL。本专利技术的方法包括识别电子文档内的超链接的步骤。电子文档可以包括 电子邮件、即时消息、网页、文字处理文件、图形表示、可移植文件格式(PDF) 文件或能够包含并向用户显示超链接的任意电子文档或文件。可以通过解析 文档并寻找指示URL的特定样式、比如寻找"http"、 "www"或".com"来 识别超链接。还可以通过在HTML源代码中搜索超文本参考(HREE)的锚 标签(anchor tag)或通过可以检测电子文档内的超链接的存在的任意其他手 段来识别超本文档来自技高网
...

【技术保护点】
一种方法,包括:识别电子文档内的超链接,其中该超链接包括域名;以及如果确定所述域名与小于阈值的页面等级值关联并且如果确定所述域名相对于与大于该阈值的页面等级值关联的另一域名具有一个或多个误导字符替换、添加或删除,则针对该超链接的使用自动地采取补救行动。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:卡里L贝茨詹姆斯E凯里贾森J伊尔格
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利