当前位置: 首页 > 专利查询>谷歌公司专利>正文

侵入软件管理制造技术

技术编号:5451018 阅读:385 留言:0更新日期:2012-04-11 18:40
识别与赞助内容相关联的着陆页的侵入特征。基于所识别的侵入特征生成着陆页的特征分值,以及如果着陆页的特征分值超过特征阈值,则将着陆页分类为候选着陆页。可以暂停与候选着陆页相关联的赞助者帐户,或可以暂停与候选着陆页相关联的赞助内容。

【技术实现步骤摘要】
【国外来华专利技术】
本文档涉及侵入软件的管理。
技术介绍
交互式媒介(例如,因特网)具有对将例如广告(“ad”)的赞助内容定向到受众 进行改进的巨大潜力。例如,一些网站提供基于由寻找信息的用户所输入的关键词的信息 搜索功能。该用户查询可以是用户感兴趣的信息类型的指示符。通过将用户查询与由广告 主所指定的关键词列表进行比较,可以向用户提供定向广告。在线广告的另一种形式是广告联合(ad syndication),其允许广告主通过将广告 分发到其他伙伴来扩展他们的市场范围。例如,第三方在线发布者可以将广告主的文本或 图像广告置放在具有期望内容的web资产上,以促使在线顾客到该广告主的网站。诸如包括数行文本、图像或视频剪辑的创意的广告包括指向着陆页(landing page)的链接。这些着陆页是在广告主网站或联合发布者网站上的页面,当用户在广告上点 击时用户被指引到所述页面。然而,这些着陆页中的一些可能包括侵入软件,例如欺骗地、 秘密地和/或自动地安装的软件、脚本或任何其它实体。侵入安装的这样的软件实体通常 可以被表征为“恶意软件(malware)”,单词“恶意的(malicious) ”和“软件(software)”的 混合词。然而,软件无需进行恶意行为才成为恶意软件;侵入安装的任何软件可以被认为是 恶意软件,而不管软件进行的行为是否是恶意的。因此,除特洛伊木马、病毒以及浏览器漏 洞外,诸如监视软件的其它软件也可以被认为是恶意软件。恶意软件可以有意或无意地存 在于着陆页中。例如,广告主的站点能够被黑客攻击并且恶意软件直接插入到着陆页上;恶 意广告主可以将恶意软件插入到着陆页中;点击追踪器可以通过导引到着陆页的最终统一 资源定位符(URL)的重定向链插入恶意软件;广告主可以将广告或小组件置放在由将恶意 软件插入到着陆页上的第三方扩充的页面上;等。—旦知道着陆页具有恶意软件,广告发布者可以排除对着陆页的派发。然而,例如 谷歌公司的广告发布者可能访问几亿的广告和与广告相关联的对应的着陆页。如能够被理 解的,可能很难深入检查/复查每一个着陆页存在恶意软件。
技术实现思路
在此公开的内容是用于检测并处理赞助内容中的恶意软件的装置、方法和系统。 在一个实施方式中,识别与赞助内容相关联的着陆页的侵入特征。基于所识别的侵入特征 生成着陆页的特征分值,以及如果着陆页的特征分值超过特征阈值,则将着陆页分类为候7选着陆页。可以将候选着陆页提供给恶意软件检测器以确定着陆页中是否存在恶意软件。 在一些实施方式中,可以暂停与候选着陆页相关联的赞助者帐户。在一些实施方式中,可以 暂停与候选着陆页相关联的广告。在另一个实施方式中,方法包括将与广告相关联的着陆页分割成训练着陆页和测 试着陆页。针对训练着陆页的侵入特征迭代地训练分类模型,以及针对测试着陆页的侵入 特征迭代地测试分类模型。训练和测试继续直到出现停止事件。响应于停止事件,将从迭 代训练和测试取得的特征权重与侵入特征的关联存储在分类模型中。在另一个实施方式中,系统包括评分引擎,其包括存储在计算机可读介质中并且 可由处理系统执行的软件指令。在执行时,处理系统识别与赞助内容相关联的着陆页并且 识别着陆页的侵入特征。基于所识别的侵入特征生成着陆页的特征分值,以及如果着陆页 的特征分值超过特征阈值,则将着陆页分类为候选着陆页。可以将候选着陆页提供给恶意 软件检测器以确定着陆页中是否存在恶意软件。在一些实施方式中,可以暂停与候选着陆 页相关联的赞助者帐户。在一些实施方式中,可以暂停与候选着陆页相关联的广告。将在附图和下面的描述中阐述本说明中描述的主题的一个或多个实施例的细节。 主题的其它特征、方面以及优势从描述、附图以及权利要求将变得显而易见。附图说明图1是示例在线广告系统的框图。图2是赞助内容的示例子联合的流程图。图3是示例赞助内容处理系统的框图。图4是构建分类模型的示例训练过程的框图。图5是利用分类模型的另一个示例赞助内容处理系统的框图。图6是另一个示例赞助内容处理系统的框图。图7是用于为侵入检测识别候选着陆页的示例过程的流程图。图8是用于将候选着陆页提交给侵入检测引擎的示例过程的流程图。图9是用于处理上诉请求的示例过程的流程图。图10是用于处理上诉请求的另一个示例过程的流程图。图11是用于生成分类模型的示例过程的流程图。具体实施例方式图1是示例在线广告系统100的框图。在一些实施方式中,一个或多个广告主102 可以直接或间接地输入、维护以及追踪广告管理系统104中的广告(“ad”)信息。虽然引 用的是广告,但是系统100可以递送其它形式的内容,包括其它形式的赞助内容。广告可以 是以下列形式诸如横幅广告的图形广告、纯文本广告、图像广告、音频广告、视频广告、组 合任何这样的组件的一个或多个的广告等。广告还可以包括嵌入式信息,诸如链接、元信息 和/或机器可执行的指令。一个或多个发布者106可以向系统104提交对广告的请求。系 统104通过将广告发送给发出请求的发布者106以在发布者的web资产(例如网站或其它 网络分布内容)的一个或多个上置放来作出响应。广告可以包括嵌入链接着陆页,例如广 告主102网站上的页面,当用户点击呈现在发布者网站上的广告时用户被指引到所述着陆页。诸如用户108和广告主102的其他实体可以向系统104提供使用信息,诸如与广 告有关的转换或点进是否已发生。该使用信息可以包括与已派发的广告有关的被测量或观 察到的用户行为。系统104执行金融交易,诸如基于使用信息向发布者106赊账并且向广 告主102收费。诸如局域网(LAN)、广域网(WAN)、因特网或其组合的计算机网络110连接广告主 102、系统104、发布者106和用户108。发布者106的一个示例是常规内容服务器,其接收对内容(例如,文章、讨论话题、 音乐、视频、图形、搜索结果、网页收录、信息供给等)的请求,并且响应于请求检索所请求 的内容。内容服务器可以将对广告的请求提交给系统104中的广告服务器。广告请求可以 包括所期望的广告的数量。广告请求还可以包括内容请求信息。该信息可以包括内容本身 (例如,页面或其它内容文档)、与内容或内容请求相对应的类别(例如,艺术、商业、计算 机、艺术电影、艺术音乐等)、内容请求的部分或全部、内容寿命、内容类型(例如,文本、图 形、视频、音频、混合媒体等)、地理位置信息等。在一些实施方式中,内容服务器可以将所请求的内容与系统104提供的广告中 的一个或多个相组合。该组合的内容和广告可被发送给请求内容的用户108以在查看器 (例如,浏览器或其它内容显示系统)中呈现。内容服务器可以将关于广告的信息传送 回广告服务器,所述信息包括描述如何、在何时和/或在何处呈现广告(例如,以HTML或 JavaScript )的信息。另一个示例发布者106是搜索服务。搜索服务可以接收对搜索结果的查询。作 为响应,搜索服务可以从文档的索引(例如,从网页的索引)检索相关搜索结果。在澳 大利亚布里斯班举行的 SeventhInternational World Wide Web Conference (第七届 国际万维网会议)上S.Brin和L.Page发表的论文“The Anatomy of a Large-Sca本文档来自技高网
...

【技术保护点】
一种方法,包括:识别与赞助内容相关联的着陆页;识别所述着陆页的侵入特征;基于所识别的侵入特征生成所述着陆页的特征分值;确定所述着陆页的所述特征分值是否超过特征阈值;如果所述着陆页的所述特征分值超过所述特征阈值,则将所述着陆页分类为候选着陆页;将所述候选着陆页提交给侵入检测引擎;从所述侵入检测引擎接收所述候选着陆页的侵入分值;以及如果所述侵入分值超过侵入阈值,则排除对与所述候选着陆页相关联的所述赞助内容的派发。

【技术特征摘要】
【国外来华专利技术】US 2007-10-5 11/868,321;US 2008-3-3 12/041,309一种方法,包括识别与赞助内容相关联的着陆页;识别所述着陆页的侵入特征;基于所识别的侵入特征生成所述着陆页的特征分值;确定所述着陆页的所述特征分值是否超过特征阈值;如果所述着陆页的所述特征分值超过所述特征阈值,则将所述着陆页分类为候选着陆页;将所述候选着陆页提交给侵入检测引擎;从所述侵入检测引擎接收所述候选着陆页的侵入分值;以及如果所述侵入分值超过侵入阈值,则排除对与所述候选着陆页相关联的所述赞助内容的派发。2.如权利要求1所述的方法,其中所述赞助内容是广告。3.如权利要求2所述的方法,进一步包括接收对所述赞助者帐户的上诉请求,并且响应于接收所述上诉请求 将所述候选着陆页重新提交给所述侵入检测引擎; 从所述侵入检测引擎接收所述候选着陆页的另一个侵入分值; 如果所述另一个侵入分值超过所述侵入阈值,则排除对与所述候选着陆页相关联的所 述广告的派发;以及如果所述另一个侵入分值没有超过所述侵入阈值,则允许对与所述候选着陆页相关联 的所述广告的派发。4.如权利要求3所述的方法,进一步包括识别与所述广告相关联的赞助者帐户,所述赞助者帐户包括额外广告;以及 如果所述候选着陆页的所述侵入分值超过所述侵入阈值,则排除对与所述赞助者帐户 相关联的所述额外广告的派发。5.如权利要求4所述的方法,进一步包括接收对所述赞助者帐户的上诉请求,并且响应于接收所述上诉请求将所述候选着陆页和与所述额外广告相关联的额外着陆页提交给所述侵入检测引擎;从所述侵入检测引擎接收所述候选着陆页的另一个侵入分值和所述额外着陆页的额 外侵入分值;以及确定所述着陆页的所述侵入分值是否超过所述侵入阈值。6.如权利要求5所述的方法,进一步包括排除对与具有超过所述侵入阈值的侵入分 值的着陆页相关联的广告的派发。7.如权利要求5所述的方法,进一步包括如果着陆页中的任何着陆页的侵入分值超 过所述侵入阈值,则排除对与所述赞助者帐户相关联的广告的派发。8.如权利要求2所述的方法,其中所述侵入特征包括一个或多个iFrame特征、一个 或多个URL特征、和/或一个或多个脚本特征,并且其中每一个侵入特征具有关联的特征 权重,以及所述基于所识别的侵入特征生成所述着陆页的侵入分值包括对所述特征权重求 和。9.如权利要求2所述的方法,进一步包括识别与所述广告相关联的赞助者帐户,所述赞助者帐户包括额外广告; 识别与所述额外广告相关联的额外着陆页; 基于所识别的侵入特征生成所述额外着陆页的特征分值; 确定所述着陆页的所述特征分值是否超过特征阈值;如果所述额外着陆页的所述特征分值超过所述特征阈值,则将每一个额外着陆页分类 为额外候选着陆页;累积所述候选着陆页和所述额外候选着陆页的所述特征分值以获取帐户分值; 基于所述帐户分值将风险类别分配给所述赞助者帐户;以及 基于所述风险类别来启动用于所述赞助者帐户的多个帐户补救过程中的一个。10.一种方法,包括将与广告相关联的着陆页分割成训练着陆页和测试着陆页; 针对所述训练着陆页的侵入特征迭代训练分类模型;针对所述测试着陆页的所述侵入特征迭代测试所述分类模型直到出现测试停止事件;以及响应于所述停止事件将特征权重和侵入特征的关联存储在所述分类模型中,所述特征 权重和侵入特征的关联取自所述迭代训练和测试。11.如权利要求10所述的方法,其中所述分类模型包括基于线性回归的模型。12.如权利要求10所述的方法,进一步包括 识别与广告相关联的着陆页;识别所述着陆页的侵入特征;基于所识别的侵入特征和特征权重生成所述着陆页的特征分值; 确定所述着陆页的所述特征分值是否超过特征阈值;以及如果所述着陆页的所述特征分值超过所述特征阈值,则将所述着陆页分类为候选着陆页。13.如权利要求12所述的方法,进一步包括 将所述候选着陆页提交给侵入检测引擎;从所述侵入检测引擎接收所述候选着陆页的侵入分值;以及如果所述侵入分值超过侵入阈值,则排除对与所述候选着陆页相关联的所述广告的派发。14.如权利要求13所述的方法,进一步包括接收对所述赞助者帐户的上诉请求,并且响应于接收所述上诉请求 将所述候选着陆页重新提交给所述侵入检测引擎; 从所述侵入检测弓I擎接收所述候选着陆页的另一个侵入分值; 如果所述另一个侵入分值超过所述侵入阈值,则排除对与所述候选着陆页相关联的所 述广告的派发;以及如果所述另一个侵入分值没有超过所述侵入阈值,则允许对与所述候选着陆页相关联 的所述广告的派发。15.如权利要求13所述的方法,进一步包括识别与所述广告相关联的赞助者帐户,所述赞助者帐户包括额外广告;以及 如果所述候选着陆页的所述侵入分值超过所述侵入阈值,则排除对与所述赞助者帐户 相关联的所述额外广告的派发。16.如权利要求10所述的方法,其中所述侵入特征包括一个或多个iFrame特征、一个 或多个URL特征、和/或一个或多个脚本特征。17.一种系统,包括评分引擎,所述评分引擎包括存储在计算机可读介质中并且由处理系统可执行的软件 指令,以及在这样的执行时促使所述处理系统 识别与赞助内容相关联的着陆页; 识别所述着陆页的侵入...

【专利技术属性】
技术研发人员:周云凯尼尔斯普罗沃斯小克莱顿W巴沃尔埃里克L戴维斯马克帕拉图奇卡玛尔P尼加姆克里斯托弗K蒙森帕纳约蒂斯马弗洛马蒂斯雷切尔那卡乌奇
申请(专利权)人:谷歌公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利