【技术实现步骤摘要】
在线内容采集
技术介绍
在线广告通常包括在因特网上刊登的广告。在线广告可以包括营销信息,并且用户可能能够点击广告,这通常将用户带到用于将产品或者服务在广告中加以营销的另一网页。在线广告可以被表示为例如包括图像、点选、FLASH对象等的创意(creative)。可以用横幅广告的形式提供在线广告,横幅广告是在网页中嵌入的广告并且经常包括文本、图像、视频、声音或那些元素的任何组合。可以从被称为广告供应商的广告服务或广告网络购买在特定网站上的创意的投放。例如,搜索引擎通常提供广告服务,由此刊登广告的人付费来将其创意刊登在搜索引擎网站或其他附属的网站上。除搜索引擎之外,许多网站提供相似的服务以用于为公司或其他实体刊登创意。在许多实例中,创意需要刊登持续某时间段并且需要在网站上的某些位置刊登,或者可能需要响应于满足某些条件来刊登。许多实体参与复杂的在线广告活动,其中他们为了创意空间与竞争对手竞争,并且他们跨许多网站投放许多创意。高效地追踪网站以确定该网站是否正在刊登它们的创意,以及创意是否包括适当内容并且被提供在适当网页中并被提供在网页上的适当位置中是困难的。附图说明本公开的特征通过示例的方式而图示并且不限于下图,其中相同的数字代表相同的元素,其中:图1图示了根据本公开的示例的、用于在线内容采集系统的数据流程图;图2图示了根据本公开的示例的、用于在线内容采集系统的系统图;图3图示了根据本公开的示例的、用于由在线内容采集系统进行的创意统一资源定位符(URL)和点选处理的方法的流程图;图4图示了根据本公开的示例的、用于创意下载和储存在数据库或在线内容采集服务器中的方法的流程图; ...
【技术保护点】
一种在线内容采集系统,包括:扫描服务器,用于扫描网站以获取潜在创意统一资源定位符(URL),其中所述扫描和所述获取包括:解析用于所述网站的网页,从所解析的网页中标识与用于获取潜在创意URL的预定标准匹配的潜在创意URL,以及获取与所述预定标准匹配的所述潜在创意URL;数据储存器,用于储存创意URL;以及在线内容采集服务器,用于分析所获取的潜在创意URL,其中所述分析包括:通过将所获取的潜在创意URL与在所述数据储存器中储存的所述创意URL进行比较来确定所获取的潜在创意URL以前是否已经见过,以及如果所获取的潜在创意URL以前已经见过,则确定所获取的潜在创意URL是否指向创意。
【技术特征摘要】
2012.08.30 US 13/599,3101.一种在线内容采集系统,包括:扫描服务器,用于扫描网站以获取潜在创意统一资源定位符(URL),其中所述扫描和所述获取包括:解析用于所述网站的网页,从所解析的网页中标识与用于获取潜在创意URL的预定标准匹配的潜在创意URL,以及获取与所述预定标准匹配的所述潜在创意URL;数据储存器,用于储存创意URL;以及在线内容采集服务器,用于分析所获取的潜在创意URL,其中所述分析包括:通过以下各项来确定所获取的潜在创意URL以前是否已经见过:将所获取的潜在创意URL与在所述数据储存器中储存的所述创意URL进行比较,在确定所获取的潜在创意URL以前是否已经见过之前,去除查询参数,以及如果所获取的潜在创意URL以前没有见过,则下载所获取的潜在创意URL指向的创意,如果所获取的潜在创意URL以前已经见过,则确定所获取的潜在创意URL是否指向创意,如果所获取的潜在创意URL不指向创意,则确定具有查询参数的所获取的潜在创意URL以前是否已经见过,如果所获取的潜在创意URL指向创意,则确定所述在线内容采集服务器是否识别出与所述创意关联的点选URL,以及如果所述在线内容采集服务器没有识别出与所述创意关联的所述点选URL,则确定与所述创意关联的网页内容是否包括点选URL,其中如果与所述创意关联的所述网页内容包括点选URL,则:在网页浏览器环境中下载所述点选URL;以及确定所述点选URL是否为重定向URL。2.根据权利要求1所述的在线内容采集系统,其中所述预定标准包括使用正则表达式来匹配所述潜在创意URL。3.根据权利要求1所述的在线内容采集系统,其中所述分析还包括:如果所获取的潜在创意URL以前没有见过,则确定所获取的潜在创意URL是否为重定向URL。4.根据权利要求3所述的在线内容采集系统,其中所述分析还包括:如果所获取的潜在创意URL为重定向URL,则确定所述重定向URL以前是否已经见过;如果所述重定向URL以前已经见过,则将与所获取的潜在创意URL关联的所述创意指示为无效;以及如果所述重定向URL以前没有见过,则下载随后的重定向URL以确定所述随后的重定向URL是否为另一重定向URL。5.根据权利要求3所述的在线内容采集系统,其中所述分析还包括:如果所获取的潜在创意URL不为重定向URL,则确定与所获取的潜在创意URL关联的创意是否为FLASH对象或图像;如果与所获取的潜在创意URL关联的所述创意为FLASH对象或图像,则确定所述FLASH对象或所述图像的宽度和高度是否超过预定阈值;以及如果与所获取的潜在创意URL关联的所述创意不为FLASH对象或图像,则将与所获取的潜在创意URL关联的所述创意指示为无效。6.根据权利要求5所述的在线内容采集系统,其中所述预定阈值是5像素。7.根据权利要求5所述的在线内容采集系统,其中所述分析还包括:如果所述FLASH对象或所述图像的所述宽度和所述高度超过所述预定阈值,则将与所获取的潜在创意URL关联的所述创意指示为有效;以及将所获取的潜在创意URL储存在所述数据储存器中以用于与进一步获取的潜在创意URL进行比较。8.根据权利要求1所述的在线内容采集系统,其中所述分析还包括:如果所述点选URL为重定向URL,则确定所述重定向URL以前是否已经见过;如果所述重定向URL以前已经见过,则将所述点选URL指示为无效;以及如果所述重定向URL以前没有见过,则下载随后的重定向URL以确定所述随后的重定向URL是否为另一重定向URL。9.根据权利要求8所述的在线内容采集系统,其中所述分析还包括:如果所述点...
【专利技术属性】
技术研发人员:M·菲格,J·霍尔曼,
申请(专利权)人:埃森哲环球服务有限公司,
类型:发明
国别省市:爱尔兰;IE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。