本发明专利技术涉及一种基于用户将请求访问内容的预测来及时地将该内容预先取回到计算设备的技术。与内容相关联的包括时间特征、空间特征、时空特征和/或其它特征的特征被提供给至少部分地用历史访问数据来训练的模型。该模型返回从中作出是否预先取回内容的判定的信息。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术涉及一种基于用户将请求访问内容的预测来及时地将该内容预先取回到计算设备的技术。与内容相关联的包括时间特征、空间特征、时空特征和/或其它特征的特征被提供给至少部分地用历史访问数据来训练的模型。该模型返回从中作出是否预先取回内容的判定的信息。【专利说明】用于计算设备的内容预先取回背景从计算设备,尤其是移动计算设备访问远程内容可能是令人沮丧的。移动设备经由相对较慢的蜂窝连接来连接到因特网。例如,使用现有技术,在蜂窝电话上下载网页可能花费大约几秒来建立蜂窝塔连接,之后再花费若干秒/数十秒来执行下载。仅仅尽可能频繁地且尽可能多地预先取回远程内容以使得内容在本地可用通常是不合乎需要的。例如,远程内容(例如,web内容)频繁改变,并因此预先取回的内容可能迅速变旧,例如新闻和社交网站往往非常频繁地改变。另外,蜂窝电话和移动设备通常具有有限的电池和/或其它资源,由此尝试持续或相当有规律地在移动设备上更新预先取回的内容可能快速耗尽设备的电池并使其不可用。另外,某些设备用户招致数据下载收费,这意味着他们可能仅仅为了获取旧内容和/或大量不需要的内容而付费和/或用尽他们的下载额度限制。概述提供本概述以便以简化形式介绍将在以下的详细描述中进一步描述的一些代表性概念。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在以限制所要求保护的主题的范围的任何方式来使用。简而言之,本文描述的主题的各方面涉及一种可用于确定是否要将内容预先取回到计算设备的技术。确定是否要预先取回可基于生成与用户访问web内容的方式相关联和/或与更新内容本身的方式相关联的包括时空和/或时间相关特征数据的特征,将这些特征提供给至少部分地用历史访问数据来训练的模型,以及从该模型获取指示是否要预先取回内容的信息。在一方面,将这些特征提供给模型可包括将特征向量输入到模型中。特征向量可包括表示时间相关特征数据、空间相关特征数据、时空相关特征数据、流行度相关数据和/或上下文相关数据(例如,位置)的数据。在一方面,基于历史访问数据来训练以预测是否要预先取回内容的模型被配置成接收表示内容片段(例如,网页)的特征向量作为输入。特征向量可包括表示与用户何时访问该内容相关联和/或与该内容片段相关联的时间相关特征数据的数据。该模型处理特征向量以输出指示用户是否有可能请求访问内容的信息。结合附图阅读以下【具体实施方式】,本专利技术的其他优点会变得显而易见。附图简述作为示例而非限制,在附图中示出了本专利技术,附图中相同的附图标记指示相同或相似的元素,附图中:图1是表示用于训练模型的示例组件的框图,该模型基于从历史访问数据中提取的特征来预测用户是否有可能访问内容片段。图2是表示用于将被模型标识为可能被请求访问的内容预先取回的示例组件的框图。图3是表示用于训练预测用户是否有可能访问内容片段的模型的示例步骤的流程图。图4是表示用于在评估模型是否预测到内容将很有可能被请求时及时地预先取回内容的示例步骤的流程图。图5是表示其中可实现在此处所描述的各实施例的一个或多个方面的示例性、非限制性计算系统或操作环境的框图,例如在移动电话设备的例子中。详细描述本文描述的技术的各方面一般涉及提供更快的web浏览体验,它通过预测用户或应用的可能的将来web访问来在适当时智能地预先取回内容。对远程内容的及时预先取回可通过使用包括空间、时间、时空、流行度(喜好)和/或上下文相关特征的特征来完成,这些特征被用来确定预先取回哪些内容片段(例如,网页URL)以及预先取回每一内容片段的时机。在一方面和一个实现中,及时的内容预先取回基于通过组合包括空间、时间、时空、流行度(喜好)和/或上下文相关特征的特征以学习用于确定要预先取回的远程内容片段的用户访问模型(例如,分类器)来对点击预测问题(用户是否将可能想要选择预先取回的内容)求解。例如,基于用户访问历史,提取描述用户访问远程内容的方式的特征集。可提取对关于用户访问内容的顺序的信息进行编码的特征以及关于进行这些访问的绝对和相对时间以及这些访问的周期性的特征。使用来自这些历史访问数据的特征向量,在离线阶段中训练点击预测模型,该离线阶段提供用户在给定时间访问特定的远程内容片段(诸如URL)的概率。在运行时在线阶段,设备利用点击预测模型来查找用户(或应用)在任意长度的下一时间量内(或将来的某一时刻)访问给定的远程内容片段(例如,特定的网页URL)的概率。如果针对该URL的概率高于预定阈值,则将对应于该URL的内容预先取回到移动设备上。应当理解的是,此处的任何示例均是非限制性的。例如,虽然在此将移动设备/智能电话用作示例,但是在此所述的至少一些概念适用于膝上型计算机、平板计算机、个人计算机等等。此外,虽然预先取回用于浏览器的URL形式的web内容被用作一个示例,但可基于本文描述的技术来预先加载和/或预先取回任何下载内容(例如,应用和/或应用内容)。因此,本专利技术不限制于在此描述的任何具体的实施例、方面、概念、结构、功能或示例。相反,此处所描述的实施例、方面、概念、结构、功能或示例中的任一个都是非限制性的,并且本专利技术一般能够以在计算和内容访问方面提供好处和优点的各种方式来使用。图1是示出一个示例实现中各种组件的框图。一般而言,移动设备102将用户web访问记录到历史数据结构104中,该历史数据结构可位于设备上或者位于远程存储位置。web访问可包括自动页面刷新。离线训练机构106周期性地(例如每天、每周、每月)或者应某一其它适当事件使用该信息来构建关于用户的web访问预测模型108。模型108可以在移动设备本身上、在诸如用户的台式机之类的可能更强大的机器上构建,和/或可由例如云中的服务来构建。注意,诸如如果是远程维护的(例如在云中),则历史数据结构104可以从多个设备访问(例如,智能电话、膝上型计算机、平板计算机等)汇集,以帮助进行数据挖掘以用于训练模型,如下所述。此外,每一个这样的设备都可具有其自己的模型,且共享设备具有多个模型,每一模型映射到一个用户。来自不同设备的数据可以与例如设备标识符相关联地维护,以使得可以在适当时使用不同的权重;例如,从膝上型计算机收集到的访问数据可以不具有与智能电话所使用的模型中的智能电话的收集到的数据相同的权重。为了构建/训练模型108,特征提取机构110提取关于从历史数据结构104中标识出的“目标”URL的集合(例如,对应于如经由图1中的表格118表示的用户的web日志)的特征111-116的集合。如此处所使用的,与相对较不频繁访问的“非目标"URL形成对比,“目标”URL指的是用户频繁访问的URL( “目标”URL的数量通常相对较小,诸如十个或更少)。例如,目标URL可以是用户在一个月内至少访问五次的URL;然而,可使用其它阈值、计数、时段等来区分目标和非目标URL。目标URL的数量还可以与用户例如在每天或每月的基础上访问的URL的平均数成比例。每个月访问数千个(不同)URL的用户可具有比一个月只访问几百个URL的用户更大数量的目标URL。注意,模型预测目标web访问,并由此在一个实现中,只为目标web访问或未访问生成特征向量;然而,特征值对关于目标和非目标web访问两者的信息进行编码。如此处所使用的,特征111-11本文档来自技高网...
【技术保护点】
一种计算环境中的至少部分地在至少一个处理器上执行的方法,包括确定是否要将内容预先取回到计算设备,包括生成包括与所述内容相关联的时间相关特征数据的特征,将所述特征提供给至少部分地用历史访问数据来训练的模型,以及从所述模型获取指示是否要预先取回所述内容的信息。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:D·林贝罗普洛斯,O·里瓦,K·斯特劳斯,
申请(专利权)人:微软公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。