当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于本机应用内容验证的方法和系统技术方案

技术编号:14688918 阅读:97 留言:0更新日期:2017-02-23 11:18
包含在计算机储存介质上编码的计算机程序、用于验证(verify)本机应用的内容与由本机应用的内容单独提供的相应资源的内容之间的一致性的方法、系统和装置。该方法包含存取数据的动作,对于本机应用,该数据描述第一地址和第二地址的地址对,每个地址对是第一地址和相应第二地址,每个第一地址可由本机应用访问并且该本机应用从该第一地址接收第一内容,并且每个第二地址是分别提供第二内容的网络资源的地址;对于每个地址对:接收第一地址的第一内容;接收第二地址的第二内容;确定第一内容和第二内容是否是一致内容;并且仅对于第一内容和第二内容被确定为一致内容的每个地址对,确认地址对并且将地址对的确认数据存储于索引中。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
因特网提供对大量各种信息的访问。例如,通过因特网能够访问数字图像文件、视频和/或者音频文件以及特定主题或者特定新闻文章的网页资源。关于网页资源,设计许多这些资源是为了有助于执行特定功能,诸如,银行业务、酒店预定、购物等等,或者为了提供信息,诸如,在线百科全书、电影数据库、新闻等等。各种搜索引擎可用于识别通过因特网可访问的特定资源。这些搜索引擎爬行各种网页资源并且对各种网页资源建索引。然后,搜索引擎利用该索引确定哪些资源对搜索查询的响应最多,并且作为对查询的响应,提供链接到该资源的搜索结果。随着平板计算机和智能电话的到来,现在大量提供本机应用,本机应用有利于通过网页资源的使用而变得方便的相同功能的性能,或者有利于通过网页的使用提供相同的内容。
技术实现思路
本说明书描述了用于验证本机应用内容的技术。一般地,本说明书中描述的主题的一个创新方案能够以方法实现,该方法包含访问数据的动作,对于本机应用,该数据描述第一地址和第二地址的地址对,每个地址对是第一地址和相应第二地址,每个第一地址可由本机应用访问并且该本机应用从该第一地址接收第一内容,并且每个第二地址是各自提供第二内容的网络资源的地址;对于每个地址对:接收第一地址的第一内容;接收第二地址的第二内容;确定第一内容和第二内容是否是一致内容;并且仅对于第一内容和第二内容被确定为一致内容的每个地址对,确认地址对并且将地址对的确认数据存储于索引中。该方案的其他实施例包含相应系统、装置和在计算机储存设备上编码的计算机程序,配置该计算机程序,以执行该方法的动作。能够实施本说明书中描述的主题的特定实施例,以实现下面的一个或者多个优点。在对于内容索引用于本机应用的链接之前,搜索引擎验证本机应用的内容与相应网站的内容一致。该验证保证,当提供(serving)对查询做出响应的本机应用搜索结果时,搜索引擎正对将满足用户的信息需要的信息提供访问。在一些实施中,搜索引擎仅需要索引这样的内容:该内容由网站和由本机应用在一个索引中以一致性方式提供、而不是在用于网络资源的索引中和用于本机应用的另一个索引中分离地提供的内容。这样减少了对两个语料库的整体维护。在一些实施中,该验证有利于提供被已知为与网络资源提供一致内容的本机应用的本机应用搜索结果。因此,网络资源能够被用作本机应用的评分代理(scoringproxy)。当对搜索结果评分和分级时,这样允许本机应用与相应资源之间的一致性得分。最后,利用各种内容验证技术,对于本机应用与相应网络资源之间的各种格式化差异和显示差异,验证处理鲁棒。在附图和下面的描述中陈述了本说明书中描述的主题的一个或者多个实施例的细节。根据该描述、附图和权利要求,主题的其他特征、方案和优点变得显而易见。附图说明图1是验证本机应用的内容与网络内容一致的示例性环境中的框图。图2是用于验证本机应用内容的示例性处理的流程图。图3是示例性确认处理的流程图。图4是用于生成并且提供本机应用搜索结果的示例性处理的流程图。图5是包含本机应用搜索结果的搜索结果页的示意图。各附图中类似的参考编号和名称指类似的单元。具体实施方式如在此使用的,本机应用独立于用户设备上的浏览器应用运行。本机应用是专门被设计为运行于特定用户设备操作系统上和机器固件上而不在浏览器中的应用。因此,本机应用不同于浏览器、基于浏览器的应用和浏览器渲染资源(browser-renderedresource)。在每次实例化或者渲染后者时,后者都要求从网络服务器下载全部或者至少一些元素或者指令。基于浏览器的应用和浏览器渲染的应用能够通过浏览器之内的所有具有网络能力的移动设备处理,并且因此,其不像本机应用那样是操作系统专用的。此外,如在此使用的,本机应用搜索结果是对应于特定本机应用的搜索结果,并且当被选择时,其调用特定本机应用。发行商(或者第三方)可以提供本机应用的内容地址(例如,URI、URL或者命令行参数)和打算与该本机应用提供相同或者类似内容的相应网络资源地址。这种内容被称为“一致内容”,因为其由本机应用和网络资源二者提供。然而,因为各种原因,本机应用提供的内容可能与网络资源提供的内容不一致。不一致可能是因为不正确的地址规范、不能保持用于本机应用的后端数据或者可能导致不一致的其他原因。因此,诸如搜索引擎的系统验证本机应用与网络资源之间的内容。在一些实现中,对于本机应用,系统访问描述第一地址和第二地址的地址对的数据。每个地址对定义第一地址和相应的第二地址,其中每个第一地址能够由本机应用访问,并且本机应用从其接收第一内容,并且每个第二地址是各自提供第二内容的网络资源的地址。对于每个地址对,系统接收第一地址的第一内容和第二地址的第二内容。然后,系统确定第一内容和第二内容是否是一致内容。如果该内容是一致的,则该地址对被验证。如果诸如实体匹配、n元语法似然性、短语匹配和特征相似性的一个或者多个比较过程指出第一内容与第二内容之间的一致性阈值水平,则确定该内容一致。仅对于确定第一内容和第二内容是一致内容的地址对,系统存储用于地址对的索引验证数据。验证数据便于提供被已知与网络资源提供一致内容的本机应用的本机应用搜索结果。关于搜索操作,系统接收用户设备的搜索请求。搜索请求包含查询和用于识别安装于用户设备上的本机应用的数据。系统还接收识别对查询做出回应的网络资源的数据。然后,系统确定网络资源中对查询做出回应的任何网络资源是否包含安装于用户设备上的本机应用可访问的一致内容。响应于肯定的确定,系统生成本机应用搜索结果,该本机应用搜索结果使得当在用户设备上选择本机应用搜索结果时,安装于用户设备上的本机应用请求一致内容。然后,将网络资源搜索结果和本机应用搜索结果提供给用户设备。下面将更详细描述这些特征和其他特征。图1是本机应用的内容正在经受被验证为与网络内容一致的示例性环境100的方框图。诸如因特网的计算机网络102连接资源发行商网站104、应用发行商106、用户设备108和搜索系统110。资源发行商网站104包含与域关联并且由位于一个或者多个地点的一个或者多个服务器宿主的一个或者多个网络资源105。通常,资源发行商网站是以超文本标记语言(HTML)格式化的能够含有文本、图像、多媒体内容和编程元素的一批网页。每个网站104由作为控制、管理和/或者拥有网站104的实体的内容发行商维护。网页资源105是发行商网站104通过网络102能够提供的并且具有资源地址,例如统一资源定位器(URL)的任何数据。网页资源可以是HTML页面、图像文件、视频文件、音频文件和反馈源,仅列举几个。资源可以包含嵌入信息,例如,元信息和超链接以及/或者嵌入指令,例如,客户端脚本。特别是当发行商105维护移动呈现时,可以对台式机环境或者移动环境优化资源。发行商105也可以提供本机应用107。如上所述,本机应用107是专门为在特定用户设备操作系统和机器固件上运行而设计的应用。许多发行商104在网络资源和本机应用二者中提供相同内容。对这种内容的传递的管理由发行商后端120执行。发行商后端120包含:发行商储存器122,该发行商储存器122存储发行商提供的内容;网络服务器124,该网络服务器124提供来自发行商储存器中的内容作为网络资源(例如,网页);以及本机应用数据本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/201580025199.html" title="用于本机应用内容验证的方法和系统原文来自X技术">用于本机应用内容验证的方法和系统</a>

【技术保护点】
一种在数据通信中由包括一个或者多个计算机的数据处理装置执行的计算机实现的方法,所述方法包括:访问数据,对于本机应用,所述数据描述第一地址和第二地址的地址对,每个地址对是第一地址和相应的第二地址,每个第一地址由所述本机应用可访问并且所述本机应用从所述第一地址接收第一内容,并且每个第二地址是各自提供第二内容的网络资源的地址;对于每个地址对:接收所述第一地址的所述第一内容;接收所述第二地址的所述第二内容;确定所述第一内容和所述第二内容是否是一致内容;仅对于所述第一内容和所述第二内容被确定为一致内容的每个地址对,确认所述地址对并且将所述地址对的确认数据存储于索引中。

【技术特征摘要】
【国外来华专利技术】2014.03.11 US 14/203,7741.一种在数据通信中由包括一个或者多个计算机的数据处理装置执行的计算机实现的方法,所述方法包括:访问数据,对于本机应用,所述数据描述第一地址和第二地址的地址对,每个地址对是第一地址和相应的第二地址,每个第一地址由所述本机应用可访问并且所述本机应用从所述第一地址接收第一内容,并且每个第二地址是各自提供第二内容的网络资源的地址;对于每个地址对:接收所述第一地址的所述第一内容;接收所述第二地址的所述第二内容;确定所述第一内容和所述第二内容是否是一致内容;仅对于所述第一内容和所述第二内容被确定为一致内容的每个地址对,确认所述地址对并且将所述地址对的确认数据存储于索引中。2.根据权利要求1所述的计算机实现的方法,还包括:接收用户设备的搜索请求,所述搜索请求包含:查询,所述查询包含一个或者多个术语;以及识别数据,将本机应用识别为正安装在用户设备上;接收识别对所述查询做出响应的网络资源的数据;确定所述网络资源中对所述查询做出响应的第一网络资源由对于所述本机应用的被确认地址的第二地址寻址,并且响应该确定生成本机应用搜索结果,该本机应用搜索结果包含所述被确认的地址对的所述第一地址;以及将网络资源搜索结果和所述本机应用搜索结果提供给所述用户设备。3.根据权利要求1所述的计算机实现方法,其中确定所述第一内容和所述第二内容是否是一致内容包括:从所述第一内容提取第一n元语法;从所述第二内容提取第二n元语法;基于所述第一n元语法和第二n元语法,确定n元语法似然性测度,其中所述n元语法似然性测度测量所述第一内容与所述第二内容之间的似然性。4.根据权利要求1所述的计算机实现的方法,其中确定所述第一内容和所述第二内容是否是一致内容包括:由知识图谱和所述第一内容识别所述第一内容中描述的第一实体;由所述知识图谱和所述第二内容识别所述第一内容中描述的第二实体;以及基于所述第一实体和所述第二实体确定实体匹配测度,其中所述实体匹配测度测量所述第一实体与所述第二实体之间的匹配。5.根据权利要求1所述的计算机实现方法,其中确定所述第一内容和所述第二内容是否是一致内容包括:确定代表所述第一内容的格式化特征的第一内容特征向量;确定代表所述第二内容的格式化特征的第二内容特征向量;以及基于所述第一内容特征向量和所述第二内容特征向量,确定特征似然性测度,其中所述特征似然性测度测量所述第一内容与所述第二内容之间的似然性。6.根据权利要求1所述的计算机实现方法,其中确定所述第一内容和所述第二内容是否是一致内容包括:从所述第一内容提取第一短语;从所述第二内容提取第二短语;基于所述第一短语和所述第二短语,确定短语匹配测度,其中所述短语匹配测度测量所述第一内容与所述第二内容之间的似然性。7.一种非临时计算机可读储存介质,所述非临时计算机可读储存介质存储数据处理装置可执行并且在这样执行时使所述数据处理装置执行包括如下操作的指令:访问数据,对于本机应用,所述数据描述第一地址和第二地址的地址对,每个地址对是第一地址和相应的第二地址,每个第一地址由所述本机应用可访问并且所述本机应用从所述第一地址接收第一内容,并且每个第二地址是分别提供第二内容的网络资源的地址;对于每个地址对:接收所述第一地址的所述第一内容;接收所述第二地址的所述第二内容;确定所述第一内容和所述第二内容是否是一致内容;仅对于所述第一内容和所述第二内容被确定为一致内容的每个地址对,确认所述地址对并且将所述地址对的确认数据存储于索引中。8.根据权利要求7所述的非临时计算机可读储存介质,所述操作还包括:接收用户设备的搜索请求,所述搜索请求包含:查询,所述查询包含一个或者多个术语;以及识别数据,将本机应用识别为正安装在用户设备上;接收识别对所述查询做出响应的网络资源的数据;确定所述网络资源中对所述查询做出响应的第一网络资源由所述本机应用的被确认的地址的第二地址寻址,并且响应该确定生成本机应用搜索结果,该本机应用搜索结果包含所述被确认地址对的所述第一地址;以及将网络资源搜索结果和所述本机应用搜索结果提供给所述用户设备。9.根据权利要求7所述的非临时计算机可读储存介质,其中确定所述第一内...

【专利技术属性】
技术研发人员:H徐E亨德里克斯汪琛
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1