改进的搜索引擎制造技术

技术编号:2884635 阅读:218 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种利用用户对特定网页列表的选择结果更新因特网搜索引擎数据库的方法,该特定网页列表的选择结果来自提供给该用户作为其初始关键词搜索输入的结果的一般网页列表。通过用许多不同用户的选择来更新该数据库,可更新该数据库以便按重点排列相对给定关键词选择最多的那些网页列表,从而在以后使用相同关键词搜索输入的搜索中首先给出最流行的网页。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及允许增强的数据库搜索,特别是供互联网搜索引擎使用的方法和装置。对获得相关信息并筛选不想要/不感兴趣的信息的有效和实用装置的需要在增涨,特别是由于互联网的创立。由于全球网站的数量在指数级地增长和其中包含的绝对信息量特别加剧了该需求。在检索因特网上可供使用的信息的尝试中,已经产生大量软件搜索引擎,用户借助这些搜索引擎在其个人计算机上从键盘输入由适当的关键词构成的搜索命令。搜索命令发送到服务器计算机,该服务器计算机具有与该服务器计算机有关的搜索引擎。搜索引擎接收搜索命令,然后用其通过网址的数据库和网点上存储的文本扫描这些关键词。此后,把扫描的结果从服务器计算机传回到用户计算机并在用户计算机的屏幕上显示。为使该搜索引擎被新网点所了解和更新其现有网点的记录,或是网点所有者本身通知搜索引擎或可通过″网络浏览器″获得该信息以更新在服务器计算机的数据库。网络浏览器是一种自动程序,该自动程序探索和记录网点的内容和其到其它网点的链接,从而在尝试检索所有当前网点的网点之间扩展。该数据库结构和搜索该数据库的方法造成某些明显的困难。尽管有频繁删除,重新寻址,更新网点的事实等,因特网增长率在新网点的扫描中已导致大量的积压,因而留下了过时和/或误导信息的搜索引擎。虽然可构成网络浏览器以便根据其位置(标题,嵌入链接,地址等)按重点排列可能的关键词,然而,根据所使用的搜索引擎,仍需要扫描网点文本(经常涉及大部分或甚至所有网点文本)的实质部分。这样导致对搜索引擎的巨大的存储需求。此外,典型的关键词搜索可能带来极大量的资料,用户对其中的大部分不感兴趣。用户通常根据网点的简要说明从该列表进行选择,并探索所选择的网点直到找出需要的信息。这些结果是根据搜索引擎的具体标准排列的列表形式。这些标准可以从关键词在搜索到的文本中任何地方出现的次数排列,到对特定位置(如前面提到的)中使用的关键词给出加权的方法。当已使用多个关键词时,还根据应用的不同关键词的数量排列站点。所有这些排列系统的基本缺陷在于其客观性,它们是根据搜索引擎的编程标准,和特定类型的网点设计上设置的重要性确定的,而不用实际用户意见的任何度量标准。这确实可导致荒谬的情况,由此在为确保最常用的搜索引擎的有利访问率的尝试下,某些设计者根据上面提到的标准故意构成其网点,有损于该网点的存在,可读性和内容。本专利技术的目的是通过开发操作人员的脑力来改善上面提到的常规搜索引擎的缺陷。本专利技术另一个目的是提供一种新的搜索引擎,与现有的软件引擎相比,新的搜索引擎通过减少的系统存储和/或计算需求提高了效率,可使用性和效果。本专利技术的再一个目的是与生成或更新其数据的指示一起提供搜索数据的流行性的各种指示。为获得上面提到的本专利技术的优点,本专利技术中包括的一个实施例提供一种利用用户选择的具体网页的结果更新因特网搜索引擎数据库的方法,该具体网页是从作为用户的初始关键词搜索输入向用户提供的一般网页列表列出的。通过用许多不同用户的选择更新数据库,可更新该数据库,以便按重点排列已相对给出的关键词最多选择的那些网络列表,并由此在以后使用相同关键词搜索输入的搜索中首先给出最通用的网页列表。在本专利技术的另一个实施例中,提供一种确定与从服务器计算机发送到用户网点的列表一起提供的内容的方法。在该实施例中,从多个不同开发者网点中的每一个获得一个内容列表。每个内容列表包括内容,开发者标识符,和关键词,以及关键词选择系数。此后,从获得的对不同内容列表相同的关键词确定特定的关键词。对于该特定关键词,在确定何时向用户网点发送不同的内容列表时使用关键词选择系数,在另一个实施例中,提供一种利用从向用户给出的相关的关键词列表获得的具体关键词的用户选择结果更新关键词表的方法。通过利用与该相同关键词有关的许多不同用户的选择来更新数据库,当以后输入相同的关键词时可首先提供和给出适当的关键词。通过结合附图研究下面优选实施例的详细说明可理解本专利技术的这些和其它优点,其中附图说明图1表示本专利技术的整体特性;图2说明对每个不同能力搜索的各种输入,说明提供根据本专利技术的引擎的输出;图3A和3B说明根据本专利技术在形成向终端用户提供的搜索结果的过程中选择网页的处理示意图;图4说明根据本专利技术用于不同网页搜索的数据集。图5表示以前描述的各种数据集,和根据本专利技术导致提供建议的网页的列表的各种输入和作用;图6说明根据本专利技术的流行搜索的实施;图7说明根据本专利技术的热度减弱(hot off)新闻搜索的实施;图8说明根据本专利技术的高跳跃(high-flyer)搜索的实施;图9说明根据本专利技术的随机搜索的实施;图10说明根据本专利技术的以前收藏页搜索的实施;图11说明根据本专利技术的集中搜索的实施;图12说明根据本专利技术的数据生成搜索的实施;图13说明根据本专利技术的定制搜索的实施;图14说明根据本专利技术基于用户群身份的搜索的实施;图15说明根据本专利技术的关键词消除器特性;图16说明根据本专利技术确定应将搜索结果用于形成累积冲浪者跟踪表的过程;图17说明根据本专利技术的网页的主动建议。图18说明根据本专利技术的网页的被动建议。图19提供根据本专利技术的建议关键词的示意图。图20说明根据本专利技术生成建议的关键词的数据集的方式。图21说明根据本专利技术可生成建议的关键词列表的各种方式。图22说明根据本专利技术如何将内容附加到网页列表。图23说明根据本专利技术的各种内容数据集和占据它们的操作。图24说明根据本专利技术的各种内容数据集和用于从它们选择数据的操作。图25说明根据本专利技术的网页列表和其它内容数据。图1A和1B说明了本专利技术的全部特性中的某些特性,下文将对其进一步详细描述。首先指出,在下面的描述中在各个附图和描述中使用相同编号的参考标号表示相同或相似的结构,动作或处理步骤。本专利技术最好在其中每个计算机通常包含微处理器,存储器,和调制解调器,并且某些计算机包含显示器等的网络环境中实施,如所熟知的。如图1B所示,示出多个用户网点/计算机100A-100D,以及多个服务器计算机102A-B,开发者网点/计算机104A-B。可以理解,在典型的因特网中,如所说明的,不同的服务器计算机102可互连在一起。此外,虽然仅示出几个用户网点,开发者网点和服务器计算机,可以理解,可将几千台这样的计算机互连在一起。虽然为根据所示的服务器计算机102操作的编码程序指令的序列实现本专利技术的应用写出了本专利技术的具体实施例,可以用其它形式来代替实现这些程序指令的特定序列,例如具有满足下面描述的应用的特殊指令的处理器。正如下文所说明的,实现对用户透明的附加操作以便根据目前做出的搜索获得将来的搜索结果。如图所示,本专利技术具有各种能力,在图1A的并行流程中说明了每种能力,图1A说明了可同时的不同能力的概要。就其整个能力来说,启动框10给出三种建议网页12,建议关键词14,和内容建议16。为使用户根据本专利技术选择网页12,有一个选择将要进行的搜索类型的步骤18。此后,在步骤20,输入从各种来源中的一种获得的搜索输入并与步骤18选择的算法一起使用以确定搜索结果。然后向用户显示该搜索的结果,分别如图中标为步骤22,24,和26的显示网页的生成表,显示被动建议的网页,和显示主动建议的网页的步骤所示。下文更详细地描述该能力,以及其如何实现。为出现用户可选择或不选择的关键词建议,最好有选本文档来自技高网...

【技术保护点】
在具有多个用户网点的计算机网络中,一种对服务器计算机的数据库中存储的多个数据项目的相对重要性加权的方法,包括步骤: 在所述服务器计算机从用户网点接收关键词; 在所述服务器计算机产生与所述关键词对应的多个列表,每个列表还对应于所述数据项目中的一个; 从所述服务器计算机向所述用户网点之一发送所述多个列表; 在所述服务器计算机检测所述用户网点选择了所述多个数据项目中的哪个数据项目,所述用户网点根据所述用户网点选择的所述对应的列表发送所述数据项目中每个所选择的项目;和 更新所述数据库,以便对所述数据项目中所述被选择的数据项目加权,使其相对所述关键词比所述数据项目中未被选择的数据项目相对更重要。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:格兰特J瑞恩肖恩W瑞恩克雷格M瑞恩韦恩A芒罗黛尔鲁宾逊
申请(专利权)人:NBCI新西兰有限责任合伙公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1