用于校正按键错误的方法、搜索装置和搜索系统制造方法及图纸

技术编号:2844543 阅读:185 留言:0更新日期:2012-04-11 18:40
根据本发明专利技术,提供了用于校正用户输入中的按键错误的方法、搜索引擎和搜索系统。在一个实施例中,一种方法包括接收用户在客户设备的键盘上输入的检索词的步骤、将客户设备通过通信网络连接到数据库的步骤、搜索相似串的步骤、利用相似串基于预定标准来形成校正结果的步骤,以及将校正结果输出到客户设备的步骤。本发明专利技术的方法、搜索引擎和搜索系统适于有效地校正按键错误,并且适用于多种语言、键盘和/或输入法。

【技术实现步骤摘要】

本专利技术涉及计算机系统,尤其涉及用于校正用户输入错误的方法、搜索引擎和搜索系统。
技术介绍
近年来,因特网的使用迅速增长,大量的信息出现在因特网上。因特网用户为了从如此大量的信息中获取他们感兴趣的信息,通常求助于搜索引擎,例如AltaVista、Yahoo!搜索、MSN搜索,等等。当激活了网页浏览器之后,用户仅需向搜索引擎输入一个或多个检索词,搜索引擎就会返回包含相关因特网资源的信息(例如简介、URL等)在内的结果列表。利用搜索引擎,用户能够有效而高效地从因特网获取有用的信息。因特网上信息搜索的一个示例是正在变得日益普及的在线购物。图1的流程图示意性地示出了在线购物的过程。如图1所示,在线购物通常包括以下两个步骤。在步骤101中,利用诸如计算机或移动电话之类的终端访问因特网的用户从在线商店搜索其感兴趣的商品信息。在步骤102中,当找到想要的商品后,用户接收商品并通过货到付款等方法付款。这里所使用的术语“商品”包括所有可以在线交易的产品,例如书籍、CD等等。图2的框图示意性地示出了用于在线购物的系统20的基本构成。如图2所示,用户通过终端21访问因特网22。用户可以登录到用于在线购物的在线商店23。在线商店23配备了搜索引擎24,该搜索引擎24中包含商品数据库25。应当注意的是,为简明起见,并未示出在线商店的其它部分,虽然这些部分对于商店的运行可能是必要的。搜索引擎24连接到因特网22并与用户交互。在在线购物的第一步(即搜索商品信息的步骤)期间,用户使用终端21,输入与其感兴趣的商品有关的检索词。搜索引擎24接收到检索词,并利用检索词在商品数据库25中搜索相关商品。如果搜索引擎24找到了相关商品,它就将包含关于该相关商品的信息的结果列表返回给用户。如果搜索引擎24没有找到与检索词有关的信息,它就返回表示未找到的消息。在商品搜索过程中,一个常见的问题是在用户查询的一开始可能就出现一些错误。即,用户可能无意间向搜索引擎24键入了错误的检索词。在此情况下,搜索引擎24将会从商品数据库25中找到错误的结果(或者什么也找不到),并将该结果(或者表示未找到的消息)返回给用户。这样,用户就无法获得期望的信息,并且他/她可能不得不输入正确的检索词并再次搜索。这不仅对用户来说很麻烦,而且浪费系统资源。因此,产生了自动校正查询错误并为用户找到最佳候选商品的需求。一般而言,用户查询中可能存在的错误有三种拼写错误、理解错误和按键错误。拼写错误是指同音词的误用。例如,如果用户想要输入“技术”(拼音是“jishu”)这个词作为检索词,但却输入了同音的“奇数”(拼音也是“jishu”),就发生了拼写错误。理解错误指的是近义词的误用,这常常是由用户对词义的误解引起的。例如,如果用户应当输入“检索”(“jiansuo”)这个词作为检索词,但却输入了近义词“检查”(“jiancha”),就发生了理解错误。按键错误比另外两种错误常见得多。例如,通过拼音输入法,用户可能想要通过首先输入“技术”这个词的拼音(“jishu”),来输入“技术”作为检索词。遗憾的是,用户可能实际输入的是“秘书”这个词,这是因为“秘书”的拼音是“mishu”,用户实际上在键盘上按下的是“m”键而非“j”键,就发生了这种按键错误。人们已经提出了多种解决方案,用来在信息搜索过程中校正检索词的输入错误。然而,这些方案中的大多数仅能处理拼写错误和理解错误。例如,日本专利申请特开昭64-013666公开了一种使用同音词典来校正拼写错误的系统。日本专利申请特开平10-240739公开了一种利用词典来校正检索词的信息检索装置。在该词典中存储了包含关于同音词、近义词、常一起使用的词、意义相关的词等等的信息的条目,并基于所述信息来确定检索词是否有误。一旦发现了错误的检索词,就根据词典中合适的条目,将错误的词用同音词、近义词或其它某些类似的词来代替。如上所述,按键错误是最常见的错误类型。尤其是在具有只包含几个键的小键盘的便携式终端(例如移动电话)中,键彼此靠近,便携式终端的用户可能不得不按下一个键若干次以输入一个正确的字母,例如按3次“6”键以得到字母“O”。这使得按键错误更容易发生了。因此,为了全面地处理用户查询中的错误,必须有效地处理按键错误。日本专利申请特开平10-21262提到了使用按键排列信息来校正一些按键错误。然而,平10-21262仅提到了基于对被错按的键周围的键的调查来补充候选词,但并未提供通用的解决方案。
技术实现思路
因此,本专利技术的目的在于提供有效处理按键错误的通用的方法、搜索引擎和搜索系统。根据本专利技术的一个技术方案,提供了一种用于校正按键错误的方法,包括以下步骤在客户设备的键盘上接收用户所输入的检索词;将所述客户设备通过通信网络连接到第一数据库;搜索与所述检索词相似的串;使用所述相似串,基于预定的标准形成校正结果;以及将所述校正结果输出给所述客户设备。根据本专利技术的另一技术方案,提供了一种搜索引擎,用于根据客户设备的请求在第一数据库中检索数据,所述客户设备可控制地通过通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收在所述客户设备的键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。根据本专利技术的又一技术方案,提供了一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,该系统包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络;以及搜索引擎,其用于根据所述客户设备的请求在所述第一数据库中检索数据,所述客户设备可控制地通过所述通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收所述用户在所述键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。根据本专利技术的另一技术方案,提供了一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,该系统包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络;以及搜索引擎,其用于根据所述客户设备的请求在所述第一数据库中检索数据,所述客户设备可控制地通过所述通信网络连接到所述搜索引擎和第一数据库,其中所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收所述用户在所述键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于将所述检索单元的搜索结果输出到所述客户设备,并且所述客户设备还包括检索词输出部分,其可操作地耦合到所述键盘,本文档来自技高网
...

【技术保护点】
一种用于校正按键错误的方法,包括以下步骤:在客户设备的键盘上接收用户所输入的检索词;将所述客户设备通过通信网络连接到第一数据库;搜索与所述检索词相似的串;使用所述相似串,基于预定的标准形成校正结果;以及将所述校正结果输出给所述客户设备。

【技术特征摘要】
1.一种用于校正按键错误的方法,包括以下步骤在客户设备的键盘上接收用户所输入的检索词;将所述客户设备通过通信网络连接到第一数据库;搜索与所述检索词相似的串;使用所述相似串,基于预定的标准形成校正结果;以及将所述校正结果输出给所述客户设备。2.如权利要求1所述的方法,其中所述搜索相似串的步骤包括在所述第一数据库中搜索所述相似串。3.如权利要求1所述的方法,其中所述搜索相似串的步骤包括在第二数据库中搜索所述相似串,所述第二数据库存储了预定的检索词的集合。4.如权利要求1、2和3中任一项所述的方法,还包括在所述第一数据库中搜索与所述检索词相匹配的条目的步骤。5.如权利要求1、2和3中任一项所述的方法,还包括在搜索所述相似串之前将所述检索词转换成语音表示的步骤。6.如权利要求1、2中任一项所述的方法,其中作为所述搜索相似串步骤的结果而得到了多个相似串,所述方法还包括以下步骤计算所述检索词和每个相似串之间的相似度,以及基于所述相似度对相似串进行排序。7.如权利要求6所述的方法,其中所述校正结果包括预定数量的基于所述排序步骤的结果的与所述多个相似串相关联的候选词。8.如权利要求6所述的方法,其中所述校正结果包括所述第一数据库中与具有最高相似度的相似串相匹配的条目。9.如权利要求6所述的方法,其中所述计算相似度的步骤包括以下步骤计算检索词和相似串之间的不同点;分析每个不同点所有可能的形成过程;为每个形成过程找到按键错误概率;以及合成所述按键错误概率以获得所述相似度。10.如权利要求9所述的方法,其中所述为每个形成过程找到按键错误概率的步骤包括从按键错误信息词典中对每个可能的形成过程检索按键错误概率,所述按键错误信息词典中存储了按键错误概率的条目。11.如权利要求10所述的方法,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。12.如权利要求10所述的方法,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。13.一种搜索引擎,用于根据客户设备的请求在第一数据库中检索数据,所述客户设备可控制地通过通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收在所述客户设备的键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。14.如权利要求13所述的搜索引擎,其中所述检索单元在所述第一数据库中搜索所述相似串。15.如权利要求13所述的搜索引擎,其中所述搜索引擎还包括用于存储预定的检索词的集合的第二数据库,并且所述检索单元在所述第二数据库中搜索所述相似串。16.如权利要求13、14和15中任一项所述的搜索引擎,其中所述检索单元还用于在所述第一数据库中搜索与所述检索词相匹配的条目。17.如权利要求13、14和15中任一项所述的搜索引擎,其中所述检索单元还用于在搜索所述相似串之前将所述检索词转换成语音表示。18.如权利要求13、14中任一项所述的搜索引擎,还包括按键错误信息词典,其包含按键错误的概率;以及错误概率计算单元,其可操作地耦合到所述按键错误信息词典,用于在搜索出多个相似串的情况下,利用所述按键错误的概率来计算相似度。19.如权利要求18所述的搜索引擎,其中所述校正结果包括预定数量的按照相似度排序的与所述多个相似串相关联的候选词。20.如权利要求18所述的搜索引擎,其中所述校正结果包括所述第一数据库中与具有最高相似度的相似串相匹配的条目。21.如权利要求18所述的搜索引擎,其中所述错误概率计算单元包括不同点计算单元,其耦合到所述检索单元,用于计算检索词和相似串之间的不同点;概率检索单元,其耦合到所述不同点计算单元和所述按键错误信息词典,用于分析每个不同点所有可能的形成过程,并从所述按键错误信息词典中检索每个可能的形成过程的按键错误概率;以及概率合成单元,其耦合到所述概率检索单元和所述搜索结果输出单元,用于合成所述按键错误概率以获得所述相似度。22.如权利要求18所述的搜索引擎,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。23.如权利要求18所述的搜索引擎,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。24.一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络;以及搜索引擎,其用于根据所述客户设备的请求在所述第一数据库中检索数据,所述客户设备可控制地通过所述通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收所述用户在所述键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。25.如权利要求24所述的搜索系统,其中所述检索单元在所述第一数据库中搜索所述相似串。26.如权利要求24所述的搜索系统,其中所述搜索系统还包括用于存储预定的检索词的集合的第二数据库,并且所述检索单元在所述第二数据库中搜索所述相似串。27.如权利要求24、25中任一项所述的搜索系统,其中所述搜索引擎还包括按键错误信息词典,其包含按键错误的概率;以及错误概率计算单元,其可操作地耦合到所述按键错误信息词典,用于在搜索出多个相似串的情况下,利用所述按键错误的概率来计算相似度。28.如权利要求27所述的搜索系统,其中所述错误概率计算单元包括不同点计算单元,其耦合到所述检索单元,用于计算检索词和相似串之间的不同点;概率检索单元,其耦合到所述不同点计算单元和所述按键错误信息词典,用于分析每个不同点所有可能的形成过程,并从所述按键错误信息词典中检索每个可能的形成过程的按键错误概率;以及概率合成单元,其耦合到所述概率检索单元和所述搜索结果输出单元,用于合成所述按键错误概率以获得所述相似度。29.如权利要求27所述的搜索系统,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。30.如权利要求27所述的搜索系统,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。31.一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络...

【专利技术属性】
技术研发人员:齐红威赵凯王亚波刘晓炜
申请(专利权)人:日电中国有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1