【技术实现步骤摘要】
本专利技术涉及计算机系统,尤其涉及用于校正用户输入错误的方法、搜索引擎和搜索系统。
技术介绍
近年来,因特网的使用迅速增长,大量的信息出现在因特网上。因特网用户为了从如此大量的信息中获取他们感兴趣的信息,通常求助于搜索引擎,例如AltaVista、Yahoo!搜索、MSN搜索,等等。当激活了网页浏览器之后,用户仅需向搜索引擎输入一个或多个检索词,搜索引擎就会返回包含相关因特网资源的信息(例如简介、URL等)在内的结果列表。利用搜索引擎,用户能够有效而高效地从因特网获取有用的信息。因特网上信息搜索的一个示例是正在变得日益普及的在线购物。图1的流程图示意性地示出了在线购物的过程。如图1所示,在线购物通常包括以下两个步骤。在步骤101中,利用诸如计算机或移动电话之类的终端访问因特网的用户从在线商店搜索其感兴趣的商品信息。在步骤102中,当找到想要的商品后,用户接收商品并通过货到付款等方法付款。这里所使用的术语“商品”包括所有可以在线交易的产品,例如书籍、CD等等。图2的框图示意性地示出了用于在线购物的系统20的基本构成。如图2所示,用户通过终端21访问因特网22。用户可以登录到用于在线购物的在线商店23。在线商店23配备了搜索引擎24,该搜索引擎24中包含商品数据库25。应当注意的是,为简明起见,并未示出在线商店的其它部分,虽然这些部分对于商店的运行可能是必要的。搜索引擎24连接到因特网22并与用户交互。在在线购物的第一步(即搜索商品信息的步骤)期间,用户使用终端21,输入与其感兴趣的商品有关的检索词。搜索引擎24接收到检索词,并利用检索词在商品数据库25中 ...
【技术保护点】
一种用于校正按键错误的方法,包括以下步骤:在客户设备的键盘上接收用户所输入的检索词;将所述客户设备通过通信网络连接到第一数据库;搜索与所述检索词相似的串;使用所述相似串,基于预定的标准形成校正结果;以及将所述校正结果输出给所述客户设备。
【技术特征摘要】
1.一种用于校正按键错误的方法,包括以下步骤在客户设备的键盘上接收用户所输入的检索词;将所述客户设备通过通信网络连接到第一数据库;搜索与所述检索词相似的串;使用所述相似串,基于预定的标准形成校正结果;以及将所述校正结果输出给所述客户设备。2.如权利要求1所述的方法,其中所述搜索相似串的步骤包括在所述第一数据库中搜索所述相似串。3.如权利要求1所述的方法,其中所述搜索相似串的步骤包括在第二数据库中搜索所述相似串,所述第二数据库存储了预定的检索词的集合。4.如权利要求1、2和3中任一项所述的方法,还包括在所述第一数据库中搜索与所述检索词相匹配的条目的步骤。5.如权利要求1、2和3中任一项所述的方法,还包括在搜索所述相似串之前将所述检索词转换成语音表示的步骤。6.如权利要求1、2中任一项所述的方法,其中作为所述搜索相似串步骤的结果而得到了多个相似串,所述方法还包括以下步骤计算所述检索词和每个相似串之间的相似度,以及基于所述相似度对相似串进行排序。7.如权利要求6所述的方法,其中所述校正结果包括预定数量的基于所述排序步骤的结果的与所述多个相似串相关联的候选词。8.如权利要求6所述的方法,其中所述校正结果包括所述第一数据库中与具有最高相似度的相似串相匹配的条目。9.如权利要求6所述的方法,其中所述计算相似度的步骤包括以下步骤计算检索词和相似串之间的不同点;分析每个不同点所有可能的形成过程;为每个形成过程找到按键错误概率;以及合成所述按键错误概率以获得所述相似度。10.如权利要求9所述的方法,其中所述为每个形成过程找到按键错误概率的步骤包括从按键错误信息词典中对每个可能的形成过程检索按键错误概率,所述按键错误信息词典中存储了按键错误概率的条目。11.如权利要求10所述的方法,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。12.如权利要求10所述的方法,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。13.一种搜索引擎,用于根据客户设备的请求在第一数据库中检索数据,所述客户设备可控制地通过通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收在所述客户设备的键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。14.如权利要求13所述的搜索引擎,其中所述检索单元在所述第一数据库中搜索所述相似串。15.如权利要求13所述的搜索引擎,其中所述搜索引擎还包括用于存储预定的检索词的集合的第二数据库,并且所述检索单元在所述第二数据库中搜索所述相似串。16.如权利要求13、14和15中任一项所述的搜索引擎,其中所述检索单元还用于在所述第一数据库中搜索与所述检索词相匹配的条目。17.如权利要求13、14和15中任一项所述的搜索引擎,其中所述检索单元还用于在搜索所述相似串之前将所述检索词转换成语音表示。18.如权利要求13、14中任一项所述的搜索引擎,还包括按键错误信息词典,其包含按键错误的概率;以及错误概率计算单元,其可操作地耦合到所述按键错误信息词典,用于在搜索出多个相似串的情况下,利用所述按键错误的概率来计算相似度。19.如权利要求18所述的搜索引擎,其中所述校正结果包括预定数量的按照相似度排序的与所述多个相似串相关联的候选词。20.如权利要求18所述的搜索引擎,其中所述校正结果包括所述第一数据库中与具有最高相似度的相似串相匹配的条目。21.如权利要求18所述的搜索引擎,其中所述错误概率计算单元包括不同点计算单元,其耦合到所述检索单元,用于计算检索词和相似串之间的不同点;概率检索单元,其耦合到所述不同点计算单元和所述按键错误信息词典,用于分析每个不同点所有可能的形成过程,并从所述按键错误信息词典中检索每个可能的形成过程的按键错误概率;以及概率合成单元,其耦合到所述概率检索单元和所述搜索结果输出单元,用于合成所述按键错误概率以获得所述相似度。22.如权利要求18所述的搜索引擎,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。23.如权利要求18所述的搜索引擎,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。24.一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络;以及搜索引擎,其用于根据所述客户设备的请求在所述第一数据库中检索数据,所述客户设备可控制地通过所述通信网络连接到所述搜索引擎和第一数据库,所述搜索引擎包括检索词输入单元,其可操作地耦合到所述客户设备,用于接收所述用户在所述键盘上输入的检索词;检索单元,其可操作地耦合到所述第一数据库,用于从所述检索词输入单元接收所述检索词,并搜索与所述检索词相似的串;以及搜索结果输出单元,其可操作地耦合到所述检索单元和第一数据库,用于使用所述相似串,基于预定的标准形成校正结果,并将所述校正结果输出给所述客户设备。25.如权利要求24所述的搜索系统,其中所述检索单元在所述第一数据库中搜索所述相似串。26.如权利要求24所述的搜索系统,其中所述搜索系统还包括用于存储预定的检索词的集合的第二数据库,并且所述检索单元在所述第二数据库中搜索所述相似串。27.如权利要求24、25中任一项所述的搜索系统,其中所述搜索引擎还包括按键错误信息词典,其包含按键错误的概率;以及错误概率计算单元,其可操作地耦合到所述按键错误信息词典,用于在搜索出多个相似串的情况下,利用所述按键错误的概率来计算相似度。28.如权利要求27所述的搜索系统,其中所述错误概率计算单元包括不同点计算单元,其耦合到所述检索单元,用于计算检索词和相似串之间的不同点;概率检索单元,其耦合到所述不同点计算单元和所述按键错误信息词典,用于分析每个不同点所有可能的形成过程,并从所述按键错误信息词典中检索每个可能的形成过程的按键错误概率;以及概率合成单元,其耦合到所述概率检索单元和所述搜索结果输出单元,用于合成所述按键错误概率以获得所述相似度。29.如权利要求27所述的搜索系统,其中所述按键错误概率是基于所述键盘上键之间的几何距离来定义的。30.如权利要求27所述的搜索系统,其中所述按键错误概率是对搜索历史数据进行统计分析而得到的。31.一种搜索系统,用于在用户通过通信网络输入检索词时校正按键错误,包括客户设备,其具有由用户用来输入所述检索词的键盘;第一数据库,其可操作地连接到所述通信网络...
【专利技术属性】
技术研发人员:齐红威,赵凯,王亚波,刘晓炜,
申请(专利权)人:日电中国有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。