基于拼音的信息查询方法、系统和服务器技术方案

技术编号:8078933 阅读:227 留言:0更新日期:2012-12-13 21:44
本发明专利技术公开了一种基于拼音的信息查询方法、系统和服务器,涉及数据库技术领域。该查询方法包括:根据输入的拼音查询内存中的两层以上哈希索引结构获得候选项,两层以上哈希索引结构根据从数据库中读入内存的查询字段短语的拼音、主键构建,查询字段短语的拼音包括短语的全拼音、首字母或模糊拼音;基于对候选项的选择确定选中候选项的主键;根据选中候选项的主键从数据库获得查询信息。本发明专利技术的技术方案在统一框架下,支持中文、中文拼音、首字母、模糊音等多种查询方式,通过动态和静态结合的哈希索引结构,达到了效率提升与减少索引占用内存的效果;而通过携带短语主键以及其限制信息,减少了数据库后续查询时间,提高了整个应用效率。

【技术实现步骤摘要】

本专利技术涉及数据库
,特别涉及一种基于拼音的信息查询方法、系统和服务器
技术介绍
在信息系统查询中,通常需要输入一些信息或短语来进行检索。如在信息系统中要查询某个用户的个人资料,通常需要输入该用户的姓名;如要检索某个机构的信息,则需要输入该机构的名称。对于信息系统的人员查询界面,当要检索某机构的全部人员名单时, 通常有两种方式A、按照树形结构方式浏览机构列表,然后找到该机构;B、直接在输入框中输入机构名称,通过系统找到该机构。当机构较多时,A方式需要用户进行多次选择和查找,而B方式可以使用户较方便地查询到需要的机构。通常来说,B方式的信息系统查询,也有多种不同的实现方式,具体介绍如下。完整输入的查询部分信息系统需要完整输入所要求的短语字符。例如,要查询“李四”的人员情况,需要完整输入“李四”2个汉字。当用户需要频繁进行查询操作时,则输入量较大,不便于用户使用。基于提示的查询方法目前大多数信息系统都采用输入提示的方式来进行短语输入,即当用户输入部分汉字后,系统从后台数据库检索包含该部分汉字的所有待输入项,以列表形式返回给用户进行选择。如图I所示,当用户在输入框中输入“李”后,系统从后台数据表检索到“李四”、“李一”等汉字短语,返回给用户。输入提示部分解决了完整输入的输入量大问题,但是该方法也存在一些不足输入量仍然较大,对于大多数中文用户而言,多数使用拼音输入法进行汉字输入,即使键入汉字数量减少,但每个汉字仍然需要键入多个字母(汉字拼音);每次都从后台数据库进行汉字检索,效率较低,因为汉字所在字段往往不包含索引,且其检索语句往往使用“like (相似)”等匹配方式,数据库检索本身效率较低;每次改变输入均连接一次数据库,效率较低。基于拼音的查询方式目前部分信息系统米用基于拼音的输入提不的方式来加快短语查询,即允许用户输入拼音、拼音首字母来进行快速输入。如导航仪对地址的输入,机票网站、火车售票系统对地点的输入。基于数据库的拼音输入查询方式属于基于拼音的查询方式。基于数据库的拼音输入查询方式在数据库的数据表中保存查询字段的拼音,当用户输入拼音后,查询拼音字段符合输入拼音要求的相应查询字段的值,该方法由于每次需要检索数据库,效率较低,实现方式如图2所示,其中,由用户输入拼音LS (步骤21),页面提交到后台数据库进行查询(步骤22),数据库检索到拼音以LS开头的所有短语后,返回给前台页面(步骤23),前台页面将数据库返回信息构成为下拉框(步骤24),用户在下拉框中进行选择(步骤25),页面根据用户选择再去查询数据库(步骤26 —步骤27),并将结果返回前台页面(步骤28)。从图2中可知,最少两次访问数据库。如果用户输入的字母较长,则可能有更多次的访问。通常来说,数据库访问是比较慢的,效率较低。如何能够让用户更快速的查询到后台数据库中的中文短语,更快速的获取到该短语所在数据库记录的信息,是本领域需要解决的技术问题。
技术实现思路
本专利技术的专利技术人发现上述现有技术中存在问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。本专利技术的一个目的是提供一种用于基于拼音的信息查询的技术方案。根据本专利技术的第一方面,提供了一种基于拼音的信息查询方法,包括根据输入的拼音查询内存中的两层以上哈希索引结构获得候选项,所述两层以上哈希索引结构根据从数据库中读入内存的查询字段短语的拼音、主键构建,所述查询字段短语的拼音包括短语的全拼音、首字母或模糊拼音;基于对所述候选项的选择确定选中候选项的主键;根据所述选中候选项的主键从所述数据库获得查询信息。 可选地,该方法还包括从所述数据库读入内存的所述查询字段短语的限制值,所述候选项包括所述限制值。可选地,该方法还包括将所述查询字段短语和限制值、主键从所述数据库读入内存。可选地,两层以上哈希索引结构为静态索引结构和动态索引结构相结合的两层以上哈希索引结构。可选地,两层以上哈希索引结构的第一层索引结构为与26个字母对应的静态索引结构。可选地,该方法还包括用户输入的汉字转换为拼音。根据本专利技术的另一方面,提供一种服务器,包括候选项查询模块,用于根据输入的拼音查询内存中的两层以上哈希索引结构获得候选项,所述两层以上哈希索引结构根据从数据库中读入内存的查询字段短语的拼音、主键构建,所述短语的拼音包括短语的全拼音、首字母或模糊拼音;主键确定模块,用于基于对候选项的选择确定选中候选项的主键;查询信息获取模块,用于根据所述选中候选项的主键从所述数据库获得查询信息。可选地,该服务器还包括索引建立模块,用于从所述数据库将所述查询字段短语、主键读入内存,根据从所述数据库中读入内存的查询字段短语的拼音、主键构建所述两层以上哈希索引结构。可选地,数据库读取模块还用于从所述数据库读入所述查询字段短语的限制值,所述候选项包括所述限制值。可选地,两层以上哈希索引结构为静态索引结构和动态索引结构相结合的两层以上哈希索引结构。可选地,两层以上哈希索引结构的第一层索引结构为与26个字母对应的静态索引结构。可选地,该服务器还包括拼音转换模块,用于将用户输入的汉字转换为拼音,发送给所述候选项查询模块。根据本专利技术的又一方面,还提供一种基于拼音的信息查询系统,包括上述的服务器,以及数据库。本专利技术的一个优点在于,能够让用户更快速的查询到后台数据库中的中文短语,更快速的获取到该短语所在数据库记录的信息。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明构成说明书的一部分的附图描述了本专利技术的实施例,并且连同说明书一起用于解释本专利技术的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本专利技术,其中图I示出基于提示的查询方法的示意图。图2示出基于数据库的拼音输入查询方式的过程示意图。 图3A示出两层以上哈希索引结构的示例。图3B示出静态与动态哈希索引结构的示例。图4示出本专利技术的基于拼音的信息查询方法的一个实施例的流程图。图5示出本专利技术的基于拼音的信息查询方法的一个实施例的流程图。图6示出本专利技术的基于拼音的信息查询方法的一个实施例的流程图。图7示出一个双层哈希索引的示例。图8示出本专利技术的基于拼音的信息查询方法的一个应用例的示意图。图9示出本专利技术的服务器的一个实施例的结构图。图10示出出本专利技术的服务器的另一个实施例的结构图。具体实施例方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。相关术语解释全拼、拼音首字母、模本文档来自技高网
...

【技术保护点】
一种基于拼音的信息查询方法,其特征在于,包括:根据输入的拼音查询内存中的两层以上哈希索引结构获得候选项,所述两层以上哈希索引结构根据从数据库中读入内存的查询字段短语的拼音、主键构建,所述查询字段短语的拼音包括短语的全拼音、首字母或模糊拼音;基于对所述候选项的选择确定选中候选项的主键;根据所述选中候选项的主键从所述数据库获得查询信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭会孙志伟刘宇鉴王强孙建平蔡钊许国平王小强方志赵瑞孙伟孟曦关博王珂李湘宜
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1