当前位置: 首页 > 专利查询>梁启华专利>正文

利用数字与字母对应关系实现中文信息快速检索的方法技术

技术编号:2865456 阅读:394 留言:0更新日期:2012-04-11 18:40
本发明专利技术是涉及一种文字信息检索方法,特别涉及一种利用数字键盘普遍使用的英文字母对应规则,以汉语拼音为依据,实现中文信息快速检索的方法。本发明专利技术公开了一种中文信息检索方法,用2、3、4、5、6、7、8、9分别表示ABC、DEF、GHI、JKL、MNO、PQRS、TUV、WXYZ八组拼音字母,中文检索只需要顺序输入汉字拼音第一个字母对应的数字代码,则检索出信息载体上相符的记录。本发明专利技术克服了现有检索方法中输入、挑选汉字慢的缺点,实施简单,能让产品的使用者以简单明了的操作,迅速检索中文资料,能广泛用于移动通信产品中。

【技术实现步骤摘要】

本专利技术是涉及一种文字信息检索方法,特别涉及一种利用数字键盘普遍使用的英文字母对应规则,以汉语拼音为依据,实现中文信息快速检索的方法。本专利技术属于IPC国际专利分类中的G06F 17/30。
技术介绍
个人通信产品(如手机、小灵通等)已相当普及,随着通信与计算机技术的日益融合,越来越多的信息可以通过这些产品检索。这些产品的存储空间越来越大,必须要有一种快速的检索方法才能使这些功能充分地发挥作用。目前中文检索大部分都只停留在输入完整的汉字后检索,高级一点的增加联想功能,而中文输入的特点又注定了使用者必须多次按键,并从屏幕显示的候选汉字中挑选,不仅输入速度慢,而且操作复杂。黄宏权的专利技术专利申请“一种文字信息数字码检索方法和使用该方法的数字键盘信息设备”(申请号01103295),公开了一种“英文检索仅输入字母对应的数字代码,汉字检索仅输入每一个汉字的第一和第二笔画对应的数字代码”的检索方法。不足之处是人们查找信息(特别是姓名)时往往先在脑里产生读音,具体是同音字中的哪一个汉字往往记不清;而且大部分字典都是偏旁、拼音查找的,以笔顺检索的极罕见,所以各人书写的笔顺难求一致、规范。陈爱军的专利技术专利申请“中英文电话簿中记录的检索方法”(申请号02115623),公开了一种“汉字检索仅输入每一个汉字拼音首字母”的检索方法。该法虽大大减少了按键次数、简化了操作,不足之处是仍然要选几次才能挑出对应的拼音字母,而且目光要在按键、屏幕间转换;该专利技术采用以忽略字符替代多音字位置的方法解决多音汉字的问题,此方法并不能完善地解决多音汉字的问题。
技术实现思路
本专利技术克服了现有检索方法中的缺点,提供了一种利用数字键盘普遍使用的拼音字母对应规则,以汉语拼音为依据的检索方法。该法减少了键盘输入的次数,有效减少了候选记录,实现对中文信息的快速检索。本专利技术的技术方案是(方法0)0.a、用2、3、4、5、6、7、8、9分别对应ABC、DEF、GHI、JKL、MNO、PQRS、TUV、WXYZ八组拼音字母;0.b、中文检索只需要顺序输入汉字第一个拼音字母对应的数字代码;0.c、系统按0.a的对应规则,检索出信息载体上符合检索要求的记录。对应每条记录的代码是否存储在载体内、如何生成代码,可以有如下的几种方法方法1.11.1.a、系统通过一套字符-数字转换程序,顺序地将记录中检索字段的字符转换成数字代码,与输入的数字代码序列的相应位置数字比较;若相同,则该字符与该数字匹配;1.1.b、若该字符是多音字,且相应发音的第一位拼音字母的数字代码不同,则从字符-数字转换程序获得不同的数字代码,其中一个与输入的数字代码序列的相应位置数字相同,则认为该字符与该数字匹配;1.1.c、若连续的字符都与对应输入的数字代码匹配,则该位置的字符串符合检索要求。方法1.21.2.a、系统通过一套字符-数字转换程序,自动地将记录中常用于检索的字段的字符转换、生成对应的数字串,并存在载体中,与相应记录建立对应关系; 1.2.b、若该常用检索的字段含有多音字,且相应发音的第一位拼音字母的数字代码不同,则从字符-数字转换程序获得相应的信息,并在保存在载体时作相应的标示;1.2.c、若数字串与输入的数字代码序列相同,或数字串前几位的子串与输入的数字代码序列相同,则认为该数字串与输入的数字代码序列相符;1.2.d、检索比较时,若载体内对应于记录中常用检索字段的数字串,与输入的数字代码序列相符,或将记录中多音字的数字代码替换该数字串对应位置后与输入的数字代码序列相符,则该记录符合检索要求。方法1.31.3.a、系统通过一套字符-拼音转换程序,自动地将记录中常用于检索的字段的字符转换、生成对应的第一位拼音字母串,并存在载体中,与相应记录建立对应关系;1.3.b、检索比较时,系统将记录的常用检索字段第一位拼音字母串,根据用2、3、4、5、6、7、8、9分别对应ABC、DEF、GHI、JKL、MNO、PQRS、TUV、WXYZ的原则,转换成相应的数字串,并与输入的数字代码序列比较,若相符,则该记录符合检索要求。若同时使用汉字拼音第一个字母检索方法(类似专利申请号02115623的检索方法),则可以考虑采用此方法。方法1.41.4.a、在以拼音输入、修改记录时,系统自动顺序地记录了常用于检索的字段中每一字符输入时的第一个数字代码,生成对应常用检索字段的数字串,存在载体中,与相应记录建立对应关系;1.4.b、检索比较时,若载体内对应于记录中常用检索字段的数字串,与输入的数字代码序列相符,则该记录符合检索要求。方法1.1、1.2所述的字符-数字转换程序的规则也可以采用不同的方法建立,转换程序按照这些规则把汉字转换成对应的数字。方法2.12.1.a、对于内码按拼音排序的那段汉字,系统有相应判定哪一段内码的汉字分别对应数字2至9的规则;2.1.b、对于不按拼音排序的那段汉字,系统内建立了一个“汉字数字列表”,按汉字内码的排列顺序,列出这些汉字最常用发音的第一位拼音字母对应的数字代码;2.1.c、对于第一位拼音字母的数字代码不同的多音汉字,系统内另建立了一个有汉字内码字段,以汉字内码为索引的“多音字-数字对应列表”,将多音汉字内码与该汉字非2.1.a或2.1.b读音中第一位拼音字母的数字代码一一对应。该方法是一种较优化的方法,不但提高检索速度,又能节省空间。方法2.22.2.a、系统内建立了一个有汉字内码字段,以汉字内码为索引的“汉字-数字对应全列表”,将汉字与该汉字所有第一位拼音字母的数字代码对应;2.2.b通过在该表检索汉字内码的位置,系统获得与汉字对应的所有数字代码。方法2.32.3.a、系统内建立了一个“汉字数字全列表”,按汉字内码的排列顺序,列出系统支持的所有汉字的所有第一位拼音字母对应的数字代码;2.3.b、另建立了一个“多音字指针列表”,指出了所有多音字在“汉字数字全列表”中第一个对应数字代码的位置,有汉字内码字段、位置指针字段,以汉字内码为索引;2.3.c、转换时,系统首先检索汉字内码在“多音字指针列表”的位置,如果出现在表里,通过该记录和下一个记录的内码、位置指针的值计算出该汉字数字代码数量,从“汉字数字全列表”对应该记录的位置指针处,连续获得与该汉字对应的所有数字;2.3.d、如果不出现在表里,则找出最接近该内码,且大于该内码值的记录,由字符内码,以及该“多音字指针列表”记录的汉字内码字段、位置指针字段,算出在“汉字数字全列表”中的位置,从该位置获得与字符对应的一个数字。方法2.4与方法2.3类似,2.4.a、系统内建立的“汉字数字全列表”,对有三个或三个以上数字与之对应的汉字,只收录该汉字最常使用读音对应的其中两个数字;根据1992年重排本的《新华字典》,只有“魄”、“单”、“矜”和“龟”四个汉字与三个数字对应,没有与三个以上数字对应的汉字;2.4.b、建立的“多音字指针列表”,与方法2.3.b相同;2.4.c、转换时,系统首先检索汉字内码在“多音字指针列表”的位置,如果出现在表里,则在“汉字数字全列表”对应的位置指针处及其随后的一个记录,获得与该汉字对应的两个数字;2.4.d、如果不出现在表里,获得该汉字对应数字的方法与方法2.3.d相同。方法3、本专利技术上述基础上,本文档来自技高网...

【技术保护点】
一种中文信息检索方法,用2、3、4、5、6、7、8、9分别对应ABC、DEF、GHI、JKL、MNO、PQRS、TUV、WXYZ八组拼音字母,其特征在于:a、中文检索只需要顺序输入汉字第一个拼音字母对应的数字代码;b、系统按 该对应规则,检索出信息载体上符合检索要求的记录。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁启华
申请(专利权)人:梁启华
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1