当前位置: 首页 > 专利查询>麦广树专利>正文

一种汉字输入编码方法技术

技术编号:2886830 阅读:184 留言:0更新日期:2012-04-11 18:40
一种汉字输入编码方法,适合于移动电话、中文传呼机和电子记事簿作为汉字输入,其特征在于将汉字分解为基本字元“一”,“丨”,“丿”,“丶”,“乙”,或增加辅助字元“艹”,“木”,“氵”,“扌”,“口”,在输入过程中只需选择部首的头末字元和字体的前二字元和末二字元或选择部首的头末字元和字体的前三字元和末字元即可。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一涉及。目前计算机汉字输入编码方法很多,但是针对小键盘如移动电话、传呼机、电子记事簿等产品的编码方法较少。虽然目前也有一些针对小键盘产品的汉字输入编码方案,如五笔划输入方法,但因其取码规定是取前四笔和末笔,所以对部首为“钅”,“木”,“火”,“扌”,“贝”等的汉字来说重码率必然高。另外还有一些编码方法是把汉字分为部件结构后对部件取码,缺点是对部件的划分规则复杂,不同的人有不同的划分方法,而将部分笔画数多的汉字也划分在笔划数少的编码组中,造成笔划数较少的汉字重码率太高。以上汉字编码方法的缺点限制了汉字信息技术在移动电话和传呼机上的应用。本专利技术的目的就是为移动电话、中文传呼机等小键盘产品提供一种输入方法简单,重码率低的汉字输入编码方法。它只需按正常的汉字边旁部首分类结合五个或者十个以下的字元即可。本专利技术是根据汉字的结构特点将部首与字体分开编码,部首的划分以《新华字典》上的边旁部首为划分原则,对少数难以区分部首的汉字作为单体字处理,从而降低了重码率,同时也简化了取码规则。根据对汉字部首以外的字体的取码规则不同,本专利技术分为以下两种方案1、,其特征在于A、将组成汉字的的基本字元分为“横”,“竖”,“撇”,“捺”,“折”, 分别用符号“一”,“丨”,“丿”,“乙”表示,并将各字元分别定义在键盘相应的键位上;B、按书写顺序取汉字部首的第一字元和末字元为部首的编码,对只有一个字元的部首只取该字元即为该部首的编码;部首以外部分按书写顺序取第一字元、第二字元、倒数第二字元和末字元组成其编码,不足四个字元的取其全部字元为其编码;部首编码和部首以外部分的编码按整个汉字的书写顺序组合在一起成为该汉字的编码;对不能明确部首的汉字按书写顺序取前五个字元和末字元组成该汉字的编码,不足六个字元的汉字取其全部字元作为其编码。2、,其特征在于A、将组成汉字的的基本字元分为“横”,“竖”,“撇”,“捺”,“折”, 分别用符号“一”,“丨”,“丿”,“”,“乙”表示,并将各字元分别定义在键盘相应的键位上;B、按书写顺序取汉字部首的第一字元和末字元为部首的编码,对只有一个字元的部首只取该字元即为该部首的编码;部首以外部分按书写顺序取第一字元、第二字元、第三字元和末字元组成其编码,不足四个字元的取其全部字元为其编码;部首编码和部首以外部分的编码按整个汉字的书写顺序组合在一起成为该汉字的编码;对不能明确部首的汉字按书写顺序取前五个字元和末字元组成该汉字的编码,不足六个字元的汉字取其全部字元作为其编码。以上两个方案大同小异,只是在汉字的部首以外部分有一个字元的取码位置不同,一般来说第1种方案较为容易操作。在不特别说明的情况下下边所述的例子均采用第一种方案。例如“中”和“钱”两个字如按第一种方案编码则它们的编码分别是“1-1”和“丿乙一一 ”;如按第二方案则分别是“1-1”和“丿乙一一乙”。以上四个编码的前两码都是对应汉字的部首的首尾字元。根据汉字中部首分别为“艹”、“木”、“氵”、“扌”、“口”的字较多的特点,可以将这些部首作为辅助字元,并分别定义在键盘上,汉字编码的时候,基本字元与辅助字元一起用来对汉字进行编码,并优先选用辅助字元,如“呆”字的编码为“口木”,“花”字的编码为“艹丿丨丿乙”。对辅助字元还可以扩展使用,如将部首“”和“艹”归入“艹”内,将“木”归入“木”内,将“八”,“>”,“<”,“丷”,“灬”归入“氵”,将“手”归入“扌”,将“口”归入“口”。本专利技术考虑到由于汉字数量太多,不可能将全部汉字都收入字库,所以取汉字编码中特定序位上的若干字元作为该编码组的假字,假字储存在字库中,用来表示找不到的汉字。假字的字元选择有以下三种方法1、取该汉字或该汉字编码组的第一个字元和末字元组成为该汉字或该汉字编码组的假字,如“容”字的假字是“一”。2、取该汉字或该汉字编码组的第一个字元和第二字元组成为该汉字或该汉字编码组的假字,如“容”字的假字是“丿”。3、取该汉字或该汉字编码组的第一个字元成为该汉字或该汉字编码组的假字,如“容”字的假字是“”。而假字的字体由其字元组成,各字元可以单独占有一个字的空间,也可以上下或左右地排列在同一个字的空间内,如“容”字的假字可表示为“一”或 ”或“-”。假字的提出是因为GB2312-80中收入的6763个汉字中,如果用在移动电话中的中文电子电话簿功能上,则有很多人名的汉字没有,如“朱镕基”的“钅容”字。有了假字以后就可以用假字代替真字,如用“朱丿一基”代替“朱镕基”。作为用户,他的朋友和客户是有限的,所以假字的出现不会造成太大的混乱,而且还可以降低字库的容量。对于带辅助字元的假字可以将辅助字元用基本字元分解后再取真假字,使假字只由基本字元组成,如“只”字的假字“口”可以取为真假字|“丨”。附图是本专利技术方案中的汉字基本字元和辅助字元定义在移动电话键盘上的实施例。权利要求1.,其特征在于A、将组成汉字的的基本字元分为“横”,“竖”,“撇”,“捺”,“折”,分别用符号“一”,“丨”,“丿”,”,“乙”表示,并将各字元分别定义在键盘相应的键位上;B、按书写顺序取汉字部首的第一字元和末字元为部首的编码,对只有一个字元的部首只取该字元即为该部首的编码;部首以外部分按书写顺序取第一字元、第二字元、倒数第二字元和末字元组成其编码,不足四个字元的取其全部字元为其编码;部首编码和部首以外部分的编码按整个汉字的书写顺序组合在一起成为该汉字的编码;对不能明确部首的汉字按书写顺序取前五个字元和末字元组成该汉字的编码,不足六个字元的汉字取其全部字元作为其编码。2.,其特征在于A、将组成汉字的的基本字元分为“横”,“竖”,“撇”,“捺”,“折”, 分别用符号“一”,“丨”,“丿”,“”,“乙”表示,并将各字元分别定义在键盘相应的键位上;B、按书写顺序取汉字部首的第一字元和末字元为部首的编码,对只有一的部首只取该字元即为该部首的编码;部首以外部分按书写顺序取第一字元、第二字元、第三字元和末字元组成其编码,不足四个字元的取其全部字元为其编码;部首编码和部首以外部分的编码按整个汉字的书写顺序组合在一起成为该汉字的编码;对不能明确部首的汉字按书写顺序取前五个字元和末字元组成该汉字的编码,不足六个字元的汉字取其全部字元作为其编码。3.根据权利要求1所述的汉字输入编码方法,其特征还在于将汉字部首“艹”,“木”,“氵”,“扌”,“口”作为辅助字元与基本字元一起用于对汉字进行编码,并且优先选用辅助字元,辅助字元定义在键盘上基本字元键位以外的键位上。4.根据权利要求2所述的汉字输入编码方法,其特征还在于将汉字部首“艹”,“木”,“氵”,“扌”,“口”作为辅助字元与基本字元一起用于对汉字进行编码,并且优先选用辅助字元,辅助字元定义在键盘上基本字元键位以外的键位上。5.根据权利要求1和3所述的辅助字元“艹”包括“”“艹”;“木”包括“木”;“氵”包括“”,“八”,“灬”;“扌”包括“手”;“口包括“口”。6.根据权利要求1和4所述的辅助字元“艹”包括“”“艹”;“木”包括“木”;“氵”包括“”,“八”,“灬”;“扌”包括“手”“口包括“口”。7.根据权利要求1所述的汉字输入编码方法,其特征在本文档来自技高网...

【技术保护点】
一种汉字输入编码方法,其特征在于:A、将组成汉字的的基本字元分为“横”,“竖”,“撇”,“捺”,“折”,分别用符号“一”,“丨”,“/”,“\”,“乙”表示,并将各字元分别定义在键盘相应的键位上;B、按书写顺序取汉字部首的第一字元和 末字元为部首的编码,对只有一个字元的部首只取该字元即为该部首的编码;部首以外部分按书写顺序取第一字元、第二字元、倒数第二字元和末字元组成其编码,不足四个字元的取其全部字元为其编码;部首编码和部首以外部分的编码按整个汉字的书写顺序组合在一起成为该汉字的编码;对不能明确部首的汉字按书写顺序取前五个字元和末字元组成该汉字的编码,不足六个字元的汉字取其全部字元作为其编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:麦广树
申请(专利权)人:麦广树
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1