汉字编码方法及其所用键盘技术

技术编号:2893982 阅读:206 留言:0更新日期:2012-04-11 18:40
一种汉字编码方法及其键盘,对选取的132个字元分组,使其分别对应于26个字母键,每个字元被赋予一个字母,每个汉字被赋予一至四个字母,这些字母依次对应于按书写顺序和大元优先准则从该汉字中所能提取到的第一、二、三、尾字元,从而简化了规则,加快了输入速度,此外,采用造字压缩法,解决了字元完全刻于键帽上的拥挤问题.(*该技术在2005年保护过期,可自由使用*)

【技术实现步骤摘要】
本专利技术涉及一种汉字编码方法及其所用键盘,能简便地把汉字输入计算机及其它类似设备。为把汉字输入计算机,最早是采用汉字整字输入大键盘,使汉字无需编码即可输入。但大键盘造价高、输入慢、与大多数计算机用的键盘不一致。接着,汉字编码输入的方法和设备被研制出来,汉字编码方法可分四类拼音类、音形结合类、笔划拼形类和字元拼形类。前两类,如英国专利GB2121220、GB2125197,在输入不认识的汉字时不方便。后两类有效地解决了这个问题。笔划拼形编码法,如英国专利GB2100899、GB2071018,主要地把单笔划作为字元,字元少,学成较快,然而却存在汉字平均击键次数高,输入速度慢,汉字拆分太细,容易出错的问题。字元拼形编码法,如王安三角编码法,苍吉编码法、五笔字形编码法,通过把常用偏旁部首和笔划组合选作字元,克服了笔划拼形法的缺点,使平均击键次数减小,输入速度提高。但存在着字元多(一般在200个左右),字元归并情况较难记忆,字元提取顺序违反或不完全符合书写习惯,涉及的概念复杂,编码时必须遵循的规则多,规则间逻辑关系复杂的问题,因而学成较慢,非专职人员不易掌握。另外字元多,导致无法全部刻于键帽上,给操作和记忆带来不便。本专利技术的目的是提供一种输入速度快的易学易记易用的汉字编码方法及其键盘,使汉字输入与英文输入尽可能相似,使人们写字时不关心、不涉及、不过问的东西在编码输入汉字时也尽可能不关心、不涉及、不过问。按照本专利技术,大约132个笔划、笔划组合、偏旁部首被选为字元;经计算机优化算法处理,这些字元被归并为26组;每个字元被赋予一个字母,同组字元被赋予相同字母;每个汉字被赋予一个由一至四个字母组成的字母串;字母串中的字母依次对应于按书写顺序和大元优先准则从该汉字中所能提取得到的第一、二、三、尾字元;每组字元被对应到键盘上的一个字母键;而且,采用造字压缩法把每组字元组配成一个酷似真正汉字的生造汉字;每个生造汉字被赋予一个读者,这个读音与一个被称为该生造汉字的读音字的真正汉字所具的读音相同或相近,每个读音字既与其对应的生造汉字形状尽可能相似,又与组成该生造汉字的字元所对应的键的键名字母有某种简明的联系,比如读音字的拼音的第一字母与所说键名字母相同或相近。本专利技术的详细说明将结合下列附图进行。图1为实施本专利技术提供的编码方法的实例。图2示出了本专利技术使用的132个字元、它们的归并分组情况、每组字元与英文字母和生造汉字的对应关系、每个生造汉字的读音和相应的读音字、与每个字母对应的高频字(其中有24个高频简码字)。图3示出了26个生造汉字与键的对应关系。按照本专利技术,132个笔划、笔划组合和偏旁部首被选为字元,经计算机优化算法处理归并成26组,每组字元又分别与26个字母之一相对应,从而与键盘的26个字母键之一相对应,每个汉字被赋予一个长度不少于1不超过4的字母串。在对汉字编码过程中,一律遵循按书写顺序和大元优先准则,取其第一、二、三、尾字元的简单规则。所谓大元优先,就是对笔划数为1的汉字直接取整字作字元;对笔划数多于1的汉字,每次提取字元时应提取小于整字的最大可能字元。例如,“一”、“十”、“土”、“寸”都是字元,“寺”字应分解成“土、寸”,不能是“十、一、寸”;“土”字应分解成“十、一”不能是“土”。按照本专利技术,任何一个汉字所对应的字母串中的第一字母,对应于在该汉字中按书写顺序和大元优先准则提取得到的第一字元;当该汉字尚有剩余笔划未曾提取时,字母串中具有第二字母,并对应于在该剩余部份中按书写顺序和大元优先准则提取得到的第一字元,即整字的第二字元;当该汉字尚有剩余笔划未曾提取时,字母串中具有第三字母,并对应于在该剩余部份中按书写顺序和大元优先准则提取得到的第一字元,即整字的第三字元;当该汉字尚有剩余笔划未曾提取时,字母串中具有第四字母,并对应于在该剩余部份中按书写顺序和大元优先准则提取得到的最末一个字元,即整字的最末一个字元。几个编码实例示于图1。实际输入汉字时,计算机中专司控制和接受汉字输入的程序一般要求操作员在每个汉字的字母串输入完毕之后敲入一个“代码结束”键,通常是空格键。因此处最大代码长度为4,为节省计,也可把上述程序改写成只要求不足4码时才敲入一个“代码结束”键。几个汉字的输入按键实例示于图1,图中符号“b”代表空格键。对实际书写顺序有多种可能的少数汉字,可让计算机程序安排容错码,使按任一习惯顺序拆分输入均能得到同一汉字。笔划是组成汉字的基本单位,共二十多种。但多数种类的笔划在构成汉字时使用甚少,形状又相似,在本专利技术中不再区别下列三组笔划,每组作一种笔划看待。第一组乚. 第二组. 乛.亅. 第三组乙.. 。第一组的特点是反时针旋转,第二组是最后一个弯曲顺时针旋转,第三组是先顺时针后反时针旋转。三组笔划分别由“乚”、“”、“乙”作为代表。于是组成汉字的笔划只有九种一.丨.亅.丿.丶. .乚.乙,都被本编码方法选为字元。在众多笔划组合和传统偏旁部首中选择字元,除要求其实用频度高,区别力强外,还要限制大型字元总数。否则,汉字平均代码长度减小,在只有26个键位的情况下,易导致归并困难。因此在本方法中,例如舟、革、马、鸟、心、戈、歹、 等未被选为字元,代替它们中选的却是下列笔划组合 尽管这样有意适当化小字元以增加平均代码长度,但输入速度仍然很高。本专利技术所选字元示于图2。图中未加括弧的叫基本字元,其后括弧中的叫该字元的联想字元,二者形态相似,便于联想记忆。字元多于键元的情况,首先要求132个字元必须归并成26组。本专利技术借助计算机,采用高效字元归并优化算法进行处理,在众多可能的归并方法中获得了重码率接近最小值的字元归并结果,示于图2。在最常用的7000来个汉字范围内,在仅采用24个高频简码字后,图2的归并方式导致的重码实用概率总和只有0.247%。增加使用简码和词汇码将进一步降低平均击键次数和重码率。重码字的实际输入可采用显示,报警、选字的传统方法解决。其次,要求26组字元合理分配到26个字母键。本专利技术提供的汉字输入键盘,按下列标准设计字元的分配1、三排字母键的负荷按中、上、下递减;2、右手总负荷略大于左手总负荷;3、食指、中指、无名指、小指负荷依次递减;4、同手连击尽量少;5、同指越排连击尽量少;6、同指连击尽量少。7、无名指和小指连击尽量少。本专利技术提供的键盘至少包括26个字母键和一个空格键,它们在键盘上的相对位置与标准英文键盘相同。26组字元与字母键的对应示于图2。应该指出,本专利技术不仅仅局限于上述的字元选取和上述的字元分组,如果以本专利技术的思想对上述实施例加以变更(例如多选或少选若干字元,分组形式作些改动等),当然也可得到很好的效果。在采用小键盘编码输入汉字时,会遇到的困难是对应于同一字母键的若干字元不能全部清楚地刻于键帽上,一般约有50个刻不上去,给操作和记忆带来不便。本专利技术提供的造字压缩法有效地解决了这个问题。它把对应于同一个字母键的所有基本字元和尽量多的联想字元进行适当组配,构成一个十分紧凑酷似真正汉字的生造汉字。把一个生造汉字刻于一个键帽上却是容易作的。本专利技术中各组字元构成的26个生造汉字与键的对应关系见图3。未被这26个生造汉字包含的字元只有约9个联想字元。为便于使用,造字压缩法还可给每个生造汉字赋予一个本文档来自技高网...

【技术保护点】
一种汉字编码方法,其内容包括挑选一部份笔划、笔划组合及偏旁部首作为组成汉字的基本单位即字元,每个字元被赋予一个字母,每个汉字被赋予一个由一至四个字母组成的字母串,其特征在于:对任一汉字,其字母串中的字母一律依次对应于按书写顺序和大元优先准则从该汉字中能够提取得到的第一、二、三、尾字元。

【技术特征摘要】
1.一种汉字编码方法,其内容包括挑选一部份笔划、笔划组合及偏旁部首作为组成汉字的基本单位即字元,每个字元被赋予一个字母,每个汉字被赋予一个由一至四个字母组成的字母串,其特征在于对任一汉字,其字母串中的字母一律依次对应于按书写顺序和大元优先准则从该汉字中能够提取得到的第一、二、三、尾字元。2.一批由笔划,笔划组合及偏旁部首组成的字元,其特征在于字元“大广(匚凵)”被归并到一组;字元“山日”被归为一组;字元“厶(厶)艹(廿)乙”被归并到一组;字元“宀丨夕”被归并到一组;字元“口”被归并到一组;字元“王亠(丄)刂”被归并到一组;字元“米四(罒)冫()”被归并到一组;字元“人(亻)”被归并到一组;字元“扌(手)丶()”被归并到一组;字元“彳勹彐(勹)寸儿”被归并到一组;字元“疒一()”被归并到一组;字元“禾又丿”被归并到一组;字元“阝(卩)尸”被归并到一组;字元“纟子乂”被归并到一组;字元“夂贝乚”被归并到一组;字元“(厂)土(士)”被归并到一组;字元“讠弓爫十()”被归并到一组;字元“火(灬)二刀”被归并到一组;字元“忄西()匕()”被归并到一组;字元“三木”被归并到一组;字元“氵八(丷)亅力”被归并到一组;字元“雨车九目(冂)”被归并到一组;字元“虫小()门廴”被归并到一组;字元“钅耳止()”被归并到一组;字元“月()丆用(用)儿”被归并到一组;字元“女田”被归并到一组;3.根据权项2的字元,其特征在于所说的字元进一步包括下列笔划组合;并且与“山日”归并为同一组;与“女田”归并为同一组;与“三木”归并为同一组;与“雨车九目(冂)”归并为同一组;与“忄西()匕()”归并为同一组;与“禾又丿”归并为同一组;与“米四(罒)冫()”归并为同一组。4.一种实现汉字编码方法的输入键盘,至少包括26个字母键和一个空格键,它们的相对位置与标准英文键盘相同,其特征在于字元“大广(匚凵)”对应于一个字母键;字元“山日”对应于一个字母键;字元“厶()艹(廿)乙”对应于一个字母键;字元“宀丨夕”对应于一个字母键;字元“口”对应于一个字母键;字元“王亠(丄)刂”对应于一个字母键;字元“米四(罒)冫()”对应于一个字母键;字元“人(亻)”对应于一个字母键;字元“扌(手)丶()”对应于一个字母键;字元“彳勹彐()寸儿”对应于一个字母键;字元“疒一()”对应于一个字母键;字元“禾又丿”对应于一个字母键;字元“阝(卩)尸”对应于一个字母键;字元“纟子乂”对应于一个字母键;字元“夂贝乚”对应于一个字母键;字元“(厂)土(士)”对应于一个字母键;字元“讠弓爫十()”对应于一个字母键;字元“火(灬)二刀”对应于一个字母键;字元“忄()西()匕()”对应于一个字母键;字元“三木”对应于一个字母键;字元“氵八(丷)亅力”对应于一个字母键;字元“雨车九目(冂)”对应于一个字母键;字元“虫小()门廴”对应于一个字母键;字元“钅耳止()”对应于一个字母键;字元“月()丆用()儿”对应于一个字母键;字元“女田”对应于一个字母键;5.根据权项4的键盘,其特征在于所说键盘为标准英文...

【专利技术属性】
技术研发人员:陈代于彭学文刘华明谭春莲王玉华
申请(专利权)人:四川省计划经济委员会电子计算中心
类型:发明
国别省市:51[中国|四川]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1