当前位置: 首页 > 专利查询>王治阳专利>正文

26键输入法制造技术

技术编号:2829890 阅读:1676 留言:1更新日期:2012-04-11 18:40
本发明专利技术26键输入法属于计算机汉字编码输入法,在将汉字各种笔画按国家语委的规定归类为横、竖、撇、点、折后,精选了100来个组字频率高的基本部件,将它们按起笔归类到横、竖、撇、点、折五个区中;再根据每个区中基本部件的组字频率的高低,经测算,起笔为横、点、竖基本部件各得六个键位,起笔为撇的汉字分得五个键位,折起笔的基本部件安排三个键位;按点、横、竖、撇、折的次序分区从左到右依次以每两列为界排列,再将汉字拆分成基本部件进行编码。

【技术实现步骤摘要】

本专利技术属于电脑汉字编码输入方法,也就是中文输入法。它利用 了 26个字母键输入汉字,因此称为26键输入法
技术介绍
键盘输入是目前汉字输入法中使用最广泛的输入法。可分为音 码、形码、音形码和序号码四类输入汉字。序号码难以记忆,已几乎 无人使用。利用音码输入汉字,因为简单易学,使用最为广泛。可输 入速度不快,还有个弱点,那就是不认识的汉字无法输入。为此,本 人专利技术了三五音码输入法,它蠲于音形码,比音码稍微复杂点,但因 为重码少,输入速度却要迅速得多,足以与任何输入法相比。缺点是 发音不准的汉字不能很快输入。形码虽然复杂难记,却能输入任何不 认识的汉字,而且往往很快。形码往往将汉字部件按象形、拼音和笔 画等方式归类编码,由于笔画是有史以来最伟大的专利技术之一,罔此按 第画归类的输入法要胜过按拼音和象形归类的输入法,往往较为流 行。五笔字型是其典型代表,其佈点是重码少,输入速度饩。佴该输 入法仅仅利用25个字母键输入輝宇,还无视各汉字部件的組宁频率 高低不一,硬将汉字部件按起笔分为五区五位,给组字频率捐当低的 折开头的汉字部件也分了五个位、而组字频率相当高的起笔为横、竖、 点的汉字部件也只分得了五位,此举浪费了个把键位,又造成了一定 的重码。为l^^^重码,五笔字型不得不将起笔为横的汉字部件中的净 并入到撇区中,将起笔为点的十和'£#入到折区中。这完全是不能接 受的,因为t 、十和心的实际组字频率已远远高于排在同一律上的其 它部件的组字频率之和,使得排净、+和心的键实际上应算作横区和 点区,可五笔字型硬把它归入到撇区和折区。车、九、几等汉字部件的归类也不符合按区划分的规律。五笔字型将每区又按第二笔分 为横、竖、撇、捺、折五位更是有点牵强,以竖区为例,第二笔通常 是折,按理应集中安排在竖折这个区位键上,这会带来严重的重码,因此不得不分散排列在各个键上。25个键名部件中竟有10来个部件 不符合所谓的区位排列规律,这样的规律实际上已不能算规律。还有, 86版五笔字型只用了25个键,白白浪费一个字母键,若能充分利用 26个键的话,则一、二、三级简码会更多,输入速度也会有所提高, 也就是说应该还有比五笔字型更快的汉字输入法。另外86版五笔字 型还存在着若干汉字部件不符合语言文字规范、数量过多、拆分不便 等问题。98版五笔字型虽然拆分时方便些,但汉字部件更多,技术 上实为倒退。郑码对此有所改进,充分利用了26键,部件符合规范, 按起笔分区时考虑了汉字的组字频率,较为合理,可也存在着横区多 了点、竖区少了点的缺点,更糟糕的是它将汉字分为主根、副根,除 了第一主根外,其他第二主根、包根、杂根等汉字部件均用两个字母 作为代号编码,尽管这有利于降低重码,可取码规则相当繁杂,另外 选取的汉字部件也较多,难学难记,拆分也较困难。为减少汉字部件, 目前不少输入法都通过五种基本笔画两两组合的办法,进行编码。这 种方法实际上是受五笔字型的影响,同样没有充分考虑到汉字笔画特 别是双笔画的组字频率相差悬殊的情况,排列到键盘上后同样表面显 得整齐划一,实际上各字母键冷热不均,容易产生重码,另外还存在 着不够直观,影响打字速度等问题。
技术实现思路
这样,目前形码输入法要么汉字部件过多或不规范、分区不合理, 要么拆分困难,不够直观、影响思维,要么没能充分利用26个键, 都没能做到较为方便快速地输入汉字。本专利技术的目的是提供一种汉字部件比较规范、分区合理,拆分简便直观的,输入汉字快速的计算机汉字输入法即26键输入法。为达到26键输入法的目的,本专利技术在将汉字各种笔画按国家语 委的规定归类横、竖、撇、点、折后,又从《信息处理用GB13000.1 字符集汉字部件规范》精选了 100来个组字频率高的汉字部件,这些 精选的汉字部件还可包含若干个组字频率并不高,但属于同类的汉字 部件,通称为基本部件。将它们按起笔归类到横、竖、撇、点、折五 个区中。再根据每个区中基本部件的组字频率的高低来决定每个区包 含的键位多少,经科学测算,起笔为横、点、竖的基本部件组字频率 较高、数量也较多,各得六个键位,起笔为撇的汉字频率次之,分得 五个键位,折起笔的基本部件频率最低,仅安排三个键位。各个基本 部件在字母键上的分布见附图1,该图在标准键盘上以二列为一区, 将点区、横区、竖区、撇区、折区从左到右以两列为界依次排列,极 具规律性,是本人十余年潜心研究的结果,是本专利技术的最大创造性所 在。根据以两列为界的将基本部件按起笔分区排列的方法,点区占两 列字母键,得六个字母键;横区占两列字母键,得六个字母键,竖区 占两列字母键,得六个字母键,撇区虽占五个字母键,却也只得两列, 折区仅占三个字母键,却也得两列,从而达到了点、横、竖、撇、折 各区组字频率不同,所占的字母键位数也因而不同,却都占两列的巧 妙目的。这比将汉字部件五区五列排列的输入法来,无疑更有规律, 是一种巨大进步。当然,由于竖区和撇区汉字部件的组字频率相近, 也可规定作竖区占五个字母键位,撇区占六个字母键位。另外还可将 点区、横区、竖区在键盘上的位置互换。这些都是对本专利技术的变形, 还是以本专利技术所举的实施例为最佳。另外本专利技术将点、横、竖、撇、 折五种基本笔画分别排在Q、 E、 T、 U、 O键上,用相应的字母编码,由于都位于上排,且仅隔一个字母键,也显得极有规律,简单易学。 接着编码,本身就是一个基本部件的汉字的编码规则是成字基本部件的代码+首笔画代码+次笔画代码+末笔画代码,基本部件不足三笔,按书写顺序取完所有的笔画的代码为止。由多个基本部件组成的汉字的编码规则是按书写顺序将该汉字拆分成基本部件,选取第一、二、三及最末一个基本部件,并用相应 的代码进行编码,不足四个基本部件时,按书写顺序选取所有部件的 代码为止。单字取码规则都要遵循取大优先原则,即要优先按笔画数多的基 本部件编码,应保证按书写顺序每次拆分出尽可能笔画数尽可能多的 基本部件,不要把笔画多的部件拆分成笔画少的部件。根据这一规则 可引申出一条规则,那就是多笔画部件肯定比单笔画部件即五种基本 笔画优先编码。另外还要兼顾直观,避免把四边封闭的方框形如口 、西等基本部件按书写顺序拆开编码,这条规则实际上也是取大优 先原则引申出来的。在拆分汉字时有个非常让人头疼的情况,那就是遇到几个笔画相 交的基本部件时如何拆分,这时不同的输入法往往有多种拆分方法。 本人经过长达十余年的潜心研究,终于成功解决了这一举世难题。为 方便汉字拆分,特别规定按书写顺序与前二笔及以上的笔画相交的后 写笔画必须单独取出,按单个笔画编码,基本部件例外。例如虫、甲、车等基本部件在汉字中往往不与其它笔画相交,因此从取 大优先的原则出发,不宜将主、甲、车等基本部件中的竖笔 单独取出编码。有些汉字,它们包含的基本部件相同,只是基本部件的位置不同, 为区分这些汉字的编码,使其不发生重码,必须增加字型信息,用区分码加以区分。汉字的字型可分为独体型和合体型二类,合体型约占汉字的96%,它又可分为左右型、上下型、包围型。在本输入法中, 将独体型和包围型合并为杂合型,在编码中,左右型、上下型和杂合 型这三类字型分别用三个互不相同的标点符号如,、.、/编 码。对于只有两个或三个基本部件组成的汉字,编码时可补上本文档来自技高网
...

【技术保护点】
一种26键计算机汉字输入法,在将汉字各种笔画按国家语委的规定归类为横、竖、撇、点、折后,其特征是:精选了100来个组字频率高的汉字部件,作为基本部件,将它们按起笔归类到横、竖、撇、点、折五个区中;再根据每个区中基本部件的组字频率的高低来决定每个区包含的键位多少,经测算,起笔为横、点、竖的基本部件各得六个键位,起笔为撇的汉字频率次之,分得五个键位,折起笔的基本部件频率最低,仅安排三个键位;按点、横、竖、撇、折的次序分区从左到右依次以每两列为界排列;点区中的丶、亠、言、讠、广、文、方等部件排在Q键上,用Q作代码;立、门、疒、丷、*、冫等部件排在A键上,用A作代码;氵、水、氺等排在Z键上,用Z作代码;火和灬等部件排在W上,用W作代码;忄、心、等部件排在S上,用S作代码;冖、宀、辶、礻、衤等部件排在X上,用X作代码;王、一、雨、等部件排在E上,用E作代码;土、二、干、十等部件排在D上,用D作代码;厂、三、大、车、石、丆、等部件排在C上,用C作代码;扌、寸、豕等部件排在R上,用R作代码;木、西等部件排在放F上,用F作代码;工、戈、七、艹、廾等部件排在V上,用V作代码;止、*、虫、丨等部件排在T上,用T作代码;日、甲、刂、リ等部件排在G上,用G作代码;田、山、*等部件排在G上,用G作代码;目、囗、小、等部件排在Y上,用Y作代码;口等部件排在H上,用H作代码;贝、冂、四、罒、皿等部件排在N上,用N作代码;禾、竹、、攵、夂、、丿等部件排在U上,用U作代码;亻、人,乂,等部件排在J上,用J作代码;八、钅、金、彡等部件排在M上,用M作代码;月、儿、川、匕、*、*、爫等部件排在I上,用I作代码;勹、、几、鸟、*、舟、犭等部件排在K上,用K作代码;乙、马、耳、尸、巳、了、阝等部件排在0上,用O作代码,乙代表所有的折笔画;女、己、刀、又等部件排在L上,用L作代码;厶、力、凵、纟、弓等部件排在L上,用L作代码;个别组字频率不高的部件也被排列到键上,它们并不一定按起笔归类,而是按同源和近形归类到组字频率高的基本部件中,如氵含水、氺、小含、钅含金、止含*、刂含リ、艹含廾、心含、含竹等部件;接着编码,本身就是一个基本部件的汉字的编码规则是:基本部件的代码+首笔画代码+次笔画代码+末笔画代码;四个及超过四个基本部件组成的汉字的编码规则是取第1、第2、第3及最末一个基本部件的代码作为该汉字的编码;二个或三个基本部件组成的汉字按书...

【技术特征摘要】
1、一种26键计算机汉字输入法,在将汉字各种笔画按国家语委的规定归类为横、竖、撇、点、折后,其特征是精选了100来个组字频率高的汉字部件,作为基本部件,将它们按起笔归类到横、竖、撇、点、折五个区中;再根据每个区中基本部件的组字频率的高低来决定每个区包含的键位多少,经测算,起笔为横、点、竖的基本部件各得六个键位,起笔为撇的汉字频率次之,分得五个键位,折起笔的基本部件频率最低,仅安排三个键位;按点、横、竖、撇、折的次序分区从左到右依次以每两列为界排列;点区中的丶、亠、言、讠、广、文、方等部件排在Q键上,用Q作代码;立、门、疒、丷、id=icf0001 file=A2006101469510002C1.gif wi=4 he=3 top= 94 left = 152 img-content=drawing img-format=tif orientation=portrait inline=no/>冫等部件排在A键上,用A作代码;氵、水、id=icf0002 file=A2006101469510002C2.gif wi=4 he=4 top= 102 left = 110 img-content=drawing img-format=tif orientation=portrait inline=no/>等排在Z键上,用Z作代码;火和灬等部件排在W上,用W作代码;忄、心、id=icf0003 file=A2006101469510002C3.gif wi=6 he=7 top= 109 left = 134 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在S上,用S作代码;冖、宀、辶、礻、衤等部件排在X上,用X作代码;王、一、雨、id=icf0004 file=A2006101469510002C4.gif wi=5 he=4 top= 127 left = 62 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在E上,用E作代码;土、二、干、十等部件排在D上,用D作代码;厂、三、大、车、石、丆、id=icf0005 file=A2006101469510002C5.gif wi=6 he=3 top= 136 left = 148 img-content=drawing img-format=tif orientation=portrait inline=no/>id=icf0006 file=A2006101469510002C6.gif wi=5 he=4 top= 135 left = 158 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在C上,用C作代码;扌、寸、豕等部件排在R上,用R作代码;木、西等部件排在放F上,用F作代码;工、戈、七、艹、廾等部件排在V上,用V作代码;止、id=icf0007 file=A2006101469510002C7.gif wi=6 he=4 top= 161 left = 102 img-content=drawing img-format=tif orientation=portrait inline=no/>虫、丨等部件排在T上,用T作代码;日、甲、刂、id=icf0008 file=A2006101469510002C8.gif wi=3 he=5 top= 168 left = 77 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在G上,用G作代码;田、山、id=icf0009 file=A2006101469510002C9.gif wi=5 he=4 top= 177 left = 23 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在G上,用G作代码;目、囗、小、id=icf0010 file=A2006101469510002C10.gif wi=3 he=2 top= 178 left = 128 img-content=drawing img-format=tif orientation=portrait inline=no/>等部件排在Y上,用Y作代码;口等部件排在H上,用H作代码;贝、冂、四、罒、皿等部件排在N上,用N作代码;禾、竹、id=icf0011 file=A2006101469510002C11.gif wi=9 he=8 top= 192 left = 116 img-content=drawing img-format=tif orientation=portrait inline=no/>攵、夂、id=icf0012 file=A2006101469510002C12.gif wi=6 he=4 top= 1...

【专利技术属性】
技术研发人员:王治阳
申请(专利权)人:王治阳
类型:发明
国别省市:33[中国|浙江]

网友询问留言 已有1条评论
  • 来自[未知地区] 2014年12月04日 19:06
    输入法是指为将各种符号输入计算机或其他设备如手机而采用的编码方法同时是一种拥有无限墨水的书写工具不同语言国家或地区有多种不同的输入法多数的输入法软件是为汉语韩语和日语而设计是因为键盘原在打字机时代为英文字母而设计而中文日文等文字却无法直接输入所以必需集中输入法编码来输入相应的文字在中国为了将汉字输入计算机或手机等电子设备则需要中文输入法汉字输入的编码方法基本上都是采用将音形义与特定的键相联系再根据不同汉字进行组合来完成汉字的输入的中文输入法编码可分为几类音码形码音形码无理码等广泛使用中文输入法有拼音输入法全拼和双拼数字输入法惠邦五行码[1]五笔字型输入法二笔输入法郑码输入法仓颉输入法等流行的输入法软件有搜狗拼音输入法百度输入法讯飞输入法触宝输入法QQ拼音输入法谷歌拼音输入法极点中文输入法等
    0
1