本发明专利技术公开了汉字角码和适用于所有编码的等级三页结构。从“编码是人-机对话的桥梁”出发,直接采用众所熟知的四角号码为基础编码,角码克服了形码需学习的困难,也实现了部首检字的数字化。等级三页结构为汉字建构了一个理论字容量至少330万,各种字类定位清楚合理的架构,为解决汉字的规范统一和改革发展的矛盾,以及交换码和机内码的统一创造了条件。角码允许中、西文同屏操作,毋须转换;标点符号、半/全角自动转换,实现了双手看打、双手盲打、单手看打、单手盲打四种键字法。(*该技术在2020年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术是关于汉字编码及其数字键输入的方法,具体地说,就是一种用十进制数字编制的、并具有新框架结构、编排形式的以形码为主的汉字编码,属于汉字信息处理中的键输入领域。目前已研制成的几百种汉字编码和已商业应用的十多种汉字键盘输入法,不管是音码、形码和音形(或形音)混合编码,各有许多优点,但都存在一些共同的缺点,就是1、好学的一般都不好用,好用的一般都不好学。音码输入方法,对于说普通话的人,确实很容易学会,但有严重的重码问题,同音字可能有几十个,从大量同音字中挑选所需字,既增加击键次数,又减低键字速度;此外,对于发音不准甚至不知读音的字,就无法采用音码输入。所以音码是好学不好用。五笔字型和表形码等一类以形编码的输入方法,优点是重码少,大多不需要选字,输入速度比较快,但却有许多规则需要记忆,比较难学。所以,这样的输入方法是好用不好学。仅用数字键输入汉字早就有电报码和区位码了,而且二者还都是国家标准,专业输入速度很快。但是,操作使用的前提是,必须记忆大量毫无规律的数字,对大多数普通电脑使用者来说是最不好学、不好用的交换码。2、同(重)码字页多,编排无规律,查字费时;另外,不能循环翻页。3、经常遇到中、西文混杂的文件,需反复在文种和标点符号间转换,增加了操作转换的无效时间,使用不够方便,还减慢了总键字速度。4、常用字、推荐字、异体字等不宜区分,不利于汉字的规范统一。5、随着社会发展,新增加的字、词难以编排到已有的汉字编码中。6、同一种汉字编码,不宜同时适用于普通用户的看打和专业用户的盲打。7、无法用于单手快速输入。一个好的汉字输入法,应该是容易编排,容易学习,便于记忆,击键次数少,输入速度快,利用的键盘符号少,并且适合讲各种方言的人学习使用,也适合不同字型的汉字通用(例如简体、繁体、日文漢字、韩文漢字等),且能分级推广常用字,增加新字、词,以利文字的规范统一和改革发展。本专利技术的目的就是克服现有汉字键盘输入法的上述缺点,创建一种更方便、符合易学易记;击键次数少,输入速度快,利用的键盘符号少,适合不同发音和不同字型的使用者、按不同方式共同使用的汉字编码和输入法。本专利技术是从编码的本质,即“编码是人-机对话的桥梁”这一根基出发,找出一种已广为人们接受、习惯、使用,无须学习的方法,首先实现与人脑接轨;然后以科学方法发挥计算机的潜能,吸纳并综合其它汉字编码的优点,实现与电脑的接轨,以实现本专利技术的目的。中国最早的汉字编码是以数字编制的电报码,作为国家标准的汉字内码-区位码也是以数字编制的。在中国专利技术专利申请91109421.0中公开的“汉字四角编码法及其键盘”是符合人-机对话的桥梁这一方向的。本专利技术是这样实现的,以十进制数字对汉字编码,其特征为,采用以汉字的四角号码作为基础码制作的角码和以等级三页规则进行翻页、编排的多用查字、改字结构,并用新定义的通用数字键盘输入汉字。角码由以下各种不同类型的码构成1、角码的基础码四角号码是在我国久为人知并广为流行的一种查字方法,为大众所熟悉和使用,它只用四句话28个字的简单易记规则,即“横一垂二三点捺,叉四插五方框六,七角八八九是小,点下有横变零头。”就可以把所有汉字的四个角上的字特征用四位十进制数表示,这是角码的基础码。2、角码的附号码由于基础码的重码率比较高,为了区别四角同码字,再取汉字靠近右下角上方一个笔形作‘附号’,若这一笔形已被右上角用过,则作0。附号加在基础码的最低位,即第五位。这是角码的附号码。3、角码的全附码由于基础码或附号码还有重码,为了区别同码字,可在基础码或附号码末位后加上一个用二位小数(从.00-.99)表示的去重码号。如果没有同码字,则用‘.00’表示,与有同码字中的第一个字的去重码号相同。例如,将‘律’字的全附码定为25207.00。角码的全附码为四或五位整数加上二位小数构成的无同位码,属非等长码。4、角码的简码对于常用字来说,用汉字的一角(左上角)、二角(左、右上角)、三角(左、右上角和左下角)编码更合理方便,这就是角码的简码,分别称为一级简码、二级简码、三级简码。一级简码是最高级别的简码。使用频度和潜在使用频度越高,汉字简码的级别也越高。缩编后的简码仅剩下该字基础码的第一位,第一、二位,第一、二、三位。即只用一个角、二个角、三个角的角形表征的实用角码。5、角码的等级码基础码、附号码、简码统称等级码,即四级码,五级码,一、二、三级码。等级码用十进制正整数表示。6、角码的全简码简码加上由汉字在等级三页上的页号和位号构成的二位小数的页位号,就成为该字的全简码。全简码是该汉字唯一的码,没有重码。全简码有一-三位整数和二位小数,也是非等长码。7、角码的全码全附码和全简码统称全码,全码既可作交换码使用,也可代替区位码作机内码使用。8、角码的变位码将基础码的数位调换后所形成的四位码称为变位码。角码是一种形码,所以可采用汉字已流行的四角号码的索引进行编码查找。其实,四角号码还是一种与部首检索有内在联系的码。例如,凡是以“艹”为部首的字,其四角号码必定为“44XX”(X可为任何十进制数)。同理,以“扌”为左偏旁的字,其四角号码大多为“5X0X”,如果把“5X0X”进行变位处理,即将其第二位和第三位对调,就变位为“50XX”。“50XX”就是“5X0X”的变位码。这样一来,经二、三位变位后重新排序的变位码,就很容易查到以“扌”为左偏旁的字,这就形成了能与汉字的部首检索相联系的检字方法。变位码除可用于部首检索外,还同样可用来查某些字元,例如,“不”作为字元,经常出现在汉字的右半边,如“怀(9109)”、“杯(4199)”、“坏(4119)”、“钚(8179)”,这些字的基础码都有共同的特征号(X1X9),如取它们的变位码,将第二、第四位变为第一、第二位,就成为(19XX),则所有右半部带“不”字元的字将以变位码的形式集中排序在一起。通过对变位码(19XX)的检索,就很容易查到带“不”字元的字。角码的变位码利用了电脑技术善于作数字处理的特点,不但使四角号码的排序检索更方便,而且实际上也使部首检索实现了数字化,从而实现了汉字检索不再以西文为中间环节而直接与电脑的接轨。等级三页框架结构采用简码后,虽可大大减少击键次数,却大大增加了角码的重码率,为此设计了角码的等级三页编排结构。1、汉字具有悠久的历史,丰富多彩的文化传统,深厚牢固的人文凝聚力,积极自发的吸纳世界其它优秀文化的发展动力,因此,也在历史发展的长河中积累了巨大的字词量,这本来是人类的一笔巨大共同财富。在人类进入信息社会的前夕,汉字所遇到的信息处理方面的困难只要解决了二个关键问题就可以迎刃而解。第一个关键是找到一种好的汉字编码,与人脑接轨,也就是与它的历史传统接轨,与它的文化积淀接轨,与它在当前世界地位的接轨。第二个关键是为汉字找到一个好的框架结构,这个框架结构恰似一座雄伟无比的文化大厦,它为汉字“论功行赏”,确切分配“居室”;它有科学合理的查询方法,使人一目了然,知道汉字的“府第”;它有便捷快速的访问通道,迎接“客人”的到来。这座文化大厦,能保持“尊卑”的需要,各得其所,维持规范秩序,又能适应变化发展,有序“调房”,并有足够的“空房”,安排“新生儿”和“移民”。等级三页框架结构就是为汉字编码设计的一种架构。本文档来自技高网...
【技术保护点】
一种汉字编码,其特征为,以角码对汉字编码,并通过通用键盘的数字键输入汉字。角码包括:(1)基础码:即直接采用四角号码而形成的四位十进制阿拉伯数字码;(2)附号码:为了区别四角同码字,再取汉字靠近右下角上方一个笔形作‘附号’,若这一笔 形已被右上角用过,则作0。附号加在基础码的最低位,即第五位,该五位码即为附号码;(3)全附码:为了区别同码字,可在基础码或附号码末位后面,加上一个用二位小数(从.00-.99)表示的去重码号。如果没有同码字,则用‘.00’表示,与有同码 字中的第一个字的去重码号相同,加上去重码号的基础码或附号码称全附码。(4)简码:简化、缩编基础码后产生的码,即以基础码的第一位,第一、二位,第一、二、三位数字构成的码,分别称为一级简码、二级简码、三级简码;(5)等级码:基础码、附号 码、简码统称等级码,即四级码,五级码,一、二、三级码;(6)全简码:简码加上由汉字在等级三页上的页号和位号构成的二位小数的页位号,就成为该字的全简码;(7)全码:全附码和全简码统称全码,全码既可作交换码使用,也可代替区位码作机内码使 用;(8)变位码:将基础码的数位调换后所形成的四位码称为变位码。...
【技术特征摘要】
【专利技术属性】
技术研发人员:於岳亮,
申请(专利权)人:於岳亮,
类型:发明
国别省市:31[中国|上海]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。