汉字的首音码编码制造技术

技术编号:2892973 阅读:229 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种新的汉字单形编码。该码由一键音码与三键形码组成。  四键码分别以语音,偏旁部首,及去偏旁部首后所余部分首尾字形汉语拼音的第一个字母编码。因此,此码具有易学易记,简便高效,实用性强的特点。(*该技术在2011年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种新型的汉字编码。用此编码编制的软件可以方便地输入国际二级字库的全部汉字,且能适合各层次人员的使用要求。现有的各种汉字编码,一种是形码,要对计算机键盘上的各键进行定义,使其分别代表一些特殊的汉字字形,然后再以这些汉字字形为码元对汉字编码。用这种编码,必须对每个键所代表的字元加以记忆,方能操作。因此,学习难度较大。另一类音码,如拼音码,以汉语拼音为码元,与英文键盘一一对应,输入方便。但重码率太高,效率太低。再是对拼音要求严格,方言区人们使用有一定难度。本专利技术的任务是要提供一种以拼音为基础,重码率又很低,兼有上述两种编码之长的编码,以实现方便快速的输入汉字。本专利技术的任务是以如下方式完成的每个汉字取四键码。第一键音码,取汉字本身字音的第一个字母。其余三键为形码,一键是汉字偏旁部首名称的第一个字母;另外两键是将汉字去偏旁部首后所余下的字形分为首尾两部份,根据这两部份的字形或笔划的名称,取其第一个字母编码。例如“按”字,第一键音码,即为它的字音的第一个字母“a”,三键形码,按笔划顺序,首先是该字的偏旁部首“提手”的第一个字母“t”。剩下的首尾码,以去偏旁“提手”后余下的“安”字取码,首码是“宝盖”的第一个字母“b”,尾码是“女”字的第一个字母“n”。全部四码为“atbn”。偏旁部首的名称,基本上按习惯名称,个别进行了变通改动“氵”按“点”字取码为“d”。“虫”字为左偏旁时按“中”字取码。“竹字头”取“个”字编码。“口”字(内有笔划)称其为“方框”。“糸”旁称其为“乱绞丝”。对于汉字中无偏旁的独体字,都以“o”为偏旁。取码时,对汉字字形的分拆及缺码的补充,具体规定如下一.编码法则汉字依其字形结构不同,可分为独体字与合体字两类,而合体字有两个独体字,三个独体字及多个独体字的区别。对于不同形式的字本法有不同的处理。1.凡是由三个独体字组成的字(又称为三分字),直接按笔顺次序先后取每个独体字拼音的第一个字母,组成三键形码。而三个以上独体字组成的字,只要取其第一,第二和最末一个独体字的编码即可。如“部”字码为“blkc”。2.凡是由两个独体字组成的字(又称两分字),三键形码的第一,第二键由两个独体字的拼音第一字母编码,所缺的一键编码,视独体字构成的成份分为三种情况补上一码。1).后一个独体字是偏旁部首用字的,取该独体字自身的偏旁部首名称第一字母补码。如“独”字码为“dqcz”。2).后一个独体字是非偏旁部首汉字,取最后一笔划的笔划码补码。如“的”字码为“dbsd”。3).一个笔划与一个偏旁部首用字组成的字,第四键以“o”键补码。如“礼”字码为“lswo”。3.一个偏旁部首字与一堆笔划(非完整汉字)组成的字,也叫两分字。这些字按笔划顺序取偏旁部首字的拼音第一个字母,及一堆笔划的首尾两笔划的笔划码组成三键形码。如“杨”字码为“ymzp”。4.凡独体字,其偏旁部首码皆取为“o”键,其余两码为该字的首尾笔划码。如其中可拆解出部首字(或独体字)的,可依笔顺取其部首字编码代替首笔划码或尾笔划码。如“东”字码为“dohx”。二.为保证编码的唯一性,对编码的取码标准做如下规定1.每字的偏旁部首必须从该字的首部或尾部截取,不得在其中间取偏旁部首。如在同一部位有两个部首可取,以笔划多的为准。凡类似“品”字形结构的字,皆以相对独立的部分为偏旁,不管其是否是偏旁部首字。如“龋”字码为“qcud”。如“整”字码为“zsfz”。2.将汉字分解成几个独体字时,要依据其自然的形状,不可将笔划割断硬性拆解。偏旁部首用字,作为一个单独字时,可以分拆。但在其它合体字中,则被视为一个整体,不可分拆。如“户”字是偏旁部首字,本身取码为“hdsz”,而“护”字码为“hths”。3.取首尾两码时,先尽首码用笔划,但是,可以拆成三分字的不要按两分处理,即取首码时要给尾码至少留一笔。在同时有几种码可取时,按独体字→部首字→笔划的顺序确定,使用笔划尽多不尽少如“拎”字码是“ltjd”,而不是“ltld”,也不是“ltrd”。4.笔划码共7个,为“点”,“横”,“竖”,“撇”,“捺”,“折”,“弯”。分别以其拼音的第一个字母取码。凡笔划走向最末向左折的为“折”。凡笔划最末向右弯的都为“弯”。每字除四键码外,根据其使用频率按三个级别加权。如“人”是高频字,为第一级。“哈”为次高频字,为第二级。“禺”为非常用字,为第三级。此“权”不用输入,程序检索时按“权”分三级检索。三.几个特殊键的说明使用拼音首字母编码,26个英文字母键只用到23个。“i”,“u”,“v”三键用不上。这三键作如下安排1.为降低重码,将“u”定为汉语拼音中的“yu”,凡拼音是“yu”开头的字,皆以“u”为音码。2.“v”定为缺码代替键。四键中任一键不能正确编码,都可用“v”代替,然后通过重码选择输入。3.“i”为重码选择键。遇到重码字时,屏幕上自动显示第一个字若该字并非所需,按“i”键则所有重码字会依次在屏幕上替换显示,任凭选择。此码一级字库重码率82个,占总数的2.4%。主要优点1.编码与英文键盘对应好,不用对键盘特殊记忆。2.对拼音要求极低,不用区分翘舌非翘舌音,不用考虑韵母。3.易学易记。输入一键音码,可检索高频字200多个。再输入一键偏旁码,即可输入3000多个常用字。一般人十分钟就可学会。普通文件可用两键输入。四键全码输入时,可以盲打,只需两小时学会。使用此码,可同时满足一般性操作人员和专业操作人员的不同要求。权利要求1.由字音、偏旁部首名称,及去偏旁部首后,剩余部分首尾字形名称的拼音第一个字母为码元,所组成的汉字四键等长码。2.根据权利要求1所规定,编码特征是第一键为汉字拼音的第一个字母。3.根据权利要求1所规定,编码特征是后三键中有一键,是取汉字偏旁部首习惯名称的拼音第一个字母编码。4.根据权利要求1,2,3所规定,编码特征是后三键中其余两键,是根据汉字去偏旁部首后所余部分的首尾字形,独体字按字音拼音第一个字母,偏旁部首用字按习惯名称的拼音第一个字母,单独笔划按笔划名称拼音的第一个字母编码。全文摘要本专利技术提供了一种新的汉字单形编码。该码由一键音码与三键形码组成。四键码分别以语音,偏旁部首,及去偏旁部首后所余部分首尾字形汉语拼音的第一个字母编码。因此,此码具有易学易记,简便高效,实用性强的特点。文档编号G06F3/023GK1056759SQ91107428公开日1991年12月4日 申请日期1991年6月21日 优先权日1991年6月21日专利技术者李光伟 申请人:上海毛巾十二厂 本文档来自技高网...

【技术保护点】
由字音、偏旁部首名称,及去偏旁部首后,剩余部分首尾字形名称的拼音第一个字母为码元,所组成的汉字四键等长码。

【技术特征摘要】

【专利技术属性】
技术研发人员:李光伟
申请(专利权)人:上海毛巾十二厂
类型:发明
国别省市:31[中国|上海]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1