一种学生通用汉字输入法,它采用简单规范的拆字规则把汉字拆分成若干基本部件,而这些基本部件绝大部分都是常用现成的完整汉字和一些通用的偏旁部首,然后用该汉字与组成该汉字的基本部件的拼音首字母编码。本发明专利技术输入法码表已收录7000通用汉字,近200000词条,把多数常用字设为一、二、三级简码,设一级简码26个,三级以下简码单字近4000个,词条4000多条,重码单字100多,词条在200以下,与现有技术相比,具有规则简单,重码数量极少等特点,总数在200以下,且多为生僻字,对日常文字输入基本没有影响,拆分简易而规范,保证了大部分独体字能够作为构字部件,也避免了把汉字拆得非常抽象,甚至拆分成一些纯粹的符号的现象。
【技术实现步骤摘要】
本专利技术涉及计算机汉字输入法,特别涉及一种采用计算机键盘输入汉字拼音首 字母和构成该汉字的基本部件拼音字母作为该汉字输入编码的学生通用汉字输入法。
技术介绍
目前使用的计算机键盘汉字输入法有形码、音码、形音码等。其中拼音码,易 学易上手,但不懂拼音或拼音不准的话,则无法掌握,而且重码特别多;形码输入速度 快,但规则多,字根多,记忆量大,难学易忘,而且其编码方案不太符合汉字本身的音 形特征,对汉字文化的发展存在不利影响。音形码应该是汉字编码的发展方向。
技术实现思路
本专利技术的目的是克服现有技术的上述不足,而提供一种学生通用汉字输入法, 它采用简单规范的拆字规则把汉字拆分成若干基本部件,而这些基本部件绝大部分都是 常用现成的完整汉字和一些通用的偏旁部首,然后用该汉字与组成该汉字的基本部件的 拼音首字母编码,易学易记,操作方便。本专利技术的技术方案是一种学生通用汉字输入法,它采用简单规范的拆字规则 把汉字拆分成若干基本部件,而这些基本部件绝大部分都是常用现成的完整汉字和一些 通用的偏旁部首,然后用该汉字与组成该汉字的基本部件的拼音首字母编码,在键盘沈 个键的键位上设有五个笔划,六个形状,两个高频部首,四个生僻字,19个变形部首, 39个通用部首为规定部件,直接按其读音输入,“V”键设置为功能键,在编码后加“V”隔离重码;1、单字输入采用汉字本身及该汉字组成的基本部件的拼音首字母编码,单字 标准码长为四码,首码为汉字本身读音首字母,第二、第三、第四码分别按顺序取该汉 字组成的第一、第二、最末基本部件的拼音首字母,不足四码取该汉字末笔为尾码;2、词组输入四字及四字以下短词的词组码长为5码,二字组以第一、二码 为第一字前二码,第三、四、五码为第二字前三码;三字组以第一、二码为第一字前二 码,第三码为第二字首码,、第四、五码为第三字前二码;四字组以第一、二码为第一 字前二码,第三、四、五码分别为第二、三、四字首码;五字及五字以上长词的词组码 长为6码第一、二码为第一字前二码,第三、四、五、六码分别为第二、三、四、末 字首码;本专利技术进一步的技术方案是汉字的拆分原则有少、小、易严,拆分规则为重 笔不拆、交笔不拆、整体结构不拆、按汉字空间结构拆分、按汉字笔顺拆分、规定的非 成字部件不能拆分,本专利技术再进一步的技术方案是汉字的拆分方法采用步进拆分,对一个字进行 多次拆分,直到拆出所需的基本部件;1)、初拆根据汉字的形态结构,按照以上原则和规则,把一个字拆成两个以 上的部件;2)、再拆如果拆出的部件还可再拆,则需再次拆分,直到全部拆出基本部 件;3)、按笔画顺序提取第一、二和最后一个基本部件。本专利技术由于采用如上设计,本输入法码表已收录7000通用汉字,近200000词 条,把多数常用字设为一、二、三级简码,设一级简码沈个,三级以下简码单字近4000 个,词条4000多条,重码单字100多,词条在200以下,与现有技术相比,具有规则简 单,重码数量极少等特点,总数在200以下,且多为生僻字,对日常文字输入基本没有 影响,拆分简易而规范,保证了大部分独体字能够作为构字部件,也避免了把汉字拆得 非常抽象,甚至拆分成一些纯粹的符号的现象。以下结合附图和实施例对本专利技术的详细内容作进一步描述。附图说明图1为本专利技术计算机键盘的键位示意图。具体实施方式图1中描述了键盘键位上的规定部件设有五个笔划,六个形状,两个高频部 首,四个生僻字,19个变形部首,39个通用部首规定部件的分布键位,直接按其读音输 入;1、单字输入;采用汉字本身及该汉字组成的基本部件的拼音首字母编码,单字 标准码长为四码1)、首码为汉字本身读音首字母,如“特”拼音为“te”,首字母为“t”,首 码为“t”,若为多音字,“乐”读音有“le”、“yue”,其编码码分别用“1”、“y”作首码编码,即多音字有多个编码;2)、第二、第三、第四码分别按顺序取组成该汉字的第一、第二、最末基本部 件的拼音首字母,如“特”字的基本部件为” 4 ” “土” “寸”,二、三、四码分别为 各部件读音首字母“n” “t” “C”,全码为“tatc”。基本部件的读音不确定的按规定读音编码,如“率”字是一个基本部件,由于该字是一个多音字,规定统一按“W” 音取首字母“1”编码·’编码实例我=我(W)+ J (a)+—(i)+、(ο) =waio(注此为全码,简码为 w,以下略)方=方(f)+、(ο)+万(W)+J (a) = fowa借=借(j)+ 4 (r) + 昔(χ) + — (i) = jrxi翻=翻(f)+番(f)+ 习(χ) + 习(χ) = ffxx3)、不足四码取该汉字末笔为尾码;如“字”只有两个部件“ (宝盖头)” 和“子”,编码只有三码“zbz”,加上末笔“一”编码“i”,组成全码为“zbzi” ;2、词组输入编码分短词(四字及四字以下)和长词(五字及五字以上),短 词码长为5码,长词码长为6码1)、二字组第一、二码为第一字前二码,第三、四、五码为第二字前三码;编码实例考试=考(k) +十(S) +试(S) + i (y) +工(g) = kssyg2)、三字组第一、二码为第一字前二码,第三码为第二字首码,、第四、五 码为第三字前二码;编码实例实验室=实(S)+&(b)+验(y)+室(S)+& (b) = sbysb3)、四字组第一、二码为第一字前二码,第三、四、五码分别为第二、三、 四字首码;编码实例市场经济=市(S) +丄(W) +场(C) +经(j)+济(j) = SWCjj4)、长词组第一、二码为第一字前二码,第三、四、五、六码分别为第二、 三、四、末字首码。编码实例多媒体电脑=多(d) +夕(χ) +媒(m) +体(t) +电(d) +脑(n) = dxmtdn中国人民解放军=中(ζ)+[ (e)+ 国(g)+人(r)+ 民(m)+军(j) = zegrmj3、汉字的拆分原则1)、少,即拆分结果无论是笔画还是部件,总数要尽量最少,如“毅”先取了 “立”作部件,则留下了很多单笔画,所以应分为“ι” “、z” “豕” “殳”;2)、小,如果有多种拆分方法,且数量一样,则取第一个部件较小的方法, 如“湘”须分为“? ” “相”,不能分成“沐” “目”,“舌”拆为“J ” “古” 而不是“千” “ 口”,这样做可以使很多独体字不被拆分,如“主”字按规则拆分为“、” “王”,根据其拆分结果中有单笔画“、”,确定“主”字为独体字,而不须硬 性规定,而如果按“1” “土”拆分,然后再规定其为独体字,则很难说得通;3)、易,拆分要尽量简易,如果某种拆分方法比较通俗易懂,可通融处理,如 “元”应拆为“一” “兀”,但“兀”字为生僻字,拆为“二” “儿”更容易让人接受,因此按“二” “儿”拆分;4)、严,严格按规定的方法、规定的部件拆分,不能任意乱拆;4、汉字的拆分规则1)、重笔不拆,即同一单笔画不能拆到两个部件中,如“串”不能拆成 “中,, ‘‘中,,.2)、交笔不拆,即相交的两笔画不能分到两个部件中,如“束”不能拆成 “木” “口” ;3)、整体结构不拆,紧密连接的笔画不能乱拆,因为它们往往形成了一个整体 结构,拆分不但破坏了汉字的整体性,而且容易产生错误拆分,具体要求本文档来自技高网...
【技术保护点】
一种学生通用汉字输入法,其特征是它采用简单规范的拆字规则把汉字拆分成若干基本部件,而这些基本部件绝大部分都是常用现成的完整汉字和一些通用的偏旁部首,然后用该汉字与组成该汉字的基本部件的拼音首字母编码,在键盘26个键的键位上设有五个笔划,六个形状,两个高频部首,四个生僻字,19个变形部首,39个通用部首为规定部件,直接按其读音输入,“V”键设置为功能键,在编码后加“V”隔离重码;一、单字输入:采用汉字本身及该汉字组成的基本部件的拼音首字母编码,单字标准码长为四码,首码为汉字本身读音首字母,第二、第三、第四码分别按顺序取该汉字组成的第一、第二和最末基本部件的拼音首字母,不足四码取该汉字末笔为尾码;二、词组输入:一)、四字及四字以下短词的词组码长为5码,二字组以第一、二码为第一字前二码,第三、四、五码为第二字前三码;三字组以第一、二码为第一字前二码,第三码为第二字首码,、第四、五码为第三字前二码;四字组以第一、二码为第一字前二码,第三、四、五码分别为第二、三、四字首码;二)、五字及五字以上长词的词组码长为6码:第一、二码为第一字前二码,第三、四、五、六码分别为第二、三、四、末字首码。
【技术特征摘要】
【专利技术属性】
技术研发人员:郑满平,
申请(专利权)人:郑满平,
类型:发明
国别省市:43[中国|湖南]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。